Nhân văn số thức: Một lát cắt của xã hội toàn cầu

Nhân văn số thức là một lĩnh vực giao thoa giữa ngành khoa học máy tính và các ngành khoa học xã hội và nhân văn. Mới được hình thành cách đây hơn một thập kỉ và là một trong những lĩnh vực khoa học gây tranh cãi nhất nhưng cũng phát triển năng động nhất thế giới hiện nay. Tia Sáng đã có buổi trò chuyện với GS. Paul Arthur, GS đầu tiên của Úc trong lĩnh vực này, một trong những diễn giả chính trong buổi hội thảo về nhân văn số thức được tổ chức lần đầu tiên ở Việt Nam vào đầu năm 2017 về những cơ hội và tiềm năng của lĩnh vực này và những rủi ro nếu Việt Nam không đầu tư vào nó.


Dự án “Cỗ máy thời gian Venice” thu thập và kết nối tất cả các thông tin, tư liệu, di sản văn hóa về thành phố này trong một kho dữ liệu mở trên mạng. Dự án này về sau đã được mở rộng cho toàn bộ châu Âu. 

Góc nhìn mới, phương thức nghiên cứu mới

Công nghệ đã tạo ra một lĩnh vực nghiên cứu mới trong khoa học xã hội và nhân văn, gọi là nhân văn số thức như thế nào, thưa ông?

Tôi nghĩ rằng có một lý do khiến công nghệ chuyển từ vai trò hỗ trợ sang trở nên thiết yếu trong nghiên cứu ngày nay bởi vì nó nằm trong tầm tay của tất cả mọi người. Tất cả chúng ta đều sử dụng công nghệ thông qua một loạt các thiết bị điện tử xung quanh mình. Trong một thế giới đề cao dữ liệu, rất khó để có thể lẩn tránh tác động của công nghệ lên xã hội. Và trong các ngành nhân văn, những công nghệ này cũng đồng thời là công cụ nghiên cứu. Ví dụ, điện thoại thông minh đã kiến tạo ra những phương thức truyền thông mới, hình thành những cộng đồng kiểu mới, lối sống mới. Và chúng tôi cũng dùng nó để nghiên cứu, hay nói đúng hơn, để thực hiện các cách thức nghiên cứu mới. Chẳng hạn như, chúng tôi thu thập tất cả những bức ảnh về thế giới được chụp bằng điện thoại thông minh (điều này thật tuyệt vời và không lâu trước đây chắc chẳng ai nghĩ đến) và cả các metadata (dữ liệu thêm): nơi các bức ảnh được chụp, góc chụp, ở nước nào, vị trí địa lý để hiểu thế giới qua ống kính của chiếc điện thoại. Vậy là, chỉ với công cụ giao tiếp đơn giản mà chúng ta sử dụng hằng ngày đã thay đổi toàn bộ cách thực hiện nghiên cứu của những nhà khoa học trong lĩnh vực KHXH&NV.

Ông có thể cho tôi vài ví dụ công nghệ đã biến đổi ngành KHXH&NV như thế nào không?

Một điều rất quan trọng về nhân văn số thức đó là chúng tôi không cho rằng máy tính có thể đưa ra những hiểu biết mới về các chủ đề nghiên cứu của mình. Nó cũng không cho chúng tôi câu trả lời, mà chỉ mở ra những cơ hội mới để nhìn thế giới theo một cách khác. Một ví dụ kinh điển về điều này đó là ý tưởng “đọc từ xa” chỉ có thể thực hiện được nhờ sự trợ giúp của máy tính trước một dữ liệu vô cùng lớn và đa dạng. Nếu bạn có thể nghiên cứu mà không cần sự trợ giúp của máy tính, rất có thể nó không phải là nhân văn số thức, mà nó là các ngành khoa học xã hội và nhân văn truyền thống.

Một ví dụ cho thấy công nghệ đã làm biến đổi ngành KHXH&NV là các nghiên cứu về thành phố thông minh, đã giúp cho việc đưa ra các quyết định tốt hơn về việc quy hoạch và vận hành của một thành phố. Chẳng hạn như dự án “Cỗ máy thời gian Venice”, một dự án số hóa ghi lại lịch sử thành phố Venice đã được xây dựng, phát triển như thế nào và cho thấy điều gì diễn ra với nó trong những thời điểm nhất định. Trước đây, toàn bộ thông tin về thành phố này, bao gồm từ những di sản về văn hóa, nghệ thuật, khoa học cho đến những dữ liệu thống kê cơ bản như nhân khẩu học, thông tin về quy hoạch qua các năm, các dữ liệu về nhiệt độ, đất đai… bị phân mảnh trong các kho dữ liệu khác nhau nhưng giờ đây được sáp nhập, tìm kiếm và phân tích ở quy mô lớn nhờ vào sự phát triển của các công nghệ số, di động và tính toán.

Tôi vẫn không hiểu tại sao cho đến tận bây giờ, công nghệ mới được ứng dụng trong ngành KHXH&NV?

Một trong những nguyên nhân là dữ liệu của ngành KHXH&NV phức tạp hơn, ít đồng nhất hơn các dữ liệu của khoa học tự nhiên, vốn thường được thu thập qua một dạng thiết bị, phương pháp và thí nghiệm chung và được chuẩn hóa, nếu không thì không thể phân tích được. Chẳng hạn, những bức ảnh về vũ trụ phải được ghi lại dưới một độ phân giải, màu sắc và những yêu cầu kỹ thuật nhất định để bạn có thể giải mã và phân tích nó trên máy tính. Mặt khác, trong khoa học XH&NV, không dễ định nghĩa đâu là dữ liệu. Ngay cả khi đã định nghĩa được thì các dữ liệu cũng không có một cấu trúc nhất định nên để có thể phân tích được bằng máy tính, cần phải mất rất nhiều công sức xử lý.


GS. Paul Arthur là giám đốc Trung tâm các vấn đề toàn cầu, Trưởng khoa Nhân văn số và KHXH&NV ở Đại học Edith Cowan.

Bên cạnh đó, các công cụ và phương pháp để phân tích những dữ liệu của KHXH&NV chưa hề được phát triển cho đến những năm gần đây. Chẳng hạn như với trường hợp của lịch sử truyền miệng (oral history), nghiên cứu các băng ghi âm phát biểu của các yếu nhân trong lịch sử ở các kho dữ liệu quốc gia. Đó là dữ liệu và đều ở dạng số nhưng không có một cấu trúc chung nào cả. Không thể cứ thế mà phân tích ngay được. Hiện nay, người ta đã phát triển một công cụ chú giải tinh vi cho phép bạn đánh dấu những file thu âm hoặc video và thêm thông tin vào đó, nhờ vậy, chúng ta có thể phân tích các dữ liệu này bằng máy tính. Những phần mềm chú giải nói trên thậm chí còn chưa được sử dụng trong các lĩnh vực khoa học tự nhiên trước đó.

Vậy tại sao những công nghệ đó lại không được tạo ra sớm hơn? Tại sao những đột phá trong khoa học và công nghệ từ trước đến nay dường như đều không được ứng dụng để phục vụ trong KHXH&NV? Đó là do văn hóa làm việc trong lĩnh vực KHXH&NV thường mang tính cá nhân thay vì tập thể. Trong khi những nhà khoa học tự nhiên thường làm việc theo nhóm và công nghệ là một phần không thể thiếu trong nghiên cứu của họ thì những nhà KHXH&NV theo truyền thống thường chỉ là những cá nhân làm việc một mình và sản phẩm nghiên cứu chính của họ là sách. Bạn có thể viết sách mà không cần phải thực hiện bất kì thí nghiệm nào. Thử nghĩ về những nhà triết học vĩ đại, họ đâu cần công nghệ? Vì vậy, trong KHXH&NV, rất nhiều người không cảm thấy cần tìm hiểu công nghệ tính toán hay việc hợp tác với người khác có thể mang lại ích gì cho họ.

“Chúng ta thu lại được nhưng cũng đánh mất quá nhiều thứ”

Là một trong những lĩnh vực nghiên cứu năng động nhất, hiện nay nhân văn số thức có gặp phải những thách thức nào không?

Việc có thể thu thập liên tục các thông tin trực tuyến của con người là một cơ hội nhưng đồng thời cũng là một thách thức lớn. Mặc dù có một lượng dữ liệu vô cùng lớn và đa dạng nhưng chúng ta lại chưa kịp hiểu liệu việc thu thập này có ý nghĩa gì đối với nhiệm vụ chính của ngành KHXH&NV, đó là hiểu chúng ta đang sống và hành xử như thế nào trong thế giới này hay không. Đồng thời, chúng ta chưa lường hết các rủi ro vì có quá nhiều thông tin bị công khai trong khi chúng đáng ra phải được giữ bí mật, riêng tư. Có những quan ngại đạo đức đối với những nghiên cứu KHXH&NV về việc chúng ta nên sử dụng những dữ liệu sẵn có ở mức độ nào với sự đồng ý và cho phép của những người tạo ra chúng.

Một thách thức khác đó là duy trì và bảo tồn những nguồn lực và dự án số sau khi đã đầu tư rất nhiều công sức và tiền bạc vào đó hàng chục năm. Nhận được càng nhiều đầu tư, quy mô càng lớn thì dự án càng có nhiều giá trị nhưng đồng thời lại càng khó khăn để tồn tại và phát triển trong tương lai. Chẳng hạn, Austlit, một cơ sở dữ liệu về văn học Úc, một dự án khổng lồ ra đời cách đây 20 năm nhưng liên tục phải đối diện với khó khăn tài chính, những người vận hành nó vẫn phải gọi tài trợ hằng năm. Nếu dự án này đột nhiên đóng cửa, đó là sự lãng phí của 20 năm đầu tư và nghiên cứu. Nếu đem chúng cất vào trong thư viện, lợi ích của một dự án mở cho phép mọi người liên tục đóng góp và sử dụng sẽ biến mất. Đó là một tình huống có thể nhìn thấy trước nhưng không ai chuẩn bị cho nó cả. Một dự án càng thành công thì càng đối mặt với nhiều nguy cơ thất bại và mất mát.

Nhưng sự bền vững của một dự án không chỉ phụ thuộc vào tài trợ mà còn là nguồn lực con người và các cơ quan điều phối để biến đổi những dữ liệu ở định dạng cũ thành các định dạng mới (theo sự biến đổi của công nghệ) để quá trình sử dụng và đóng góp của cộng đồng không bị dừng lại và mất đi. Tôi không rõ liệu trước đây chúng ta đã được cảnh báo về sự mong manh của các dữ liệu số hay chưa, đó là một lượng dữ liệu lớn sẽ mất đi sau một quá trình chuyển đổi định dạng và mặc dù với biết bao nhiêu đổi mới sáng tạo, bao nhiêu thay đổi, với sự phát triển của nhân văn số thức, với sự hỗ trợ của rất nhiều ngành khoa học khác, thật ngạc nhiên là chúng ta không thể ngăn chặn được quá trình đó. Bạn biết đấy, trong cuộc chuyển đổi số, chúng ta thu lại được nhưng cũng đánh mất quá nhiều thứ.

Từ kinh nghiệm và quan sát của ông, lĩnh vực nhân văn số thức đã hình thành từ con số không như thế nào ở các quốc gia?

Đài Loan đã đầu tư rất lớn vào quá trình số hóa các tư liệu di sản văn hóa trong suốt 30-40 năm nay bằng nhiều dự án lớn nhỏ khác nhau và họ dẫn đầu thế giới về công việc này ở nhiều khía cạnh. Điều này tạo ra động lực chính để phát triển ngành nhân văn số thức trong những cơ sở nghiên cứu như Viện Sinica và Đại học Quốc gia Đài Loan, nơi có các trung tâm nghiên cứu hàng đầu thế giới về nhân văn số thức. Đây là một ví dụ cho thấy ngành này có thể được khởi nguồn từ sự đầu tư của chính phủ cho một chương trình lớn vì lợi ích cộng đồng.

Ở Nam Phi hơi khác một chút, từng đến dự nhiều sự kiện phát triển các hiệp hội nhân văn số thức, tôi chứng kiến các dự án số hóa ở nước này từ những ngày đầu tiên. Trong vòng 3 năm, họ có khoảng 20 dự án nhỏ, chủ yếu là do các trường đại học tự bỏ tiền tài trợ và hiện nay đều đã hoàn thiện. Đó là cơ sở để họ nộp đơn xin tài trợ của chính phủ cho một trung tâm liên quan đến số hóa các dữ liệu ngôn ngữ. Từ đó, họ đã có đủ tiền để chạy một dự án lớn trong vòng 10 năm. Đó là kết quả của sự hợp tác giữa nhiều trường đại học và họ chuẩn bị bổ nhiệm giáo sư Nam Phi đầu tiên trong lĩnh vực nhân văn số thức sẽ tham gia vào dự án này.

Ngành nhân văn số thức thường ra đời sau sự thành công của một loạt các dự án số hóa lớn nhỏ. Tôi nghĩ với một quốc gia bắt đầu bước vào lĩnh vực nhân văn số thức, cần đầu tư để có những dự án tiên phong, cần những người truyền bá về tầm quan trọng của nó, cần tài trợ cho các trường đại học, viện nghiên cứu những dự án liên quan đến giảng dạy, chiêu mộ thực tập sinh, chương trình học qua hành của sinh viên, những hoạt động liên quan đến nhân văn số thức có thể trở nên phổ biến trong môi trường học thuật.

Theo ông, chính phủ có vai trò quan trọng như thế nào trong việc phát triển nhân văn số thức ở một quốc gia?

Tôi nghĩ vai trò của chính phủ trong việc phát triển nhân văn số thức ở Việt Nam cũng như ở nhiều quốc gia khác đó là tạo ra một khung chính sách cho phép các dự án KHXH&NV có thể tham dự và nhận tài trợ. Có trường hợp, chính phủ thiết lập các chương trình tài trợ nghiên cứu số, nhưng những tiêu chí chung chung, cuối cùng, chỉ có các nhà khoa học tự nhiên được nhận tài trợ còn những nhà KHXH&VN không thể chen chân vào nữa. Chẳng hạn, 10 năm sau khi thành lập, chương trình E-Research của Úc mới thay đổi tiêu chí tài trợ, tạo điều kiện cấp vốn thêm cho cả các dự án KHXH&NV. Nhờ đó mà nhân văn số thức mới có thể ra đời và phát triển.

Từ những gì ông nói, tôi hiểu rằng chiến lược tài trợ cho những dự án số rất khác so với những dự án nghiên cứu truyền thống, nó cần đầu tư dài hạn và cần sự đánh giá khác bởi vì chúng ta không có một đầu ra cố định nữa, đúng không?

Tôi nghĩ rằng một vài dự án nghiên cứu liên quan đến số hóa vẫn có đầu ra là các bài báo đăng trên các tạp chí quốc tế. Người ta cũng có thể tiếp tục đo lường mức độ thành công của một dự án dựa trên các công bố. Bên cạnh đó, nhiều người cảm thấy họ có thể làm các dự án nhân văn số thức với số vốn nhỏ, thậm chí với những gì sẵn có trên điện thoại của họ và tự làm một mình.

Nhưng tôi nghĩ tiềm năng của nhân văn số thức nằm ở việc triển khai các dự án trên một quy mô lớn, đặc biệt là quy mô quốc gia. Và khi chúng ta bắt đầu mở các dữ liệu công khai cho cộng đồng và cho các nhà khoa học, cũng là lúc nó thay đổi cách họ nghĩ về đối tượng nghiên cứu, bất kể đối tượng đó là gì. Lúc đó, mới hình thành cách thức nghiên cứu mới, tạo ra tri thức và thông tin mới cho xã hội.

Ông có muốn chia sẻ thêm điều gì không?

Ở một khía cạnh nào đó, tôi cho rằng, nhân văn số thức là một lát cắt của xã hội toàn cầu và là kết quả của truyền thông số, của sự kết nối tức thì. Nó là một lĩnh vực nghiên cứu nhưng đồng thời cũng là tấm gương phản chiếu những khuôn mẫu về tương tác xuyên ngôn ngữ và sự xóa bỏ ranh giới giữa các lĩnh vực và các dạng kiến thức khác nhau.

Cảm ơn ông vì cuộc trò chuyện này!

Hảo Linh thực hiện

Không mở cánh cửa cho nhân văn số thức là mất đi cơ hội bảo tồn những di sản văn hóa vô giá đang có nguy cơ biến mất. Các quốc gia đều đang đầu tư mạnh vào việc số hóa di sản để bảo tồn bản sắc văn hóa của họ vì trong tương lai mọi thứ đều tồn tại dưới dạng số hóa, từ danh tính của các cá nhân đến bản sắc văn hóa của một dân tộc. Bản sắc Việt Nam có thể sẽ vĩnh viễn mất đi nếu không tồn tại trong môi trường số. Đó không chỉ là sự mất mát của hiện tại mà là mất mát cho những thế hệ tương lai.

Tác giả