Mọi thứ đều tàn lụi, kể cả thông tin
Mọi thứ đều tàn lụi: con người, máy móc, các nền văn minh. Tưởng rằng chúng ta còn chút niềm an ủi khi tin rằng tất cả những gì giá trị trong suốt chặng đường học hỏi của nhân loại sẽ sống sót. Nhưng rất tiếc, kể cả tri thức cũng có tuổi thọ. Những tài liệu rồi sẽ bị mục ruỗng. Những tác phẩm nghệ thuật sẽ bị thất lạc. Tất cả các thư viện và các bộ sưu tập đều có thể đối mặt với sự lụi tàn nhanh chóng và khó lường.
Hẳn nhiên, chúng ta đang ở thời đại công nghệ nơi biết đâu mình có thể phát minh ra những cách thức để tri thức luôn sẵn có và có thể tiếp cận được mãi mãi. Hiện nay, mật độ lưu trữ dữ liệu vốn đã cao không tưởng. Trong bảo tàng internet không ngừng phình đại, ai cũng có thể lướt qua hàng loạt tấm ảnh từ Kính thiên văn Vũ trụ James Webb cho đến những sơ đồ giải thích triết học của Pythagoras về hệ thống điều chỉnh thang âm cho tới hướng dẫn dạy cách chơi guitar solo nhạc blues trên YouTube. Ta còn muốn gì hơn thế?
Đúng, ta còn muốn nhiều hơn nữa, theo lời của nhiều chuyên gia. Trước hết, những gì chúng ta nghĩ là vĩnh cửu không hề được như vậy. Các hệ thống lưu trữ số chỉ cần ba đến năm năm là lỗi thời, không ai có thể đọc được. Các nhà quản lý thư viện và kho lưu trữ phải chạy đua để sao chép mọi thứ sang những định dạng mới. Nhưng entropy vẫn còn đó, rình rập đâu đây (entropy mô tả mức độ hỗn loạn của thông tin trong một tín hiệu) “Công việc của chúng tôi và nhân sự của chúng tôi vẫn nỗ lực để kéo dài tuổi thọ của thông tin càng xa càng tốt bằng nhiều cách, nhưng thực tế vẫn không thể đảo ngược” Joseph Janes, phó giáo sư tại Khoa Thông tin, Đại học Washington.
Vấn đề còn phức tạp hơn khi giờ đây các nhà lưu trữ mới chỉ vớt vát được một chút trong làn sóng thông tin khổng lồ chưa từng thấy. Trong quá khứ, vật liệu khan hiếm và không gian lưu trữ giới hạn. “Vấn đề của chúng ta bây giờ là ngược lại”, Janes nói. “Người ta ghi lại mọi thứ, mọi lúc”.
Tưởng rằng, điều đó sẽ sửa chữa lỗi lầm của lịch sử. Qua hàng thế kỉ, biết bao con người không có điều kiện văn hóa, giới tính, thuộc tầng lớp kinh tế – xã hội phù hợp để công chúng có thể khám phá, trân trọng và lưu giữ tri thức và công trình của họ. Nhưng quy mô khổng lồ của thế giới số bộc lộ một thách thức khác biệt. Theo một ước tính năm 2022 của một công ty nghiên cứu thị trường IDC, lượng dữ liệu công ty, chính phủ và các cá nhân tạo ra trong vài năm tới sẽ bằng gấp đôi toàn bộ dữ liệu số thu được kể từ thời kì máy tính đến nay.
Mọi khoa trong nhiều trường đại học đang dành nhân lực để tìm phương án tiếp cận tốt hơn nhằm lưu trữ mọi dữ liệu mà họ có thể. Trung tâm Dữ liệu và Dịch vụ cho Ngành nhân văn của Đại học Basel, là một ví dụ, đã phát triển một nền tảng phần mềm có tên gọi Knora để không chỉ lưu trữ nhiều loại dữ liệu từ các nghiên cứu xã hội và nhân văn mà đảm bảo rằng những con người ở tương lai có thể đọc và sử dụng chúng. Tuy nhiên, quá trình này khó mà khả thi.
“Ta cố gắng phỏng đoán và kì vọng vào những điều tốt nhất, nhưng có rất nhiều bộ dữ liệu bị thất lạc vì không ai biết liệu chúng có hữu dụng trong tương lai hay không” – Andrea Ogier, Phó trưởng khoa và Giám đốc Dịch vụ dữ liệu tại Thư viện Đại học của trường Virgina Tech.
Không bao giờ có đủ nhân lực và tiền bạc để có thể làm tất cả những việc cần làm – và các định dạng thông tin liên tục thay đổi và thêm mới. “Làm sao để phân bổ nhiều nguồn lực nhất để bảo tồn mọi thứ? Ngân sách lúc nào cũng chỉ có hạn thôi” Janes nói. “Trong nhiều trường hợp, điều đó có nghĩa là rất nhiều thứ được lưu lại và bảo quản nhưng rồi chỉ nằm đó, không được phân loại và xử lý, tức là về sau không có cách nào tìm được hay tiếp cận được nó”. Trong vài trường hợp, các nhà lưu trữ cuối cùng phải bỏ dở những bộ sưu tập mới.
Bản thân những định dạng dùng để lưu thông tin cũng không tồn tại mãi. NASA đã xếp xó khoảng 170 cuộn dữ liệu về bụi Mặt trăng, thu thập trong thời kì phóng các tàu vũ trụ Apollo cuối cùng khi các nhà nghiên cứu cũng đụng đến đống dữ liệu đó vào giữa những năm 2000, họ không thể bói ra được ai có máy IBM 729 Mark 5 sản xuất vào những năm 1960 để đọc chúng. Nhờ sự giúp đỡ, nhóm này cũng tìm ra một cái còn dùng được ở nhà kho Bảo tàng Máy tính Úc. Nhiều tình nguyện viên giúp tân trang lại chiếc máy này.
Các phần mềm cũng có hạn sử dụng. Ogier nhớ lại mình phải phân tích một file bảng tính Quattro Pro chỉ để nhận ra rằng không có một phần mềm nào trên thị trường hiện nay có thể mở được nó.
Đã có rất nhiều nỗ lực để tạo ra những chương trình vượt thời gian. Một dự án nhận được chờ đón nhiều vào năm 2015 là kho Thư viện Ảnh mở cho Thực thi lệnh ảo (Olive), chạy trên một phần mềm cũ như Chaste 3.1, một chương trình nghiên cứu sinh học và sinh lý học năm 2013 và phiên bản Mac 1990 của trò chơi The Oregon Trail cài trên một loạt các máy ảo. Dự án này vẫn đang hoạt động, Mahadev Satyanarayanan, giáo sư khoa học máy tại Đại học Carnegine Mellon. Nhưng mở rộng kết quả của dự án Olive không đơn giản, ông nói: kể cả phần mềm không ai còn sử dụng thì mình vẫn phải xin giấy phép từ công ty sở hữu nó, và không dễ để nhập dữ liệu mới vào danh mục nghiên cứu của kho lưu trữ này.
Các nỗ lực khác để gia tăng tuổi thọ của tri thức cũng nhận lại những kết quả không thuyết phục. Internet Archive, nơi tạo ra Wayback Machine có một tập hợp lớn các tài nguyên số, bao gồm cả phần mềm, âm nhạc, video; đến hè năm 2022, nó phải đối mặt với một loạt đơn kiện vi phạm bản quyền của rất nhiều công ty xuất bản.
Ở một khía cạnh tươi sáng hơn, Sáng kiến Mã hóa Văn bản đã tạo ra và duy trì được một tiêu chuẩn quốc tế về mã hóa các văn bản cho phép máy tính đọc được kể từ những năm 1990. Một thập kỉ trước, Văn phòng Chính sách Khoa học và Công nghệ Mỹ yêu cầu mọi đơn xin tài trợ nghiên cứu sử dụng tiền của liên bang phải đưa ra kế hoạch quản lý dữ liệu sao cho các nhà nghiên cứu hoặc công chúng trong tương lai có thể sử dụng được. “Chúng ta đang tiến tới một thời điểm mà gần như tất các nghiên cứu tài trợ bởi ngân sách phải tìm cách đặt dữ liệu của họ ở đâu đó” Ogier nói. Nhưng chẳng có một quy định cứng nào về việc ai phải có trách nhiệm lưu trữ dữ liệu hoặc dữ liệu đó phải lưu giữ trong bao lâu.
Một điều không thể tránh được là các ý tưởng, tri thức, sáng tác của con người rồi sẽ tiếp tục biến mất. “Chúng ta không thể lưu giữ mọi thứ. Chúng ta không thể mở cách tiếp cận đến mọi thứ. Chúng ta cũng không thể phục hồi mọi thứ” Ogier nói “Nhưng không có lí do gì không làm mọi điều có thể”. □
Hảo Linh dịch
Nguồn: https://www.technologyreview.com/2022/10/26/1061308/death-of-information-digitization/?utm_source=Facebook&utm_campaign=site_visitor.unpaid.engagement&utm_medium=tr_social
Bài đăng Tia Sáng số 8/2024