Hé lộ nội dung đoạn đầu tiên trong cuộn giấy Herculaneum cổ đại
Các nhà nghiên cứu đã sử dụng trí tuệ nhân tạo để giải mã chữ viết trên cuộn giấy papyrus cháy đen 2.000 năm tuổi, qua đó tiết lộ những suy ngẫm của người xưa về âm nhạc và nụ bạch hoa.
Mới đây, một nhóm sinh viên nghiên cứu đã có đóng góp to lớn trong việc giải đáp một trong những bí ẩn lớn nhất của khảo cổ học với việc tìm ra nội dung chữ viết Hy Lạp bên trong một cuộn giấy cháy đen bị chôn vùi cách đây 2.000 năm sau vụ phun trào của núi Vesuvius. Những người chiến thắng trong cuộc thi có tên Thử thách Vesuvius đã huấn luyện các thuật toán học máy của họ trên các bản quét của cuộn giấy papyrus, từ đó tiết lộ nội dung của một tác phẩm triết học về các giác quan và niềm vui chưa từng được biết đến trước đây. Kết quả này đã mở đường cho các kỹ thuật trí tuệ nhân tạo (AI) giải mã toàn bộ phần còn lại của cuộn giấy, điều mà các nhà nghiên cứu cho rằng có thể có ý nghĩa mang tính cách mạng đối với sự hiểu biết của chúng ta về thế giới cổ đại.
Thành tựu này đã khơi dậy lĩnh vực nghiên cứu cổ xưa vốn chuyển động chậm chạp. Đó là “điều mà tôi luôn nghĩ là một giấc mơ viển vông, nay đã trở thành hiện thực”, Kenneth Lapatin, người phụ trách cổ vật tại Bảo tàng J. Paul Getty ở Los Angeles, California và không tham gia vào nghiên cứu này, cho biết. Nội dung văn bản được tiết lộ thảo luận về các thú vui, bao gồm âm nhạc, hương vị của nụ bạch hoa 1 và màu tía. “Đây là một khoảnh khắc lịch sử,” nhà cổ điển Bob Fowler tại Đại học Bristol, Vương quốc Anh, một trong những giám khảo của Thử thách, chia sẻ. Ba sinh viên đến từ Ai Cập, Thụy Sĩ và Hoa Kỳ – những người tìm ra nội dung của văn bản – cùng chia nhau giải thưởng lớn trị giá 700.000 USD.
Cuộn giấy này là một trong hàng trăm cuộn giấy papyrus còn nguyên vẹn được khai quật vào thế kỷ 18 từ một biệt thự La Mã sang trọng ở Herculaneum, Ý. Những cục tro carbon hóa này – được gọi là cuộn Herculaneum – là “thư viện” duy nhất còn tồn tại từ thế giới cổ đại, song chúng quá mỏng manh để có thể được mở ra.
Bài dự thi đoạt giải, được công bố vào ngày 5 tháng 2 vừa qua, đã tiết lộ hàng trăm từ trên 15 cột văn bản, tương ứng với khoảng 5% của một cuộn giấy. “Cuộc thi đã làm sáng tỏ điều mà nhiều người vẫn băn khoăn: liệu phương pháp này có hiệu quả hay không?”, Brent Seales – nhà khoa học máy tính tại Đại học Kentucky, Lexington và là người đồng sáng lập giải thưởng – cho biết: “Giờ thì không ai còn nghi ngờ điều đó nữa.”
Sứ mệnh hai mươi năm
Trong nhiều thế kỷ sau khi phát hiện ra những cuộn giấy này, nhiều người đã cố gắng mở chúng ra, khiến cho nhiều cuộn bị phá hủy và một số khác thì chỉ còn là những mảnh tro tàn. Các nhà nghiên cứu giấy papyrus vẫn đang làm việc để giải mã và ghép các từ ngữ bị phân mảnh khủng khiếp ấy thành văn bản. Nhưng những đoạn có vết cháy đen tệ nhất – những trường hợp vô vọng nhất, tổng cộng có lẽ lên tới 280 cuộn giấy – vẫn còn nguyên vẹn. Hầu hết các cuộn giấy này được lưu giữ tại Thư viện Quốc gia ở Naples, Ý và một số ít ở Paris, London và Oxford, Vương quốc Anh.
Trong gần 20 năm, Seales đã cố gắng đọc những văn bản được giấu kín này. Nhóm của ông đã phát triển một phần mềm để “mở trong thế giới ảo” các bề mặt của cuộn giấy papyrus bằng cách sử dụng hình ảnh chụp cắt lớp vi tính 3D (CT). Vào năm 2019, ông đã mang hai cuộn giấy từ Viện nghiên cứu Institut de France ở Paris đến máy gia tốc hạt Diamond Light Source gần Oxford để thực hiện các bản quét có độ phân giải cao.
Tuy nhiên, việc lập bản đồ các bề mặt tốn nhiều thời gian, bên cạnh đó, mực gốc carbon dùng để viết các cuộn giấy có cùng mật độ như giấy papyrus, do đó không thể phân biệt được khi chụp CT. Đó là lý do Seales và các đồng nghiệp của ông tự hỏi liệu có thể đào tạo các mô hình học máy để ‘mở’ các cuộn giấy và phân biệt mực hay không. Tuy nhiên, việc hiểu được tất cả dữ liệu ấy là một nhiệm vụ quá lớn đối với một nhóm nghiên cứu nhỏ như của ông.
Sau khi xem buổi nói chuyện trực tuyến của Seales, doanh nhân Nat Friedman ở Thung lũng Silicon – người đã rất tò mò về các cuộn giấy Herculaneum – đã kết nối với Seales và đề nghị mở một cuộc thi. Ông đã quyên góp 125.000 USD để khởi động cuộc thi này và quyên góp được hàng trăm nghìn USD nữa trên Twitter. Seales cũng đã phát hành phần mềm của mình cùng với các bản quét có độ phân giải cao. Nhóm của họ đã phát động Thử thách Vesuvius vào tháng 3 năm 2023, đặt ra giải thưởng lớn cho người đọc được 4 đoạn văn, mỗi đoạn ít nhất 140 ký tự, trước cuối năm.
Chìa khóa thành công của cuộc thi là “sự kết hợp giữa cạnh tranh và hợp tác”, Friedman nói. Các giải thưởng nhỏ hơn được trao để khuyến khích những sự tiến bộ, và các đoạn code học máy thắng giải sẽ được công bố ở mỗi giai đoạn để “nâng cao năng lực” cộng đồng, từ đó giúp các thí sinh có thể phát triển dựa trên những tiến bộ của nhau.
Màu tía
Một sáng tạo quan trọng đã xuất hiện vào giữa năm ngoái, khi doanh nhân người Mỹ và người từng là nhà vật lý Casey Handmer nhận thấy một kết cấu mờ nhạt trong các bản quét, tương tự như vết nứt của bùn – được ông gọi là “crackle” – dường như tạo thành hình dạng của các chữ cái Hy Lạp. Luke Farritor – sinh viên đại học thuộc khoa khoa học máy tính tại Đại học Nebraska–Lincoln, đã sử dụng crackle này để huấn luyện một thuật toán học máy, từ đó làm lộ ra từ porphyras, ‘màu tía’, và giúp anh giành được giải thưởng cho việc tìm ra những chữ cái đầu tiên vào tháng 10 năm ngoái 2. Youssef Nader – nghiên cứu sinh tiến sĩ khoa học máy tính người Ai Cập tại Đại học Tự do Berlin – sau đó cũng đã tìm ra những hình ảnh thậm chí còn rõ ràng hơn về văn bản.
Các dòng code của họ đã được công bố trong vòng chưa đầy ba tháng để các thí sinh tham gia thử thách mở rộng quy mô giải mã của mình trước thời hạn 31 tháng 12 để nhận giải thưởng cuối cùng. Trong tuần cuối cùng, cuộc thi đã nhận được 18 bài dự thi. Ban giám khảo kỹ thuật đã kiểm tra code của người đăng ký, sau đó chuyển 12 bài thi cho một ủy ban gồm các nhà nghiên cứu giấy papyrus – những người đã đánh giá mức độ dễ đọc của từng bài thi. Chỉ có một nhóm đáp ứng đầy đủ các tiêu chí của giải thưởng: nhóm gồm Farritor và Nader, cùng với Julian Schilliger – sinh viên chế tạo robot tại Viện Công nghệ Liên bang Thụy Sĩ ở Zurich.
Giám khảo Federica Nicolardi – nhà nghiên cứu giấy papyrus tại Đại học Naples Federico II, cho biết kết quả là một điều “không thể tin được”. “Tất cả chúng tôi đều hoàn toàn ngạc nhiên trước những hình ảnh họ trình chiếu.” Cô và các đồng nghiệp hiện đang chạy đua để phân tích đoạn văn vừa được tiết lộ.
Âm nhạc, niềm vui và nụ bạch hoa
Nội dung của hầu hết các cuộn giấy Herculaneum đã mở trước đó đều liên quan đến trường phái triết học Epicurean, do triết gia người Athens Epicurus sống từ năm 341 đến năm 270 trước công nguyên lập nên. Những cuộn giấy dường như đã hình thành nên thư viện làm việc của một tín đồ của Epicurus tên là Philodemus. Văn bản mới không nêu tên tác giả nhưng từ lần đọc đầu tiên, Fowler và Nicolardi cho biết, nó có lẽ cũng là của Philodemus. Ngoài những sở thích và cảnh đẹp thú vị, văn bản này còn đề cập đến một nhân vật tên là Xenophantus, có thể là một người thổi sáo đã được các tác giả cổ đại Seneca và Plutarch nhắc đến, người có lối chơi đầy gợi cảm.
Lapatin cho biết các chủ đề mà Philodemus và Epicurus thảo luận vẫn có liên quan đến ngày nay: “Những câu hỏi cơ bản mà Epicurus đặt ra là những câu hỏi mà tất cả chúng ta với tư cách là con người đều phải đối mặt. Làm thế nào để chúng ta sống một cuộc sống tốt đẹp? Làm thế nào để chúng ta tránh được nỗi đau?” Nhưng “những kết quả thực sự vẫn còn ở phía trước chúng ta”, ông nói. “Điều thú vị đối với tôi không phải là nội dung cuộn giấy, mà là việc giải mã cuộn giấy này là điềm báo tốt cho tiềm năng giải mã hàng trăm cuộn giấy mà trước đây chúng ta không làm được.”
Nhà nghiên cứu giấy papyrus và giám khảo giải thưởng Richard Janko tại Đại học Michigan ở Ann Arbor cho biết: “Tôi sẽ thích hơn nếu có một số tác phẩm của Aristotle” trong cuộn giấy. Trong khi đó, một số cuộn giấy được mở ra, viết bằng tiếng Latinh, đề cập đến một lĩnh vực chủ đề rộng hơn, làm tăng khả năng hé lộ nội dung các bản thơ ca và văn học của các nhà văn từ thời của Homer đến Sappho. “Những cuộn giấy này sẽ tiết lộ những loại bí mật nào?”, Fowler nói. “Tất cả chúng tôi đều rất háo hức.”
Thành tựu này cũng có thể làm dấy lên cuộc tranh luận về việc liệu có nên tiến hành các cuộc điều tra sâu hơn tại biệt thự Herculaneum hay không – nơi toàn bộ các tầng trong đó chưa bao giờ được khai quật. Janko và Fowler tin chắc rằng thư viện chính của biệt thự vốn chưa bao giờ được tìm thấy và hàng nghìn cuộn giấy khác có thể vẫn còn nằm dưới lòng đất. Nhìn rộng hơn, các kỹ thuật học máy do Seales và các thí sinh tham gia Thử thách Vesuvius tiên phong áp dụng, giờ đây có thể được sử dụng để nghiên cứu các loại văn bản ẩn khác, chẳng hạn như giấy bìa cứng, giấy papyrus tái chế thường được sử dụng để bọc xác ướp Ai Cập.
Sau thành tựu này, bước tiếp theo sẽ là giải mã toàn bộ tác phẩm. Friedman đã công bố một bộ giải thưởng mới cho Thử thách Vesuvius năm 2024, với mục tiêu đọc được 90% cuộn giấy vào cuối năm nay. Nhưng trong thời điểm hiện tại, việc đạt được điều này “giống như một phép lạ”, ông nói. “Tôi không thể tin được là phương pháp này có tác dụng.”
Kim Dung dịch
Nguồn: https://www.nature.com/articles/d41586-024-00346-8
——————————————
1. https://vi.wikipedia.org/wiki/Capparis_spinosa
2.https://tiasang.com.vn/doi-moi-sang-tao/lan-dau-tien-ai-co-the-doc-duoc-van-ban-tu-mot-cuon-giay-herculaneum-co-dai/