AI đọc được tít của cuộn giấy Vesuvius ‘không thể đọc được’

Nhóm nghiên cứu giành giải thưởng trị giá 60.000 USD do đã nhận diện được một tác phẩm về sự đồi bại viết bằng tiếng Hy Lạp từ các bản quét cuộn giấy papyrus 2.000 năm tuổi đã bị cháy thành than do núi lửa phun trào.

Cuộn giấy được bảo quản tại Thư viện Bodleian ở ĐH Oxford, và được quét tại máy gia tốc hạt Diamond Light Source vào năm 2024.

Hai nhà khoa học trong lĩnh vực máy học đã thắng giải thưởng trị giá 60.000 USD khi trở thành những người đầu tiên biết được tít và tác giả của cuộn giấy cói bị cháy thành than do phun trào núi lửa Vesuvius ở Ý năm 79 trước công nguyên. Những dòng trọng yếu đã giúp nhận diện tác phẩm này như một phần của On Vices của nhà triết học Hy Lạp Philodemus.

Những người thắng giải là Marcel Roth, một sinh viên ở trường ĐH Julius Maximilian ở Würzburg, Đức và Micha Nowak tại Gray Swan AI, một công ty bảo mật internet ở Pittsburgh, Pennsylvania, đã áp dụng một mô hình AI vẫn được sử dụng để phân tích hình ảnh y khoa để giải đoán văn bản này.

Công trình này là một cột mốc trong nỗ lực đọc các văn bản cổ đại được tìm thấy trong tàn tích thành phố La Mã cổ đại Herculaneum, theo Kenneth Lapatin, giám tuyển đồ cổ tại Bảo tàng J. Paul Getty ở Los Angeles, California. Các văn bản giấy cói cuộn tròn đã được khám phá tại một biệt thự La Mã cổ đại. Hàng trăm cuộn giấy cói Herculaneum tồn tại một cách nguyên vẹn nhưng quá mỏng manh để mở ra.

Những chấm mực

Các chữ cái Hy Lạp xác định cuộn giấy là một phần của tác phẩm On Vices của triết gia Hy Lạp Philodemos. Nguồn: Vesuvius Challenge

Roth và Nowak đã được loan báo thắng giải First Title Prize vào ngày 6/5/2025. Giải thưởng này là một phần của Vesuvius Challenge, một cuộc thi được thiết lập từ năm 2023 với nhiều giải thưởng lớn để phát triển các mô hình AI có thể đọc những bản quét chụp cắt lớp cuộn giấy có độ phân giải cao.

Cả hai đã nghiên cứu một cuộn giấy được bảo quản tại Thư viện Bodleian ở ĐH Oxford, và được quét tại máy gia tốc hạt Diamond Light Source vào năm ngoái. Roth và Nowak đã huấn luyện mô hình AI của họ bằng việc chú giải cẩn thận bằng tay vết mực in hiển thị trên các bản quét, dán nhãn các khu vực có vết mực và không có vết mực. Sau nhiều vòng huấn luyện, mô hình đã có thể chọn được các vế mực không hiển thị dưới mắt người, dẫn đến việc tạo ra những hình ảnh rõ ràng về tít của bản thảo.

Không ngạc nhiên là tác phẩm này của Philodemus, Lapatin nói; nhiều học giải đã nghĩ rằng các cuộn giấy đó là một phần trong thư viện cá nhân của ông. Công trình mới được phát hiện tít này dường như là tập một của loạt tác phẩm On Vices của ông, dẫu dự đoán này chưa được xác nhận. Ngoài việc chứa những từ tiếng Hy Lạp mang nghĩa ‘mơ hồ’, ‘sợ hãi’ and ‘chán ghét’, cuộn giấy cói này cũng đề cập đến các cửa hàng nước hoa và cắt tóc, có lẽ giống một phần của giai thoại. Thành viên ban giám khảo Vesuvius Challenge Michael McOsker, một nhà papyrus học tại University College London, tin tưởng vào khả năng các nhà nghiên cứu sẽ sớm đọc được toàn bộ cuộn giấy. “Bước tiến này thực sự đáng kinh ngạc”, ông nói.

Thanh Phương dịch từ Nature

Nguồn: doi: https://doi.org/10.1038/d41586-025-01407-2

Tác giả

(Visited 154 times, 154 visits today)