Đánh thức dữ liệu sinh học từ các cuốn sách

Ngoài phần chữ viết, mỗi cuốn sách đều có một đời sống riêng và một câu chuyện riêng với đầy dữ liệu sinh học. Quan trọng là chúng ta có cách bắt chúng phải lên tiếng hay không.

Sao chép một bản thảo dưới thời Trung cổ châu Âu.

Trong vài thập kỷ gần đây, các thư viện đã thu hái được nhiều lợi ích khi bắt tay thực hiện các dự án số hóa các bộ sưu tập đặc biệt của mình. Bản sao số giúp bảo quản các văn bản gốc thông qua việc giảm thiểu hoặc tránh sờ chạm làm hư hỏng chúng, đồng thời trao cho các nhà nghiên cứu thêm nhiều cơ hội tìm kiếm và so sánh giữa các văn bản hơn, qua đó cho phép tạo ra những cuộc trưng bày trực tuyến theo nhiều cách đa dạng. Vào thời gian đại dịch, việc truy cập vào các bộ sưu tập số còn góp phần thúc đẩy thêm nhiều giá trị cho việc giảng dạy, học hỏi và nghiên cứu từ xa. 

Tuy nhiên, vẫn còn nhiều học giả theo đuổi những bộ sưu tập đặc biệt mà những bộ sách số hóa không thể thay thế. Những cuốn sách họ nhắm tới tiềm ẩn những thông tin chưa từng được biết tới, và gần đây, những thiết bị khoa học tiên tiến cùng cách tiếp cận liên ngành đã giúp khai mở nhiều sự thật về một quá khứ dài rộng hơn cả nội dung cuốn sách. Đó thực sự là một cuộc phiêu lưu kỳ thú mà không học giả nào muốn chối từ. 

Da cừu giúp luật sư Trung cổ chống văn bản giả 

Vào cuối thế kỷ 16, thông luật Anh (common law), hệ thống pháp luật coi trọng án lệ, chủ yếu dựa trên các văn bản, thay thế cho truyền thống truyền miệng. Các chứng thư, di chúc và những công cụ pháp luật khác ngày càng trở nên quan trọng bởi cần phải có các văn bản chứng minh mỗi khi xác nhận, chuyển giao quyền sở hữu, lợi ích, nghĩa vụ… 

Việc chuộng sử dụng da cừu để viết các chúc thư xuất phát từ việc nếu ai đó có ý định tẩy xóa hoặc viết đè lên văn bản gốc sẽ dễ dàng bị phát hiện.

Bất chấp việc ngày càng gia tăng sử dụng giấy trong các văn bản quan trọng, với các chứng thư – những tài liệu pháp lý liên quan đến quyền sở hữu các tài sản hữu hình (đất đai, nhà cửa, lâu đài…) hay tài sản vô hình (các loại đặc quyền, đặc lợi), người ta vẫn thống nhất về mặt nguyên tắc là sử dụng văn bản viết tay trên giấy làm từ da động vật. Việc tiếp tục sử dụng các loại da động vật, dù chi phí cao, là do độ bền của nó. Tuổi thọ của văn bản da động vật lớn hơn so với văn bản giấy đều được các nhà thần học và luật sư đương thời xác nhận, có thể là ảnh hưởng từ độ bền hàng thiên niên kỷ của da hơn văn bản giấy cói papyrus. 

Niềm tin lớn lao về độ bền của giấy da đã góp phần tạo nên hàng đống chúc thư bằng da, một nguồn văn bản chiếm một số lượng lớn trong các kho lưu trữ Anh mà ngày nay phần lớn lại bị lãng quên. Một phần nguyên nhân là do nó thường được coi là có giới hạn về giá trị lịch sử hay học thuật. Thậm chí nhiều văn bản còn bị loại bỏ, đốt hoặc thậm chí tái sử dụng làm chụp đèn trong thế kỷ 20 sau khi Đạo Luật đất đai (Land Registry Act) năm 1925 quyết định dừng sử dụng chúng. Tuy nhiên vẫn có hàng triệu văn bản da như vậy vẫn còn nằm trong các kho lưu trữ mà chúng ta vẫn còn biết quá ít về quá trình tạo ra chúng, bao gồm cả các loài động vật cung cấp nguyên liệu da để vĩnh cửu hóa thông tin này.

Nhóm các nhà nghiên cứu ĐH Exeter, York, Cambridge và Copenhagen đã chọn lọc được 645 trang văn bản từ tổng số 477 chúc thư liên quan đến tài sản ở Anh, Scotland và Wales. Với những tài liệu nhiều trang này, mỗi trang giấy da có cùng kích thước (trên 70 × 50 cm), chỉ dấu chúng được lấy từ một con vật. Mỗi chúc thư đều ghi rõ thời gian lập và chữ ký. 

Việc phát hiện các mảnh da này từng thuộc về loài nào là một thách thức bởi các dấu hiệu về lông hoặc nang lông đều bị loại bỏ trong quá trình xử lý và thuộc da. Trong lịch sử, các tấm chúc thư thường được mô tả là “vellum” (nghĩa là da bê), “giấy da” (có thể là da cừu hoặc da dê) hoặc thậm chí thường được gọi chung chung là “màng động vật”. May thay, các nhà nghiên cứu sử dụng kỹ thuật phân tích là vết vân tay khối peptide (peptide mass fingerprinting), thường được dùng để nhận diện loài qua phân tích các protein trên tấm giấy da. Sau khi được kiểm tra trên các thiết bị tiên tiến, 645 mẫu được trích xuất từ 645 trang giấy da đã được nhận diện thuộc về họ trâu bò, trong đó 96,4% là cừu. 

Một miếng da cừu được các nhà khoa học phân tích.

Tại sao tới hơn 96% số lượng văn bản làm từ da cừu? nó có gì ưu việt so với da bê, da dê? Các nhà nghiên cứu cho biết, các mảnh da này thường được làm từ lớp hạ bì, lớp phía dưới của da và nằm giữa lớp thượng bì mịn ở phía trên và lớp hạ bì sợi thô phía dưới nữa. Sự kết nối của chúng trong da cừu rất yếu do có sự thay đổi đột ngột trong cấu trúc và hàm lượng chất béo lớn hình thành giữa chúng. Thông thường, da cừu có hàm lượng chất béo cao, chiếm khoảng 30–50% trong khi chỉ 2 đến 3% ở da bò và 3 đến 10% ở da dê. Trong quá trình xử lý, da cừu được đặt vào thùng đựng đầy dung dịch kiềm nhằm loại bỏ chất béo, qua đó làm rỗng kết nối giữa các lớp. Vì vậy, các lớp da cừu dễ bị phân tách và dễ bị hư tổn hơn so với những loài vật khác. 

Nhưng khiếm khuyết này chưa giải thích được vì sao các luật sư Anh thời Trung cổ lại thích da cừu hơn các loại da khác. Nếu nhìn vào lịch sử sử dụng giấy da, chúng ta biết là vì da rất bền nên thường chúng vẫn được tái sử dụng cho nhiều mục đích, trong đó có việc được cạo đi để viết đè lên một văn bản khác. Với các văn bản pháp luật quan trọng như chúc thư thì tính toàn vẹn của văn bản vô cùng quan trọng. Việc chuộng sử dụng da cừu để viết các chúc thư xuất phát từ việc nếu ai đó có ý định tẩy xóa hoặc viết đè lên văn bản gốc sẽ dễ dàng bị phát hiện. Trong một văn bản thế kỷ 12, Dialogus de Scaccario – thường được do là của Richard FitzNeal (1130–1189), quan ngân khố dưới triều đại Henry II và Richard I – đã lưu ý hướng dẫn của ngân khố là sử dụng da cừu “để họ không thể dễ dàng cạo bỏ mà không để lại dấu vết”. Điều này cũng thịnh hành ở thế kỷ 17, khi Sir Edward Coke – quan chánh án của nhà vua và là một nhà luật pháp tiên phong trong đầu kỷ nguyên hiện đại – cũng lưu ý trong buổi trình bày tại Viện Nghiên cứu Luật pháp Anh về sự cần thiết phải viết trên da cừu, không chỉ do độ bền của loại vật liệu này mà còn “để những gì được viết trên đó ít bị thay đổi”. Các văn bản trên giấy da cừu dưới triều Tudor thường có lỗi nhưng không bị cạo bỏ và viết đè lên mà chỉ bị gạch đi và viết xen vào giữa các đoạn, có lẽ do biết rõ rủi ro này.

Với mật mã sinh học, các công cụ sinh học phân tử đã giúp tiết lộ các dữ liệu về hệ protein, hệ gene, hệ vi sinh vật trên các văn bản cổ.

Tuy nhiên, việc ưa chuộng giấy da cừu cũng còn một lý do khác, đó là giá cả và sự sẵn sàng của nguồn cung. Da cừu rẻ hơn các loại da khác do số lượng cừu chiếm số lượng lớn trong tổng đàn gia súc họ trâu bò ở Anh. Ước tính, có khoảng 10 đến 17 triệu con cừu ở Anh, trong khoảng thế kỷ 12 đến thế kỷ 17, 11 đến 14 triệu con vào đầu thế kỷ 18 và tiếp tục tăng trưởng đến 25 triệu con vào cuối thế kỷ 19. Hằng năm, có khoảng 2 đến 5 triệu tấm da cừu được thu hoạch và xử lý, quá đủ cho nhu cầu của các nhà thuộc da Anh. Trong khi đó, tổng dân số Anh được biết đến trong lịch sử ít hơn cả số lượng cừu.

Mặt khác, việc sử dụng giấy da cừu dễ dàng hơn so với giấy da bê hoặc da dê. Trong khi con cừu ở độ tuổi nào cũng có thể cho da có phẩm chất phù hợp với việc làm giấy thì chỉ có những con bê ít hơn sáu tuần tuổi mới làm được vellum do da bê có xu hướng ngày một dầy lên, nghĩa là dù tổng đàn bò của Anh vượt quá một triệu con vào thế kỷ 19 nhưng chỉ vài trăm con là đủ điều kiện lấy da hằng năm và trong giai đoạn 1604 đến 1671 thì triều đình Anh còn có lệnh cấm giết bê dưới năm tuần tuổi. Da bê chất lượng cao hơn và đắt đỏ hơn da cừu, ngay cả một tấm da cừu loại thượng hạng cũng rẻ hơn so với tấm da bê chất lượng kém nhất. 

Lời giải cúa bài toán hồ sơ chứng thư quả thật ẩn chứa những thông tin nằm ngoài mong đợi. 

Bức tĩnh vật vẽ Kinh Thánh của van Gogh. Nguồn: Wikipedia

Phá vỡ các mật mã sinh học

Rõ ràng, phân tích các văn bản luật pháp làm bằng da cừu đã đem lại thông tin mới mẻ về việc chúng được làm ra từ vật liệu gì, tại sao lại được sử dụng. Nghiên cứu của Sean Paul Doherty và cộng sự là một ví dụ điển hình của hướng nghiên cứu trong lĩnh vực mật mã sinh học (Biocodicology), một sự kết hợp của nhiều lĩnh vực nghiên cứu như động vật học khảo cổ, sinh học phân tử, lịch sử… Với mật mã sinh học, các công cụ sinh học phân tử đã giúp tiết lộ các dữ liệu về hệ protein, hệ gene, hệ vi sinh vật trên các văn bản cổ. Những thay đổi mang tính cách mạng trong các lĩnh vực này trong thập kỷ qua cho phép thu thập lượng và phân tích một lượng dữ liệu lớn, một cách tiếp cận khiến một nhà mật mã sinh học là Sarah Fiddyment phải tốt lên “đem lại lợi thế trong khả năng phát hiện những yếu tố đầy bất ngờ mà nhiều cách tiếp cận khác không thể, nhờ vậy đem lại những phát hiện không ngờ”. 

Bản thân Fiddyment quá hiểu điều đó. Nhóm nghiên cứu của cô đã phát triển một phương pháp thu thập mẫu xâm lấn siêu tối thiểu, có thể lấy đi một chút mẫu trên bề mặt da và protein trong mẫu được trích xuất với một enzyme. Họ sử dụng các peptide – những chuỗi ngắn amino acids liên kết với nhau bằng các liên kết peptide – được tạo ra để xác định nguồn gốc của loài vật. Kỹ thuật vết vân tay khối peptide này giúp đem lại những cái nhìn vào lịch sử của nền kinh tế chăn nuôi thời Trung cổ và các kỹ thuật thủ công của nghề thuộc da mà không văn bản đương thời nào ghi chép lại. Ví dụ phân tích York Gospels (Các cuốn Phúc âm của Nhà thờ chính tòa và Nhà thờ của Thánh Peter ở York), được tin là được viết ở Canterbury, Anh vào thế kỷ thứ 10, tiết lộ “một lượng thông tin sinh học giàu có trên giấy da từ một cuốn sách hoàn chỉnh mang giá trị văn hóa lớn lao khắp 1000 năm lịch sử của nó”, bao gồm bằng chứng về một cơn bùng phát bệnh dịch tả trâu bò dẫn đến một lượng cung da dồi dào. Họ cũng phát hiện ra những vi khuẩn cư trú trên giấy da tương đồng với cộng đồng vi khuẩn trên da người, có khả năng do được truyền từ người đọc trong quá trình sử dụng. Bên cạnh đó, họ cũng tìm thấy chi vi khuẩn Saccharopolyspora trên tất cả các trang được lấy mẫu của York Gospels, loại vi khuẩn liên quan tới quá trình phân hủy giấy da. Nhóm nghiên cứu tin rằng còn có thể phân tích dữ liệu nhiều hơn để tiết lộ màu sắc của lớp da và tuổi của bò.

Mã hóa sinh học không chỉ hữu dụng để nghiên cứu về sách và văn bản cổ. Một trong những mảnh da được chứng minh thuộc về một tài liệu quan trọng của New Zealand, the Treaty of Waitangi năm 1840, khi dữ liệu cho thấy các mảnh da cùng được làm từ da cừu cái và khớp nhau về các hệ gene ti thể, ngay cả khi mắt thường thấy kích thước và đặc điểm của hai bên không có nhiều điểm tương đồng. Các nhà nghiên cứu cũng có thể truy theo sự khác biệt là do điều kiện bảo quản khác nhau ở những thời điểm khác nhau trong lịch sử.

Mã hóa sinh học cũng giúp làm sáng tỏ những điều kinh khủng từng xảy ra trong quá khứ, nằm ngoài sức tưởng tượng trong nghề thuộc da làm sách. Megan Rosenbloom, một thủ thư y tế Mỹ đã cùng với đồng nghiệp thực hiện một dự án xét nghiệm các cuốn sách bìa da để tìm xem nguồn gốc của da này là gì. Họ chọn lọc được 31 cuốn trong số 50 cuốn sách có thể nhận diện được trong các bộ sưu tập của các tổ chức công, rồi phân tích bằng chính kỹ thuật vết vân tay khối peptide. Kỹ thuật này cho phép họ nhận diện được 18 trong số 31 được đóng bìa từ da người. Thông tin này giúp nhóm nghiên cứu nhận diện được cách làm khủng khiếp của các bác sĩ trong quá khứ và quan điểm của họ về cơ thể bệnh nhân. Kết thúc dự án, vào năm 2020, Rosenbloom đã xuất bản cuốn Dark Archives (Những kho tàng hắc ám), một cuốn sách phi cư cấu về lịch sử, nguồn gốc và những bí ẩn quanh các cuốn sách ghê sợ này.   

Rất nhiều xét nghiệm vi sinh vật phức tạp về mặt khoa học đã được áp dụng để rồi tiết lộ những điều thú vị về lịch sử y học. Nhà hóa phân tích Alfonsina D’Amato và cộng sự của mình đã xuất bản ba bài báo với chiều sâu dữ liệu được họ phát hiện theo cách “giống như các tác phẩm khoa học viễn tưởng”, một trong số đó có cái tên gây ấn tượng “Of mice and men: Traces of life in the death registries of the 1630 plague in Milano” (Của chuột và người: Những dấu vết sự sống trong số báo tử từ đợt bùng phát dịch hạch năm 1630 ở Milano) trên tạp chí Journal of Proteomics. Sổ báo tử của trận dịch hạch năm 1630, được bảo quản tại Archivio di Stato di Milano (Kho lưu trữ quốc gia Ý tại Milan), không ngờ đã “bắt” được bằng chứng về bệnh dịch hạch lan tràn qua thành phố này. Các nhà khoa học đã phát hiện ra các protein thuộc 17 chủng virus họ Yersiniaceae, 31 loại keratin (chất sừng) khác nhau của người, 22 loại chất sừng của chuột, 400 peptide từ các chủng vi khuẩn khác nhau và 58 protein từ mô người và 130 protein từ mô chuột (chuột nhắt và chuột cống). Đây là bằng chứng về vô số lần tiếp xúc với con người và chuột, tác nhân lan truyền bệnh dịch hạch mà mãi đến năm 1898, nhà vi sinh vật Paul-Louis Simond (Pháp) mới phát hiện ra con đường lây truyền từ bọ chét sống ký sinh trên chuột rồi nhảy sang người. 

Và thật đáng ngạc nhiên là một lượng lớn vết thực phẩm từ hơn 60 loài thực vật, trong đó có khoai tây, gạo, đậu gà, cà rốt, như một phần bằng chứng về bữa ăn trưa ít ỏi của những người ghi chép trong quá trình họ ngồi cả ngày điền các cột về số người chết vì dịch hạch, thậm chí vừa ăn vừa ghi. Dữ liệu của D’Amato đã thực sự vẽ nên bức tranh sống động về một thế giới mà “cả ngày dài, những người đảm trách công việc đã rỏ đầy mồ hôi chỉ để ghi số lượng rất lớn những người qua đời vì dịch bệnh, còn suốt đêm thì lũ chuột thống lĩnh nơi này để tìm kiếm những mẩu vụn thức ăn còn sót lại”. 

Và nữa, bưu ảnh, thư từ và cả đồ khâm liệm của nhà văn, nhà viết kịch Nga Anton Chekhov đều biểu thị sự hiện diện của vi khuẩn lao. Một ví dụ khác là việc nhóm nghiên cứu của giáo sư hóa học Pier Giorgio Righetti ở Politecnico di Milano kiểm tra bản thảo Master i Margarita (bản dịch tiếng Việt của Đoàn Tử Huyến là Nghệ nhân và Margarita), tác phẩm cuối cùng của nhà văn Nga Mikhail Bulgakov, để tìm hiểu tình trạng sức khỏe của tác giả. Do Bulgakov qua đời vì bệnh thận vào năm 1940 ở tuổi 48 nên các nhà nghiên cứu nghi ngờ bệnh tật có thể để lại dấu vết và/hoặc dấu hiệu sinh học của bệnh lý này trên lề các trang bản thảo. Cuối cùng, nhóm nghiên cứu người Ý đã chỉ ra được các chỉ thị sinh học của hội chứng thận hư và sự hiện diện của morphine. Có phải đây là một phần của loại thuốc giảm đau mà Bulgacov đã dùng? Nhóm nghiên cứu trích dẫn ý kiến của giáo sư Serena Vitale, chuyên gia về văn học Nga, là không có dấu hiệu lịch sử nào cho thấy Bulgakov sử dụng morphine vào cuối đời và dấu vết về loại chất gây nghiện này có thể liên quan đến lực lượng an ninh mật KGB hoặc bất cứ ai liên quan đến quá trình lưu giữ bản thảo gốc. 

Vậy là ai mà biết được các thế giới vi sinh vật của các văn bản và bản thảo cổ lại có thể chứa đầy các điều bất ngờ như vậy? Liệu những tình huống khó xử và riêng tư có thể bị phơi bày trong những nghiên cứu dạng này? Ví dụ nhà sinh học tiến hóa Blair Hedges ở ĐH Temple Philadelphia, Pennsylvania (Mỹ) đã phát hiện dấu vết của mọt gỗ Anobium punctatum, một loài bọ cánh cứng phân bố ở Bắc Âu, đục lỗ trong cuốn Phúc Âm Luca tại thư viện Bodleian, ở Oxford qua phân tích DNA cổ. Điều này xác nhận cuốn sách được làm ở Anh hoặc Bắc Âu. Sau đó ông cùng đồng nghiệp nhận diện được vết của mọt từ miếng gỗ sồi được sử dụng để đóng bìa sách đến các trang sách bị mọt gặm: chúng đẻ trứng lên cây sồi trước khi những người làm sách gắn gỗ trong bìa da. Câu chuyện không dừng ở đây, họ còn phát hiện ra bìa sách được làm từ da hoẵng châu Âu, dây gắn sách từ da hươu đỏ, nhiều trang được làm từ da bê chứ không phải da cừu và có tới 20% DNA trích xuất từ cuốn sách này thuộc về con người. Có thể giải thích gì về con số 20% này? Lượng DNA xuất hiện chủ yếu ở các trang có các lời sấm truyền, lời nguyền, được lý giải rằng khi giở đến các trang này, người đọc đã chạm, hôn lên chúng. Đặc biệt, họ phát hiện vết hai vi khuẩn liên quan gần gũi với da người: Propionibacterium, nguyên nhân gây ra mụn trứng cá, và Staphylococcus aureus gây bệnh tụ cầu vàng. 

Không chỉ nụ hôn của thầy tu trên những trang sách Phúc âm, vết mọt sách mà thậm chí một vết màu xanh lam lưu lại trên răng của một bộ hài cốt nữ tuổi chừng 40 đến 65, qua đời vào quãng năm 997 và 1162, trong một nghĩa trang tôn giáo ở Dalheim, Đức cũng có thể kể lại một câu chuyện về toàn cầu hóa. Vết xanh trên răng bà là từ thói quen nhấm cọ phết màu vẽ, trong đó có màu xanh lam tán từ đá quý lapis lazuli (ngọc lưu ly), được khai thác từ các mỏ ở Afghanistan rồi qua các thành phố trung tâm thương mại ở Ai Cập đến Constantinople của đế chế Byzantine để cuối cùng có mặt trong tu viện Đức. Người nữ tu này là họa sĩ minh họa bản thảo Kinh thánh thời Trung cổ mà tay nghề hẳn ở mức rất cao nên mới được mời vẽ minh họa Kinh thánh và tùy nghi sử dụng những loại màu vẽ đắt hơn vàng. Phát hiện ra việc làm sách ở Đức vào thời điểm này không có gì đáng ngạc nhiên nhưng ngạc nhiên hơn là từ trước tới nay, người ta không biết gì về việc phụ nữ cũng tham gia vẽ minh họa cho những cuốn sách giá trị bởi trên thực tế, thông thường người chép và vẽ minh họa không được ký tên trên tác phẩm và phương thức thực hành này đơn giản là đã loại phụ nữ khỏi lịch sử làm sách.

Việc khám phá những mẩu nhỏ bằng chứng, những dấu vết độc nhất vô nhị nhấn mạnh vào những gì mà một lĩnh vực khoa học liên ngành mới có thể làm được. Những bộ sưu tập “chết”, nhờ vậy đã được chuyển hóa thành những bộ sưu tập “sống” với những dữ liệu phong phú trong các văn bản cổ đủ sức kể cho chúng ta nhiều câu chuyện về quá khứ vẫn còn trong vòng bí mật, và cả cách thức gìn giữ những báu vật vô giá đó.□

Tài liệu tham khảo chính:

Sean Paul Doherty et al. “Scratching the surface: the use of sheepskin parchment to deter textual erasure in early modern legal deeds”. Heritage Science.

Megan Rosenbloom. “The books are alive with biological data: an introduction to the field of biocodicology and its implications for historical health sciences collections”. Journal of the Medical Library Association.

Sarah Fiddyment et al. “So you want to do biocodicology? A field guide to the biological analysis of parchment”. Heritage Science.

Bài đăng Tia Sáng số 17/2024

Tác giả

(Visited 398 times, 1 visits today)