Số hóa kho di sản Hán Nôm

Không chỉ tài trợ 15.000 USD để in 1.000 bộ “Tự điển chữ Nôm dẫn giải”, Hội bảo tồn di sản chữ Nôm Hoa Kỳ, tổ chức tư nhân duy nhất bảo tồn chữ Nôm trên thế giới hiện nay gìn giữ và truyền bá chữ Nôm bằng công nghệ hiện đại - còn hỗ trợ GS. Nguyễn Quang Hồng trong suốt nhiều năm thực hiện công trình này từ việc tạo font, đánh máy, tới làm chế bản… Tia Sáng đã có cuộc trao đổi với ông Ngô Trung Việt, phó chủ tịch Hội, về công việc của Hội và hướng nghiên cứu của các học giả Hán Nôm cần thay đổi như thế nào trước sự phát triển của công nghệ.

Thưa ông Ngô Trung Việt, mục đích bảo tồn di sản chữ Nôm của Hội là gì?

Bảo tồn chữ Nôm theo cách cổ điển chúng ta vẫn làm là đưa các tài liệu chữ Nôm vào thư viện hay kho tập trung và hạn chế số người tiếp cận để khỏi hỏng tài liệu gốc, đồng thời mở các lớp dạy chữ Nôm. Tuy nhiên, tình hình đang ngày càng khó khăn khi số người biết chữ Hán Nôm ngày càng ít đi và không nhiều người có điều kiện truy nhập được vào kho tư liệu đã cất giữ.

Nhận thấy các khó khăn này, Hội Bảo tồn di sản chữ Nôm mong muốn giúp bảo tồn chữ Nôm dưới dạng hiện đại, nghĩa là đưa lên mạng internet các tài liệu và công trình nghiên cứu bằng chữ Nôm để nhiều người có thể cùng truy nhập và các học giả có thể cùng nghiên cứu.

Xin ông có thể giải thích cụ thể về cách thức bảo tồn chữ Nôm theo cách hiện đại của Hội được không?

Có bốn mức độ cần thực hiện để có thể bảo tồn được chữ Nôm bằng công nghệ hiện đại, bao gồm:

1. Mức thứ nhất là bảo tồn các con chữ Hán Nôm qua công nghệ:  Để có thể hiển thị các chữ Nôm trên máy tính và truyền qua mạng trong các văn bản quốc tế và trên Internet, cần đăng kí với quốc tế danh sách các chữ Nôm để chúng được cấp mã số. Khi đó, nước ta phải tham gia các cuộc họp của nhóm IRG (Ideographic Rapporteur Group) và Working Group 2 – WG 2 (là một nhóm công tác của Ban kỹ thuật liên hợp của Hội đồng điện tử của Tổ chức tiêu chuẩn quốc tế – ISO) của Tiểu ban ISO/IEC JTC1/SC 2. Nhóm IRG bao gồm chuyên gia về chữ biểu ý và về Công nghệ thông tin tới từ Nhật Bản, Hàn Quốc, Trung Quốc, Việt Nam, Mỹ, Triều Tiên, Hiệp hội Máy tính Đài Loan, Macau, Hồng Công, Singapore, và chuyên gia của Unicode. Họ có nhiệm vụ thu thập các kho chữ của tất cả các nước Đông Á và phân loại các chữ cùng kiểu theo hình chữ của chúng mà không phân biệt nghĩa. Trong công việc này, trước hết, ta phải nộp danh sách các chữ Nôm cần được mã hóa cho nhóm IRG. Sau đó, nhóm WG 2 sẽ mã hóa và cấp mã cho các chữ này. Tuy nhiên, việc các mã này chỉ có hiệu lực thực tế khi có 3/4 số các nước tham gia xây dựng tiêu chuẩn trên thế giới bỏ phiếu tán thành. Sau khi cấp mã chính thức, các nhà sản xuất sẽ căn cứ trên đó để xây dựng các phần cứng và phần mềm để xử lí và truyền các chữ mới đó trên mọi loại máy tính và mạng máy tính. 

2. Mức thứ hai là bảo tồn các văn bản cổ trong các cơ sở dữ liệu: đánh các tác phẩm lớn bằng chữ Hán Nôm như Truyền Kiều, Lục Vân Tiên…vào máy tính bằng việc dùng bộ chữ đã được mã hóa. Điều này yêu cầu phải phát triển các phần mềm tạo font chữ theo các chuẩn quốc tế, phần mềm gõ chữ Hán Nôm, và các phần mềm quản lí cơ sở dữ liệu chứa các tài liệu đó.

3. Mức thứ ba là không chỉ dừng lại ở từng tác phẩm mà đưa hẳn cả kho sách chữ Hán Nôm với hàng nghìn đầu sách vào máy tính thông qua chụp ảnh các tài liệu gốc. Công việc này được gọi là số thức hóa các kho tư liệu Hán Nôm để mọi người đều có thể đọc được nhiều tài liệu mà không cần phải trực tiếp giở lại tài liệu gốc. Hiện nay, Thư viện Quốc gia, Thư viện Hán Nôm cũng đang có những kho tư liệu như vậy.

4. Mức thứ tư là bảo tồn chữ Nôm trong tâm khảm người sống, có nghĩa là tổ chức các chương trình học để mọi người có thể dùng được chữ Hán Nôm với sự hỗ trợ của công nghệ trong hoàn cảnh ngày càng ít người biết và có thể dạy được về chữ Hán Nôm.

Để góp phần bảo tồn chữ Nôm dưới dạng hiện đại, Hội Bảo tồn di sản chữ Nôm đã tham gia vào cả bốn hình thức bảo tồn, bao gồm:

* Tài trợ cho một số người Việt Nam đi tham dự các cuộc họp quốc tế để giữ vị trí của Việt Nam trên trường quốc tế về các chữ biểu ý (thông thường là các cuộc họp mỗi năm hai lần của nhóm IRG) khi mà các cơ quan ở Việt Nam đã dừng việc này. Hội cũng đã đề nghị với Viện Tiêu chuẩn Việt Nam để xây dựng một bộ tiêu chuẩn Việt Nam về chữ Quốc ngữ, Hán Nôm, chữ Thái, chữ Chăm và chữ Khmer. Đề nghị này đã được chấp nhận và tiêu chuẩn TCVN 8271 về các loại chữ của Việt Nam theo ISO 10646 đã được ban hành.

* Tài trợ để một nhóm chuyên viên đưa lên mạng một số tác phẩm bằng chữ Nôm như Truyện Kiều, Đại Việt Sử ký toàn thư, Lục Vân Tiên… .

* Cộng tác với Thư viện Quốc gia để tiến hành giúp đỡ thực hiện số thức hóa một phần kho chữ Hán Nôm của thư viện. Khi nhận thấy vai trò quan trọng của công tác số thức hoá sách báo tài liệu, Thư viện đã tự xây dựng dự án số thức hoá của họ. Hội cũng hỗ trợ chùa Thắng Nghiêm tiến hành số thức hoá kho tài liệu Hán Nôm của chùa.

* Tài trợ cho một số người nghiên cứu về chữ Nôm từ nước ngoài vào học chữ Nôm ở Việt Nam và tài trợ học bổng cho một số sinh viên học chữ Hán Nôm tại Hà Nội, Huế và thành phố Hồ Chí Minh. Ngoài ra, Hội còn trao giải thưởng cho các nhà nghiên cứu (có những thành tựu và đóng góp cho việc bảo tồn chữ Nôm) và học bổng cho các nhà nghiên cứu trẻ.

Hiện nay, Hội gặp khó khăn gì trong việc bảo tồn chữ Nôm?

Khó khăn nhất là vẫn còn quan niệm chữ Nôm là chữ của Trung Quốc và mọi người cho rằng tại sao lại phải bảo tồn thứ chữ mà bây giờ không ai sử dụng. Suy nghĩ ấy xuất phát từ việc cả hệ thống giáo dục của chúng ta đã bỏ khâu dạy cho học sinh biết chữ Hán Nôm, thứ chữ mà ông cha mình đã dùng suốt 1.000 năm. Ví dụ, ít nhất các em phải nhìn thấy ảnh chụp của Truyện Kiều bằng chữ Nôm, nhưng không, các em học ngay bằng chữ Quốc ngữ. Chính vì vậy, cây cầu với quá khứ vì thế đã bị chặt đứt, thế hệ trẻ đã quên lãng cái gốc của chữ Việt. Thay đổi cần làm bây giờ là hệ thống giáo dục phải để học sinh từ lớp Một, lớp Hai biết rằng nước mình có hai hệ thống chữ. Khi đó mới có thể tạo nền tảng để các em tiếp thu sau này.

Hiện nay, khi hỏi mọi người, kể cả những người có trách nhiệm, họ đều cho rằng đó không phải là việc quan trọng và nếu có thì đã có Viện Nghiên cứu Hán Nôm lo. Họ không nghĩ rằng bảo tồn chữ Nôm, là bảo tồn gia sản của các tiền nhân để lại và là việc của toàn dân để các thế hệ sau kế tục chứ không thể chỉ khoán cho một vài người làm. Sự quan tâm hạn chế của xã hội như vậy dẫn đến đầu tư cho công việc bảo tồn chữ Nôm của các cơ quan hay cá nhân không có chiến lược lâu dài. Bên cạnh đó còn một khó khăn khác, đó là công nghệ thì tiến bộ rất nhanh nhưng những người nghiên cứu Hán Nôm lại đang không bắt kịp, không nắm được những công nghệ mới. Vì vậy, Hội đã rất muốn để mọi người ý thức được điều đó và từ đó tạo ra một lực lượng trẻ nắm được công nghệ và thúc đẩy nghiên cứu theo một chiều hướng khác.

Theo ông, giới học giả Hán Nôm hiện nghiên cứu theo hướng nào?

Hiện nay, đa số những học giả Hán Nôm đi theo hướng phân tích và đọc từng tác phẩm cụ thể, đơn lẻ vì đó là những gì người ta có thể làm được ngay và có tư liệu trong tay. Tuy nhiên, công nghệ hiện giờ cho phép họ tổ chức những cơ sở dữ liệu khổng lồ rồi trích rút hoặc tổng hợp những thông tin từ kho dữ liệu đó để có những phát hiện mới có tính khái quát cao. Thành ra, thời đại đã sang một trang mới mà hầu hết các nhà nghiên cứu của mình chưa bắt theo công nghệ, chưa dùng được công nghệ để làm cho nghiên cứu thay đổi khác đi. Đó là tụt hậu về phương pháp khoa học hiện đại.

“Tự điển chữ Nôm dẫn giải” là một trong số những công trình chữ Nôm đầu tiên được Hội tài trợ. Công trình này liệu có thể gợi mở hoặc hỗ trợ cho việc nghiên cứu Hán Nôm “khác đi” của những nhà nghiên cứu trẻ?

Điểm đặc sắc ở công trình của GS. Hồng đó là một công trình tổng hợp, nó tập trung rất nhiều tri thức của những người đi trước để mọi người có thể sử dụng. Thế hệ trẻ phải phát huy hướng nghiên cứu như thế thì mới có thể đi theo thời đại, kế tục GS. Nguyễn Quang Hồng. Và để làm như vậy, họ cần làm chủ công nghệ.

GS. Nguyễn Quang Hồng có một kho phích rất lớn là nguồn để ông làm bộ Tự điển chữ Nôm dẫn giải. Phích là những mẩu giấy ghi lại những chữ Nôm và văn cảnh, nguồn gốc của chúng. Tất cả những học giả Hán Nôm đều có một kho phích ghi lại những chữ mới họ bắt gặp trong các văn bản hằng ngày và phải đọc nhiều tác phẩm, soi chiếu những chữ này trong nhiều văn cảnh mới luận ra được nghĩa của chúng. Có thể hiểu rằng, vốn tri thức của GS. Hồng được thể hiện bằng tập phích đó và nếu chúng được số thức hóa thì rất nhiều nhà nghiên cứu đi sau có thể kế tục và phát triển. Bộ tự điển này chính là một dạng tư liệu tổng hợp và đã bước đầu được đưa vào máy tính (trong soạn thảo chế bản). Bước phát triển thứ hai của bộ tự điển này sẽ là đưa lên internet và hình thành các công cụ tra cứu và nghiên cứu tiếp. Người đi trước là bậc thang cho người đi sau. Nhưng người đi sau cũng phải biết cách dựa trên công nghệ để khai thác được vốn tri thức đã được tích lũy lại đó. Đó là sức mạnh của sự hợp tác.

Nếu không số hóa và hệ thống các kho phích như vậy thì mỗi người sẽ sở hữu một kho phích riêng lẻ tuỳ theo khả năng của họ. Đó là còn chưa kể, những kho phích của những học giả Hán Nôm lớn có thể bị mất đi khi họ qua đời, điển hình như kho phích của cụ Vũ Văn Kính (tác giả của Đại Tự điển chữ Nôm, 1999) đã dùng khi làm các từ điển chữ Nôm. 

Việc số thức hóa các kho tư liệu Hán Nôm là vấn đề tổ chức dữ liệu cho nghiên cứu khoa học xã hội một cách hữu hiệu để thúc đẩy nghiên cứu bởi từ trước đến nay chúng ta vẫn loay hoay theo cách cổ, mạnh ai người nấy làm, không cần sự trợ giúp của công nghệ thì không thể cộng tác và phát triển được. Trân trọng cảm ơn ông về cuộc trò chuyện này.

Hảo Linh thực hiện

Hội Bảo tồn di sản chữ Nôm (VNPF) ra đời năm 2000 do giáo sư, nhà thơ và dịch giả John Balaban sáng lập sau khi bản dịch thơ Hồ Xuân Hương – Spring Essence: The Poetry of Ho Xuan Huong – từ chữ Nôm của ông bán được 20.000 bản tại Mỹ.

Cho tới năm 2010, VNPF đã hỗ trợ Thư viện Quốc gia Việt Nam trong việc số hóa kho thư tịch Hán Nôm với gần 2.000 tài liệu và hơn 100.000 trang bằng cách scan từng trang tài liệu và sắp xếp chúng theo tên tác phẩm. Tuy nhiên, mức độ này chưa thể cung cấp các công cụ để giới học giả có thể tra cứu, trích rút hay tổng hợp thông tin phục vụ nghiên cứu.

Theo ông Ngô Trung Việt, để đưa một tác phẩm Hán Nôm lên trên mạng có thể mất vài năm, vì đó là việc tổ chức dữ liệu và xây dựng công cụ truy lục trong khi lực lượng triển khai thì ít. Từ việc chụp quét các văn bản gốc, đánh lại các tác phẩm bằng chữ Nôm, sắp xếp các chú thích, chú giải đều đòi hỏi người tham gia phải am hiểu về công nghệ và chữ Nôm. Chẳng hạn, ngay thao tác đưa lại tác phẩm bằng chữ Nôm vào máy tính đã là không đơn giản, nếu bắt gặp các chữ mới trong tác phẩm, chưa có trong bảng mã quốc tế (và điều này thường xuyên diễn ra), người thực hiện sẽ phải “tự tạo” những chữ này trên máy (dùng chương trình để vẽ và cấp mã tạm) đồng thời về lâu dài phải đề nghị IRG và WG 2 cấp mã và quy trình này thường mất từ ba-bốn năm để phê duyệt. VNPF đã dự định hỗ trợ các trường đại học trong nước đánh lại kho sách chữ Nôm nhưng không thành công vì năng lực công nghệ của các trường còn yếu và không có một đội ngũ cố định thực hiện công việc này tại các trường.

Hiện nay, nguồn kinh phí của VNPF chủ yếu đến từ các tổ chức và cá nhân nhiệt tình với Việt Nam tại Mỹ nhưng theo ông Ngô Trung Việt: “Thực ra các bạn Mỹ này cũng già rồi, họ cũng giúp một thời gian nữa thôi chứ về lâu về dài phải làm sao để có một lực lượng trẻ có thể kế tục được”. 

 

 

 

Tác giả