Vì sao tiếng Việt không cùng nguồn gốc với tiếng Hán?

Mối quan hệ giữa tiếng Việt với tiếng Hán là mối quan tâm lớn xưa nay của người Việt và là đối tượng nghiên cứu của giới ngôn ngữ học Việt Nam cũng như quốc tế trong gần 150 năm nay. Nhiều kết quả nghiên cứu liên quan đã được công bố, trong đó có cuốn “Lịch sử ngôn ngữ người Việt”1 của giáo sư, tiến sĩ Trần Trí Dõi. Trong cuốn sách đó tác giả đã lý giải vì sao tiếng Việt không cùng nguồn gốc với tiếng Hán.

Các nhà khoa học Viện Nghiên cứu Hán Nôm tìm hiểu tư liệu Hán Nôm của Việt Nam tại Viện Viễn Đông Bác cổ (EFEO). Ảnh: Trung tâm tư liệu quốc gia I.

Thông thường khi nghiên cứu nguồn gốc của một ngôn ngữ, bao giờ người ta cũng trước hết định vị ngôn ngữ đó thuộc vào nhóm ngôn ngữ nào, nhánh ngôn ngữ nào, cuối cùng thuộc ngữ hệ nào. Hiểu đơn giản, ngữ hệ (họ ngôn ngữ, language family) là tên gọi chung một tập hợp các ngôn ngữ có cùng nguồn gốc; như vậy các ngôn ngữ khác ngữ hệ thì không có chung nguồn gốc. 

Sách “Lịch sử ngôn ngữ người Việt” có nêu vấn đề mà cha cố J. S. Theurel từng đưa ra nhận xét “tiếng Việt phần lớn bắt nguồn từ tiếng Hán” – được ghi trong cuốn Dictionarium Anamitico – Latinum (Từ điển Annam-Latin) của Theurel, ấn hành tại Kẻ Sở năm 18772. Nhận xét này dựa trên chứng cớ hiển nhiên là trong tiếng Việt có rất nhiều từ gốc Hán và có một số hiện tượng ngữ pháp rất giống tiếng Hán, vì thế được một số người tán đồng, hình thành quan điểm cho rằng ngôn ngữ của người Việt có nguồn gốc từ tiếng Hán, tiếng Việt là một ngôn ngữ thuộc nhóm tiếng Hán của ngữ hệ Hán-Tạng (Sino-Tibetan), nghĩa là tiếng Việt, tiếng Hán có chung ngữ hệ, tức chung nguồn gốc. Từ đó suy ra người Việt có nguồn gốc ở phương Bắc, về sau di cư xuống miền Nam. Rốt cuộc vấn đề này có liên quan tới nguồn gốc dân tộc ta. 

Năm 1912, nhà khoa học người Pháp ở Viện Viễn Đông Bác cổ Henri Maspéro (1883-1945) nhận định tiếng Việt có nguồn gốc nhóm tiếng Thái (Taic). Căn cứ vào những chứng cớ mới rất chi tiết và có tính hệ thống chủ yếu về ngữ âm, dựa trên lập luận chặt chẽ, Maspero đưa ra những kết luận thuyết phục được giới ngôn ngữ học suốt nửa thế kỷ sau đó, thậm chí sang thế kỷ XXI vẫn có người ủng hộ. Hiện nay ta biết, tiếng Thái thuộc ngữ hệ Tai-Kadai, khác với ngữ hệ của Hán ngữ, như vậy nghĩa là Maspesro cho rằng tiếng Việt không cùng nguồn gốc với tiếng Hán.

Sáng kiến phiên âm chữ Hán thành từ Hán-Việt đã giúp người Việt thuận lợi tiếp nhận chữ Hán mà hoàn toàn không nói tiếng Hán, đồng thời làm cho kho từ vựng tiếng Việt có khả năng phát triển hầu như vô hạn. Đây là một thành tựu kiệt xuất về ngôn ngữ học của tổ tiên ta.

Nhưng đến các năm 1953, 1954 và 1966, một nhà ngôn ngữ học người Pháp rất nổi tiếng là Andre-Georges Haudricourt (1911-1996) công bố mấy bài báo phản bác quan điểm nói trên, cho rằng tiếng Việt có nguồn gốc Môn-Khmer, thuộc ngữ hệ Nam Á (Austroasiatic), nghĩa là không cùng nguồn gốc với tiếng Thái hoặc tiếng Hán. Lập luận của Haudricourt rất vững chắc và có nhiều chứng minh đầy sức thuyết phục, được nhiều nhà ngôn ngữ học Việt Nam và nước ngoài tán thành.

Trong nghiên cứu, các học giả đều xem xét mối quan hệ đối ứng từ vựng giữa tiếng Việt với các ngôn ngữ đối chiếu và chia từ vựng làm hai lớp: từ cơ bản và từ văn hóa. “Từ cơ bản” là những từ vựng thông dụng nhất, như từ mô tả các bộ phận cơ thể con người (chân, tay, mắt, mũi), từ nhân xưng (bố, mẹ, con, tôi, tao, mày), tên các vật xung quanh (nhà, cửa, trời, đất, trăng, sao), số đếm (một, hai, ba), tên gia súc (chó, mèo, trâu, bò, lợn), nhu cầu sống (ăn, uống, bú, ỉa, đái), cảm nhận (đau, giận, vui, buồn), v.v…, là những từ liên quan tới nguồn gốc con người, nguồn gốc ngôn ngữ, là những từ con trẻ nói được khi bắt đầu biết nói, chưa bị ảnh hưởng của ngôn ngữ khác. Từ thuần Việt trong tiếng Việt hoặc từ thuần Hán trong tiếng Hán đều thuộc loại từ cơ bản. 

Những từ ngữ có được sau khi tiếp xúc với một nền văn hóa khác thì thuộc loại “Từ văn hóa”, thường là những từ có tính chất trừu tượng, khái niệm thuộc lĩnh vực văn hóa, ví dụ: đông, tây, đạo, lý. Từ văn hóa thường xuất hiện sau từ cơ bản hàng nghìn năm, vì thế nó không có liên quan đến nguồn gốc ngôn ngữ. Khi xác định nguồn gốc ngôn ngữ, nhất thiết phải dựa vào các từ cơ bản mà không dựa vào các từ văn hóa.

Cửu chương lập thành Toán pháp (九章立成算法) do Thập Lý hầu Ngô Sĩ cho in lần đầu vào đời Lê Dụ Tông, năm Vĩnh Thịnh Quí Tị (1713). Ảnh: Wikimedia

Sau khi phân loại từ vựng, Haudricourt nhận thấy số lượng từ thuần Việt tương ứng với từ trong ngôn ngữ Môn-Khmer thì nhiều hơn số lượng từ thuần Việt tương ứng với từ trong tiếng Thái, từ đó ông kết luận tiếng Việt có nguồn gốc Môn-Khmer chứ không phải có nguồn gốc Thái. Khi nghiên cứu vấn đề thanh điệu của tiếng Việt, ông cũng đi tới kết luận như vậy. 

Từ vựng tiếng Việt hiện đại gồm từ thuần Việt, từ Việt gốc Hán (tức từ Hán-Việt), và từ ngoại lai. Từ thuần Việt ra đời cùng với tiếng Việt, có số lượng lớn và vững chắc gắn chặt với nguồn gốc dân tộc, thể hiện tính cội nguồn của ngôn ngữ, thuộc vào lớp từ cơ bản. Từ Việt gốc Hán ra đời sau khi nước ta tiếp xúc văn hóa Trung Hoa, cho nên thuộc lớp từ văn hóa. Từ lai ra đời sau khi Việt Nam tiếp xúc văn hóa Âu Mỹ, ví dụ các từ pho mát, ô tô, ga.

Từ Hán-Việt là loại từ vựng do tổ tiên ta sáng tạo ra trong quá trình tiếp nhận chữ Hán. Thông thường người học chữ Hán đều phải đọc chữ theo âm tiếng Hán. Nhưng chữ Hán lại không có phát âm thống nhất trong toàn Trung Quốc, mà mỗi vùng phát âm theo cách riêng gọi là phương ngữ (tiếng địa phương). Người Trung Quốc sang ta nói nhiều phương ngữ khác nhau, người Việt không biết nên đọc chữ Hán theo cách phát âm nào, đây là khó khăn lớn nhất khi họ học chữ Hán.

Để vượt qua khó khăn trên, tổ tiên ta đã sáng tạo ra cách đọc chữ Hán theo âm tiếng Việt mà không đọc theo âm Hán, tức cách phiên âm chữ Hán thành từ Hán-Việt. Mỗi chữ Hán đơn âm được phiên âm thành một từ Hán-Việt, từ này có âm đọc thống nhất trong toàn dân Việt, gọi là âm Hán-Việt. Âm đọc ấy được chọn gần giống âm đọc chữ trong tiếng Hán, vì thế hầu hết từ Hán-Việt đọc lên nghe gần giống từ tiếng Hán. Ví dụ chữ  文tiếng Hán đọc “uấn”, ta đọc tiếng Việt là “văn”. Qua đó đã thực hiện phiên âm toàn bộ chữ Hán sang tiếng Việt, mượn được toàn bộ kho chữ Hán về dùng, nhưng  chỉ mượn chữ mà không mượn tiếng Hán. Do tiếng Hán và tiếng Việt đều là ngôn ngữ đơn âm tiết (monosyllabic) nên việc phiên âm một đối một tương đối thuận tiện. Từ Hán-Việt là kết quả phiên âm chữ Hán, và chữ Hán trở thành ký tự ghi từ Hán-Việt, nhưng không ghi được từ thuần Việt. Ví dụ chữ Hán 文化 ghi từ Hán-Việt “văn hoá”. 

Việc tiếng Việt, tiếng Hán thuộc hai ngữ hệ khác nhau chứng tỏ ngôn ngữ Việt không cùng nguồn gốc với ngôn ngữ Hán. Như vậy thì cội nguồn văn hóa Việt Nam cũng không thể chung nguồn gốc với văn hóa Hán.

Từ Hán-Việt là từ vay mượn của chữ Hán. Nhờ mượn thêm từ ngoại nên kho từ vựng tiếng Việt tăng lên nhiều và ngày càng tăng. Năm 1912 Maspéro nói từ Hán-Việt chiếm 60% tổng số từ tiếng Việt. Năm 2001 Cao Xuân Hạo nói tỷ lệ này là 70%. Nghĩa là chữ Hán vào Việt Nam đã làm số lượng từ tiếng Việt tăng 2,5-3 lần. Trong thực tế, người Việt dùng từ rất linh hoạt, như ghép với từ thuần Việt (tái đàn, cận nghèo) hoặc ghép từ Hán-Việt với nhau không theo quy tắc giữ gốc Hán (bán dẫn, giải ngân), cho nên kho từ vựng tiếng Việt có khả năng tăng vô hạn. 

Từ Hán-Việt còn giúp người Việt thuận lợi chuyển ngữ các từ vựng ngoại văn: khi ấy chỉ cần đọc âm Hán-Việt của từ Hán hoặc từ Kanji mà người Trung Quốc hoặc người Nhật chuyển ngữ từ ngoại văn đó, là được kết quả. Ví dụ từ tiếng Anh “pragmatism”, người Nhật chuyển sang chữ Kanji là 實用主義, ta đọc Hán-Việt là “thực dụng chủ nghĩa”, được ngay kết quả cần tìm. 

Tóm lại sáng kiến phiên âm chữ Hán thành từ Hán-Việt đã giúp người Việt thuận lợi tiếp nhận chữ Hán mà hoàn toàn không nói tiếng Hán, đồng thời làm cho kho từ vựng tiếng Việt có khả năng phát triển hầu như vô hạn. Đây là một thành tựu kiệt xuất về ngôn ngữ học của tổ tiên ta. 

Cuốn sách “Lịch sử ngôn ngữ người Việt – Góp phần tìm hiểu văn hóa Việt Nam” của GS.TS Trần Trí Dõi.

Thế nhưng không thể vì tiếng Việt có nhiều từ gốc Hán mà cho rằng tiếng Việt có nguồn gốc ở tiếng Hán, bởi lẽ từ Hán-Việt không phải là từ cơ bản, mà thuộc lớp từ văn hóa, chỉ xuất hiện sau khi người Việt tiếp xúc văn hóa Trung Hoa, tức khi nước ta bị Triệu Đà thôn tính và người Việt bắt đầu học Hán ngữ, nghĩa là sau từ thuần Việt nhiều nghìn năm, do đó từ Hán-Việt dù nhiều đến đâu cũng không ảnh hưởng gì đến nguồn gốc tiếng Việt. 

Khi so sánh các từ thuần Việt với các từ thuần Hán, cũng không thấy từ thuần Việt nào có âm đọc giống với từ thuần Hán tương ứng. Sự khác nhau về từ cơ bản chứng tỏ tiếng Việt không cùng nguồn gốc với tiếng Hán. Điều đó còn được chứng tỏ ở chỗ tiếng Việt có ngữ âm phong phú (gấp 14 lần tiếng Hán) và ngữ pháp khác tiếng Hán. Từ Hán-Việt được dùng theo ngữ pháp tiếng Việt, do đó người Trung Quốc không thể nghe hiểu câu tiếng Việt có nhiều từ Hán-Việt, tuy rằng nhìn chữ thì hiểu. Nói cách khác, tiếng Việt tuyệt đối không phải là một phương ngữ của tiếng Hán.   

Từ Hán – Việt chỉ là từ vay mượn (loan words) Hán ngữ. Các ngôn ngữ trên thế giới thường vay mượn từ vựng của ngôn ngữ khác. Ví dụ Hán ngữ hiện đại có khoảng 70% từ thuộc lĩnh vực khoa học xã hội – nhân văn là từ vay mượn tiếng Nhật. Đó là những từ vựng người Nhật chuyển ngữ từ tiếng Anh, Pháp, Hà Lan… sang chữ Kanji (chữ Hán-Nhật), ví dụ các từ government, people, economy chuyển ngữ thành chính phủ, nhân dân, kinh tế. Ngôn ngữ học cho biết: từ văn hóa thường dễ vay mượn, còn từ cơ bản thì không có vay mượn. Ví dụ tên tiếng Việt gọi các bộ phận cơ thể con người khác xa tên gọi tương ứng trong các thứ tiếng khác. Thiển nghĩ có thể suy ra ban đầu dân ta chỉ nói các từ thuần Việt, sau khi tiếp nhận chữ Hán thì bắt đầu nói các từ Hán-Việt, và ngày càng nói nhiều, nhất là khi nói đề tài xã hội, thời sự, nghị luận, đặc biệt trong văn bản, sách báo. Như trong Hiến pháp Việt Nam, tỷ lệ từ Hán-Việt lên tới 90%.

Hiện nay giới ngôn ngữ học chính thống Việt Nam và thế giới xếp tiếng Việt thuộc ngữ hệ Nam Á, nhánh Môn-Khmer, nhóm tiếng Việt (Vietic, Việt-Mường); Hán ngữ thuộc ngữ hệ Hán-Tạng. Việc tiếng Việt, tiếng Hán thuộc hai ngữ hệ khác nhau chứng tỏ ngôn ngữ Việt không cùng nguồn gốc với ngôn ngữ Hán. Đây là một kết luận quan trọng thu được sau 150 năm nghiên cứu vấn đề nguồn gốc tiếng Việt. Trên cơ sở ấy GS. TS Trần Trí Dõi nhận định: Như vậy thì cội nguồn văn hóa Việt Nam cũng không thể chung nguồn gốc với văn hóa Hán.

Thiển nghĩ vì tiếng Việt khác ngữ hệ với các ngôn ngữ Bách Việt, suy ra tiếng Việt cũng không cùng nguồn gốc với các ngôn ngữ Bách Việt, ví dụ Tráng ngữ là hậu duệ của ngôn ngữ Lạc Việt3 thuộc ngữ hệ Tai-Kadai, các ngôn ngữ khác của Bách Việt đều thuộc ngữ hệ Hán-Tạng.

So với Hán ngữ, tiếng Việt có số âm tiết cơ bản nhiều gấp 10 lần, số âm tiết chi tiết gấp 14 lần. Ưu thế đó làm cho tiếng Việt trở nên vững bền không dễ bị đồng hóa bởi các ngôn ngữ nghèo ngữ âm như Hán ngữ.

Tác giả sách Lịch sử ngôn ngữ người Việt còn đưa ra một nhận định quan trọng: Về mặt ngôn ngữ, đã có đủ cơ sở để cho rằng cộng đồng người nói tiếng Việt thực sự là một trong những cộng đồng cư dân bản địa chính từ thời tiền sử của vùng Đông Nam Á văn hóa, chứ hoàn toàn không phải là những cư dân di cư từ phương Bắc tới. Đây là một quan điểm đúng đắn về lịch sử dân tộc Việt, là kết quả nghiên cứu dựa trên sự tìm hiểu nguồn gốc ngôn ngữ của người Việt trong sự so sánh với ngôn ngữ các dân tộc ở gần, tức dựa trên các nguyên tắc có căn cứ khoa học tin cậy của ngôn ngữ học lịch sử và so sánh (Historical-Comparative Linguistics). 

Kết luận trên cho thấy dân tộc Việt được hình thành trên mảnh đất này từ khoảng hơn 20 nghìn năm trước. Có thể là, theo thuyết “Đi khỏi châu Phi” (Out of Africa), trước đó tổ tiên ta từ châu Phi di cư tới đây. Năm 1923, nhà khảo cổ Madeleine Coloni phát hiện di cốt người Việt cùng nền văn hóa của họ trong hang đá ở tỉnh Hòa Bình, các di vật này có niên đại 18.000 năm trước CN. Hiện nay Trung tâm Nghiên cứu Tiền sử Đông Nam Á của tiến sĩ Nguyễn Việt vẫn tiếp tục khai quật các di vật nền Văn hóa Hòa Bình lưu lại.4 

Lịch sử lâu đời giúp cho người Việt có đủ thời gian tạo được một ngôn ngữ chín muồi, cực giàu âm tiết (syllable). So với Hán ngữ, tiếng Việt có số âm tiết cơ bản nhiều gấp 10 lần, số âm tiết chi tiết gấp 14 lần.5, 6, 7. Ưu thế đó làm cho tiếng Việt trở nên vững bền không dễ bị đồng hóa bởi các ngôn ngữ nghèo ngữ âm như Hán ngữ. 

Thiển nghĩ, kết luận người Việt “hoàn toàn không phải là cư dân di cư từ phương Bắc tới” cho thấy dân tộc ta thời cổ không có quan hệ gần gũi với các dân tộc ở phía Bắc biên giới Trung-Việt, với nhóm bộ tộc gọi là “Bách Việt”, chẳng những về địa lý ở xa cách họ mà về ngôn ngữ hoàn toàn không chung nguồn gốc: ngôn ngữ các tộc đó đều thuộc ngữ hệ khác ngữ hệ của tiếng Việt. Có thể suy ra người Việt nguyên thủy sống ở vùng núi Sơn La-Hòa Bình-Thanh Hóa, về sau các bộ tộc người Kinh di chuyển dần xuống vùng trung du Yên Bái, Phú Thọ, trong khoảng 2.000 năm gần đây di chuyển xuống vùng châu thổ sông Hồng – vùng đất hình thành bởi sự bồi đắp của con sông này, như quan điểm của các nhà khoa học Lê Bá Thảo, Trần Trí Dõi…8. Riêng các bộ tộc người Mường anh em gần nhất của người Kinh thì vẫn ở lại vùng núi.

Cần nhấn mạnh, việc người Việt dùng chữ Hán nhưng không nói tiếng Hán đã mang lại kết quả tất nhiên là tuy văn hóa Việt trong hơn 1000 năm Bắc thuộc từng bị Hán hóa dai dẳng, nhưng tiếng Hán vẫn không thể đồng hóa được ngôn ngữ của người Việt. Nhờ giữ được nguyên vẹn tiếng mẹ đẻ mà dân tộc cùng quốc gia này tồn tại đến ngày nay – đây là thắng lợi vĩ đại nhất trong lịch sử dân tộc Việt Nam. Ai cũng biết văn hóa Hán có sức đồng hóa rất mạnh. Ví dụ dân tộc Mãn từng chiếm đóng cai trị Trung Quốc 276 năm, mới đầu họ ra sức Mãn hóa ngôn ngữ và văn hóa của người Hán, nhưng chỉ sau một thế kỷ, chính họ lại bị Hán hóa, toàn bộ dân tộc Mãn chỉ nói tiếng Hán, dùng chữ Hán. 

Thời Bắc thuộc có nhiều người Bách Việt (chủ yếu là binh lính) sang Việt Nam định cư, ngôn ngữ của họ có tác động đến kết quả phiên âm chữ Hán, tức từ Hán-Việt. Ví dụ chữ Hán  学习 tiếng Quảng Đông đọc “hoọc chập”, từ Hán-Việt là “học tập”, tuy rằng tiếng Bắc Kinh đọc “xuế xí”. Nhưng vì họ nhanh chóng bị Việt Nam hóa (lấy vợ Việt, con cháu nói tiếng Việt) cho nên ảnh hưởng của ngôn ngữ Bách Việt đối với tiếng Việt hầu như không có gì đáng kể.

Tóm lại, tiếng Việt là ngôn ngữ gần gũi nhất với Hán ngữ và chịu ảnh hưởng lớn của Hán ngữ nhưng lại không cùng nguồn gốc với Hán ngữ và không bị Hán hóa cho dù Việt Nam từng là quận huyện của Trung Quốc trong hơn 1000 năm. Chẳng rõ còn có dân tộc nào khác từng làm được điều kỳ diệu tương tự? □

——

Ghi chú:

1 Trần Trí Dõi: “Lịch sử ngôn ngữ người Việt – Góp phần tìm hiểu văn hóa Việt Nam”, Nxb ĐHQGHN, 2022.

2 Joseph Simon Theurel, 1829-1868, người Pháp, Giám mục Giáo phận Hà Nội 1859-1868. Nhà thờ Kẻ Sở ở thị trấn Kiện Khê, Hà Nam thuộc Giáo phận Hà Nội là một trong bốn nhà thờ được gọi là Vương cung Thánh đường.

3 梁庭望: 骆越方国研究》民族出版社, 2017年.. Đây là quan điểm riêng của nhóm Lương Đình Vọng.

4 “Văn hóa Hòa Bình: Nền văn hóa tiền sử độc đáo”. Báo Điện tử Chính phủ, 30/8/2023.

5 Nguyễn Quang Hồng: “Âm tiết và loại hình ngôn ngữ”, Nxb ĐHQG Hà Nội, 1995.
6. 苏培成: “二十世纪的现代汉字研究”, 书海出版社, 2001年.

7 Nguyễn Hải Hoành: “Một vài tìm tòi về ngôn ngữ”, tạp chí Tia Sáng số 11/2020.

8 Li Tana: “A Historical Sketch of the Landscape of the Red River Delta” Cambridge University Press, 2016

Tác giả

(Visited 554 times, 3 visits today)