AI nhỏ nhưng tinh: Hướng đi khả thi cho Việt Nam

Các mô hình ngôn ngữ lớn (LLM) càng ngày càng phình to, lên đến hàng nghìn tỷ biến số, với tham vọng "nuốt chửng kiến thức của toàn thế giới". Việt Nam có thể, và có chỗ đứng nếu chạy đuổi theo những mô hình "AI to" như vậy không?

Sự đồ sộ của các mô hình LLM khiến rất nhiều người tin là AI cái gì cũng biết, cái gì cũng hỏi AI, AI nói sai cũng tin, đôi khi gây ra hậu quả tai hại. Đã có những quyển sách khoa học do ChatGPT viết, với các trích dẫn không có thật được ChatGPT bịa ra. Thậm chí có những người khi gặp khủng hoảng tinh thần, hỏi AI thì AI khuyên nên tự tử, thế là tự tử chết thật. Trong y tế thì từ khi có LLM các trang mạng thông tin nghiêm túc về y tế bị ế vì dân tình đi hỏi những thứ như ChatGPT thay vì tra cứu các trang đó, và thế là họ hay nhận được những thông tin sai lệch, rất nguy hiểm.

Nguyên nhân nằm ở cấu trúc và cách học của các mô hình ngôn ngữ hiện tại dựa trên xác suất chứ không dựa trên kiến thức có đảm bảo và suy luận chặt chẽ. Nên các mô hình ngôn ngữ rất "dẻo mồm" nhưng cũng rất dễ "râu ông nọ cắm cằm bà kia", khả năng nói nhảm (hallucination) cao, nhất là khi đi vào cách lĩnh vực chuyên môn. Một lần tôi thử kiểm tra MedGemma của Google (một mô hình VLM – ngôn ngữ hình ảnh lớn, dành cho y tế) cho các ảnh bệnh về da thì kết quả là có trên 90% các trường hợp là nói sai, đặc biệt khi gặp phải các bệnh hơi hiếm, chỉ đúng khi gặp trường hợp phổ biến của bệnh phổ biến.

Thế giới cần có những mẫu hình (paradigm) AI đa dụng mới tốt hơn, đáng tin hơn là LLM. Đây là một cuộc chơi mới mà Việt Nam hoàn toàn có thể tham dự. Giáo sư Yann LeCun, một trong những người đi đầu trong lĩnh vực học sâu, cũng đã bỏ Meta để lập công ty nghiên cứu những hướng mới này.

Mặt khác, thế giới rất cần phát triển nhiều AI chuyên dụng cho rất nhiều lĩnh vực khác nhau, có độ tin tưởng cao hơn nhiều so với AI đa dụng. Những AI chuyên dụng này thường có kích thước nhỏ, có cấu trúc mạng thần kinh, dữ liệu để học và cách huấn luyện phù hợp nhất với vấn đề mà nó giải quyết, là những thứ mà AI đa dụng không làm được.

Tương lai của một "trợ thủ AI biết tất" sẽ không nằm ở những LLM to tướng, mà ở những mô hình đa dụng khác không nhất thiết phải to, mà có thể nhỏ có logic tốt hơn, hiểu các khái niệm chính xác hơn, biết kết nối đến các AI chuyên dụng thích hợp nhất khi gặp từng vấn đề. Trí tuệ "siêu việt" sẽ không phải là một trí tuệ tập trung nằm ở một nơi, mà là một mạng rất rộng các trí tuệ chuyên gia cho từng lĩnh vực khác nhau, kết nối vào với nhau, ai có vấn đề về lĩnh vực nào có thể gọi ngay đến chuyên gia lĩnh vực đó. Việt Nam có khả năng làm ra nhiều AI chuyên dụng tham gia vào mạng trí tuệ siêu việt phi tập trung này.

Ứng dụng AI trong chẩn đoán ngày càng mở ra cơ hội điều trị bệnh ở Việt Nam. Ảnh: Nhóm nghiên cứu của TS. Hà Thị Thanh Hương (bìa phải) cùng các cộng sự trong phòng thí nghiệm để nghiên cứu sử dụng AI giúp chẩn đoán Alzheimer.

"Nhỏ là đẹp", và những xu hướng mới

Trong cuộc cách mạng tin học từ mấy chục năm trước đã có khái niệm nhỏ là đẹp, tức là các chương trình phần mềm nhỏ gọn, có thể chạy trên các máy nhỏ, tiết kiệm chi phí phần cứng, nhiều khi có giá trị hơn nhiều so với các chương trình cồng kềnh.

Khi công suất tính toán tăng nhanh, nhu cầu nhỏ là đẹp giảm đi, người ta ít quan tâm tối ưu hóa dung lượng của các phần mềm, mà quan tâm nhiều hơn đến việc làm sao để tạo ra nhanh các phần mềm với chi phí thấp, và muốn làm nhanh, làm rẻ thì không thể làm nhỏ đẹp được mà chỉ làm sao cho nó chạy được thôi. Trừ một số vấn đề chuyên dụng như là phần mềm nhúng, gài trong các chip nhỏ, bắt buộc phải làm nhỏ.

Thời nay, vấn đề nhỏ là đẹp lại được đặt ra, khi mà các trung tâm điện toán đám mây chạy LLM ngốn quá nhiều năng lượng của thế giới, hơn tổng sản lượng điện của cả một quốc gia lớn, khiến người ta phải nghĩ đến xây hàng loạt nhà máy điện nguyên tử để phục vụ AI, và khối năng lượng khổng lồ đó để phục vụ AI cũng biến thành nhiệt làm hại môi trường.

Các mô hình AI nhỏ (small model) sẽ ngày càng được quan tâm hơn các mô hình lớn (large model). Mô hình nhỏ. ngoài chuyện tiếp kiệm năng lượng, còn có ưu thế là chạy được tại chỗ (ở máy tính bàn. điện thoại. vv) chứ không cần chạy trên đám mây, tăng tính an toàn và giá trị sử dụng cho người dùng.

Mạng thần kinh tiết kiệm (frugal/parcimonious) cũng là một xu hướng rất quan trọng. Các nạng này còn nhỏ hơn nhiều lần so với các mô hình nhỏ vừa kể trên. Một điều thú vị là mạng quá to thì chỉ học vẹt còn mạng nhỏ thì mới dễ học các quy luật hơn, nên các mạng này đặc biệt quan trọng với những vấn đề liên quan đến vật lý hay logic.

Nhưng mạng cố định về cấu trúc thì khó học, mà mạng phải được phép thay đổi cấu trúc (như trong não động vật, phải cho phép các tế bào thần kinh và các đường dây nối chúng sinh ra và mất đi) thì mới dễ học được các qui luật. Cách học và cách tạo mạng thần kinh của các mạng tiết kiệm này bởi vậy cũng khác các mạng như kiểu mạng tích chập (CNN) hay mạng Transformer (dùng trong chatGPT) phổ biến hiện tại.

Ngoài ra còn nhiều xu hướng mới khác trong AI, mà các trung tâm nghiên cứu phát triển AI ở Việt Nam cũng như trên thế giới cần nắm bắt.

Hợp tác và mã nguồn mở

Khi nguồn lực còn hạn chế, hợp tác là điều kiện để tồn tại và đi nhanh hơn.

Ví dụ, về dữ liệu cho AI học, đừng kỳ vọng rằng chỉ cần dữ liệu do một cơ sở nào đó (ví dụ như một bệnh viện) sinh ra là đủ để làm một AI tốt. Muốn có AI tốt thì cần dữ liệu rất phong phú, đa dạng, từ nhiều nguồn khác nhau. Mỗi nơi có một ít dữ liệu mà cứ dữ khư khư sợ "mất của" như hiện tại thì không kết hợp được các dữ liệu đó thành một kho dữ liệu đủ lớn, đủ phong phú. Nhưng tất nhiên chia sẻ dữ liệu phải đi cùng với cơ chế tốt để các bên không cảm thấy bị thiệt thòi.

Có lần tôi nói chuyện với một bác sĩ, tích lũy cả đời được khoảng 20.000 dữ liệu, và nghĩ là như thế là đủ huấn luyện AI chẩn đoán bệnh. Tuy con số 20 nghìn dữ liệu là rất lớn so với cá nhân, nhưng so với thế giới thì chỉ là muối bỏ bể, và AI trong lĩnh vực của bác sĩ cần đến hàng triệu dữ liệu để huấn luyện.

Về mặt thuật toán, mã nguồn mở là một cách hợp tác tốt nhất để phát triển nhanh. Mã nguồn mở tạo được niềm tin cao hơn là mã nguồn đóng, thu hút được nhiều người quan tâm phát triển và nhiều người dùng hơn, tạo nên hệ sinh thái tốt hơn, đem lại nhiều giá trị cho xã hội hơn và nhờ vậy cũng đem lại nhiều giá trị cho người tạo ra sản phẩm hơn. Chính phủ nên có các chính sách nhằm khuyến khích mã nguồn mở.

Trung Quốc rất chú trọng áp dụng mã nguồn mở trong cuộc cạnh tranh với Mỹ về AI. Công ty khởi nghiệp Mistral ở Pháp cạnh tranh với OpenAI cũng đi theo hướng mã nguồn mở, cũng đã có giá trị hàng tỷ đô la, và thu tiền chủ yếu từ dịch vụ cho các tổ chức cần chủ quyền cao về AI.

Hạ tầng cho AI

Khi nói đến hạ tầng cơ sở cho AI, người ta hay nói đến các trung tâm điện toán đám mây hiệu suất cao và trung tâm dữ liệu. Trong dự thảo luật về AI của chính phủ năm 2025 cũng nhấn mạnh ưu tiên điện toán đám mây, là các trung tâm tính toán dùng nhiều GPU, tức là các bộ "vi xử lý hình ảnh" mà tác dụng chính nằm ở khả năng tính toán song song rất nhiều phép tính cùng một lúc của chúng.

Không nên mua ngay quá nhiều bộ vi xử lý GPU như kiểu của NVIDIA làm gì, cần đến đâu mua đến đấy thôi, bởi vì sắp tới sẽ xuất hiện nhiều bộ vi xử lý song song khác nữa, ví dụ như kiểu TPU (tensor processing unit), mạnh hơn và rẻ hơn, hoặc thậm chí tương lai còn hứa hẹn những máy tính lượng tử nhanh gấp bội lần.

Nói đến hạ tầng cơ sở cho điện toán và AI, chúng ta không nên quên sức mạnh của tính toán phi tập trung (distributed computing): nhiều trung tâm máy tính nhỏ nằm ở nhiều nơi nối vào với nhau có thể tạo thành hệ thống mạnh hơn và an toàn hơn là một vài trung tâm lớn quá tập trung. Điều này thế giới đã nhận thấy khi xảy ra những sự cố sập mạng dẫn đến phần lớn các khách hàng của AWS hay Google Cloud bị mất dịch vụ trong khi những mạng lưới phi tập trung vẫn hoạt động tốt.

Khuyến khích mạng phi tập trung cũng có nghĩa là nên khuyến khích nhiều công ty, tổ chức, cá nhân tham gia vào hạ tầng AI chứ không nên chỉ trông cậy vào vài "ông lớn". Tương tự như vấn đề năng lượng: một mạng điện phi tập trung với nhiều nguồn phát rải rác khắp nơi sẽ không những giảm thiểu tiêu tốn điện trên đường tải mà còn đỡ rủi ro mất điện hơn là một mạng quá tập trung.

Có một điểm rất quan trọng khác không thể coi nhẹ, đó là hệ thống truyền tin, tức là hệ thống telecom. Tầm quan trọng của nó cũng tương tự tầm quan trọng của hệ thống giao thông trong nền kinh tế nói chung.

Trong nhiều vấn đề thực tế dùng AI trên "đám mây", nút thắt cổ chai không nằm ở bản thân AI trên đám mây mà là ở đường tải: thời gian để tải dữ liệu từ người dùng lên đám mây, đặc biệt là những dữ liệu có dung lượng lớn như phim ảnh, lớn gấp nhiều lần thời gian mà AI xử lý dữ liệu đó. Mấu chốt để tăng tiện ích cho người sử dụng khi đó là làm sao tăng được vận tốc đường truyền.

Thế giới phát triển nhiều giải pháp cho đường truyền cao tốc, từ cáp quang cho đến 5G/6G cho đến hệ thống vệ tinh tầng thấp như là Starlink, và gần đây hơn là các khinh khí cầu truyền tin (communication balloons) hứa hẹn nhanh và rẻ hơn các hệ thống phi tuyến khác.

Tốc độ truyền tải càng nhanh thì AI đám mây càng trở nên tiện lợi, càng có nhiều ứng dụng AI trở nên hữu ích, và sẽ càng thu hút được nhiều tài năng về AI đến Việt Nam làm việc.

Cách mạng AI sẽ thay đổi căn bản giáo dục

Cuộc cách mạng AI sẽ không thể thành công nếu không đi kèm một cuộc cách mạng giáo dục. Chúng ta đang bước vào thời đại Giáo dục 4.0.

Giáo dục 1.0 là thời cổ xưa không có trường lớp, chỉ có con nhà giàu mới có gia sư, còn phần lớn nhân dân là mù chữ.

Giáo dục 2.0 là khi có trường lớp, sách in, và hầu hết trẻ em được đi học.

Giáo dục 3.0 là khi có thể học online, ngồi ở Huế mà nghe bài giảng ở Stanford nhờ có internet, lượng kiến thức và giáo viên tốt mà mọi người có thể tiếp cận lớn hơn nhiều so với khi chưa có internet.

Giáo dục 4.0 là khi từng bài học, từng chương trình học đượccá nhân hóađể thích hợp nhất, tốt nhất đối với từng cá nhân, nhờ có AI. Con người sẽ có điều kiện học nhiều hơn để trở nên hiểu biết thông tuệ hơn, học mọi lúc mọi nơi, học suốt đời.

Ví dụ, khi một cô giáo giảng bài cho một lớp học thì sẽ có học sinh hiểu học sinh không, có học sinh thấy quá khó có học sinh thấy quá dễ, v.v., và cô giáo không thể thích ứng bài giảng của mình với tất cả các học sinh của cùng một lớp, không có đủ thời gian hướng dẫn từng học sinh. Nhưng AI có thể giúp cô giáo và học sinh nâng hiệu quả giảng dạy và học tập lên nhiều lần.

Cuộc cách mạng AI sẽ tất yếu dẫn đến cuộc cách mạng lớn trong giáo dục, Các học tập, thi cử, lấy chứng chỉ v.v. sẽ thay đổi hoàn toàn. Không có nghĩa là trường lớp, thầy cô sẽ mất vị trí, mà chỉ có nghĩa là cách hoạt động sẽ khác đi.

Đối với Việt Nam, đây cũng là cơ hội lớn để đầu tư phát triển những sản phẩm giải pháp giáo dục dựa trên AI nhằm phục vụ Việt Nam và toàn thế giới. Thị trường giáo dục thế giới không phải tính bằng đơn vị tỷ đô, mà là đơn vị ngàn tỷ đô, và phần lớn thị trường đó đang rộng mở hoặc đang mở ra./

Điều kiện để làm AI thành công

Các công cụ để chế tạo AI ngày nay (như là các môi trường luyện AI, hay các mô hình đã học trước – "pretrained") trên thế giới có sẵn nhiều, ai cũng có thể đem chúng về dùng, khiến cho nhiều vấn đề AI được cho là dễ quá, cứ dùng các công cụ có sẵn luyện thêm một chút là giải quyết được. Có những trung tâm dạy nghề quảng cáo chỉ cần học 3 tháng là làm được AI. Tương tự như khi có máy đánh chữ thì ai cũng nghĩ mình có thể thành nhà văn.

Trên thực tế, để làm ra những AI có chất lượng cao và được tin dùng là việc khó, và danh sách những lý do thất bại thì rất dài:

– Lãnh đạo thiếu khả năng quản lý, không đủ tầm nhìn

– Làm ra cái rất hay nhưng không đúng cái thị trường cần

– Sản phẩm không đủ hấp dẫn để có sức cạnh tranh

– Thiếu kiến thức chuyên ngành

– Nguồn tài chính không đủ, nửa đường đứt gánh

– Nhân viên thiếu trình độ, làm không ra sản phẩm

– Mâu thuẫn nội bộ

– Gặp rắc rối về mặt pháp lý

– Bị đối tác quan trọng bỏ rơi

– Phá hoại từ bên ngoài. v.v.

Ai muốn làm AI thành công thì phải chú ý nhận diện được hết những rủi ro trên.

(Kỳ trước: Phát triển AI và nguy cơ lặp lại con đường gia công giá rẻ)

-----

¹Theo số liệu của IMF và World Bank.

Cả hai kỳ của bài viết đã đăng bản in Tia Sáng số 24/2025, với tiêu đề "Việt Nam dựa vào AI của ai, dữ liệu của ai, luật chơi của ai?".

Trở lại Diễn đànTrở lại Diễn đàn