'Thung lũng vỡ mộng AI'

Được đầu tư hàng núi tiền nhưng các mô hình ngôn ngữ lớn bắt đầu bộc lộ giới hạn và đang trượt xuống “thung lũng vỡ mộng AI”.

Giới công nghệ phát triển AI đang hướng đến các mô hình AI chuyên dụng, "nhỏ nhưng tinh" cho các tác vụ cụ thể.

Giấc mơ siêu trí tuệ

Hãy thử tưởng tượng tất cả chúng ta đều có một đội ngũ chuyên gia cao cấp tư vấn ngay lập tức về mọi vấn đề, từ nghỉ ngơi giải trí, khám chữa bệnh đến nghiên cứu, học tập, đầu tư và sản xuất kinh doanh... Một xã hội như thế chắc sẽ vô cùng thịnh vượng vì hầu như tất cả mọi người đều sống và làm việc theo cách tối ưu. Tất nhiên cũng không loại trừ khả năng có những kẻ sẽ sử dụng các giải đáp tối ưu đó để gây ra các thảm họa cho xã hội, thậm chí tội ác, chiến tranh...

Câu chuyện tưởng như hoang đường đó đang là động lực phát triển cho một hướng chính trong cuộc cách mạng trí tuệ nhân tạo (AI): nghiên cứu và phát triển trí tuệ nhân tạo tổng quát (artificial general intelligence - AGI).

Hồi tháng 8 năm ngoái, trong lễ ra mắt GPT-5 của OpenAI, CEO của công ty, Sam Altman cho rằng mô hình này có thể tương đương với AGI. "Thật tuyệt vời khi bạn có một đội ngũ chuyên gia trình độ tiến sĩ luôn sẵn sàng trong tầm tay, bất cứ lúc nào bạn cần, để làm bất cứ điều bạn muốn", Sam tự tin.

Các đối thủ chính của OpenAI như Anthropic, hay các ông lớn Google, Microsoft, Meta ... từ lâu đã theo đuổi mục tiêu này. Cũng chính nhờ tham vọng này, họ đã tạo ra những công nghệ đang thay đổi cách hàng trăm triệu người tìm kiếm thông tin, sáng tạo nghệ thuật và lập trình máy tính cũng như nhiều lĩnh vực khác. Các ông lớn công nghệ đều dự đoán sẽ có AGI vào 2025 – 2026, một số người thậm chí còn cho rằng, một khi AGI được tạo ra, một thực thể mạnh mẽ hơn nữa gọi là "siêu trí tuệ" sẽ ra đời sau đó.

Kết quả thực tế

Khi Sam Altman cho biết GPT-5 mang đến khả năng suy luận chưa từng có, khả năng lập trình ở một tầm cao mới, cho phép người dùng mô tả bằng ngôn ngữ thường ngày và mã lập trình xuất hiện ngay trước mắt, cả thế giới đều dõi theo buổi ra mắt của GPT-5.

Yann Dubois, người thực hiện bản trình diễn đã yêu cầu GPT-5 viết mã cho một web dạy học tiếng Pháp, với yêu cầu ứng dụng đó phải bao gồm học từ vựng, các bài kiểm tra và một trò chơi tương tác trong đó người dùng điều khiển một con chuột đuổi theo một miếng pho mát, mỗi lần ăn một miếng là phát ra một từ vựng.

Các nhà báo tham gia buổi trình diễn chứng kiến GPT-5 suy nghĩ 14 giây, sau đó tạo ra hàng trăm dòng mã. Dubois nhấp vào nút "run" và một trang web ứng dụng vui nhộn hiện ra với các tính năng được yêu cầu. Dubois cho biết GPT-5 vượt trội, không chỉ trả lời câu hỏi mà còn thay mặt người dùng đưa ra quyết định công cụ nào cần sử dụng để hoàn thành nhiệm vụ, ít "lạc đề" trong quá trình thực hiện nhiệm vụ dài và khả năng khắc phục lỗi tốt hơn.

Altman hồ hởi thông báo "Đây rõ ràng là một mô hình có thuộc tính của AGI", hay tự tin rằng "chúng ta biết cách xây dựng AGI và trong năm 2025 các công cụ hỗ trợ AI (hay còn gọi là AI Agent) sẽ làm thay đổi đáng kể hiệu quả hoạt động của các công ty sử dụng AI".

Tuy nhiên, thực tế không như kỳ vọng. Chỉ vài giờ sau khi ra mắt, các nhà chuyên môn đã phát hiện ra đủ loại lỗi khó hiểu: Nó không giải được một số bài toán đơn giản, không thể đếm chính xác và đôi khi đưa ra những câu trả lời vô lý cho những câu hỏi cũ. Giống như các phiên bản trước đó, mô hình AI này vẫn mắc lỗi "ảo giác" hay "lạc đề" (mặc dù với tỷ lệ thấp hơn). Không ai tin rằng đó là AGI.

"Bong bóng" AI

Không chỉ có GPT-5 bị chê. Một báo cáo gần đây của Viện Công Nghệ Massachusetts (MIT) cho thấy 95% các ứng dụng AI tạo sinh (generatic AI) trong môi trường kinh doanh đều tạo ra "lợi nhuận bằng không". Báo cáo này đã làm gây ra hiệu ứng tâm lý lớn đến mức dẫn tới một đợt bán tháo cổ phiếu công nghệ, dù giá cổ phiếu sau đó đã ổn định trở lại.

Liệu AI có đang tới giai đoạn thất vọng?

Gần đây nhiều chuyên gia có cái nhìn thực tế đã bác bỏ các tuyên bố cho rằng máy móc sẽ sớm sánh ngang với trí tuệ con người. AGI bùng nổ mạnh mẽ do truyền thông thổi bong bóng, và giờ đây đang trượt xuống ‘thung lũng vỡ mộng’.

Theo Nick Frosst, người sáng lập công ty khởi nghiệp AI Cohere, "công nghệ mà chúng ta đang xây dựng ngày nay không đủ để đạt được AGI. Chúng ta đang xây dựng các hệ thống dựa vào đầu vào là các từ ngữ để rồi dự đoán từ nào có khả năng xảy ra tiếp theo nhất, hoặc nhận đầu vào là các điểm ảnh của các tấm hình và dự đoán điểm nào có khả năng xảy ra tiếp theo nhất. Điều đó rất khác với cách một người có trí tuệ như bạn và tôi suy nghĩ và làm việc".

Trong một cuộc khảo sát gần đây của Hiệp hội Phát triển Trí tuệ Nhân tạo, một tổ chức học thuật 40 năm tuổi bao gồm các nhà nghiên cứu được kính trọng nhất trong lĩnh vực này, hơn ba phần tư số người được hỏi cho biết các phương pháp được sử dụng để xây dựng công nghệ hiện nay khó có thể dẫn đến AGI.

Hơn nữa, các nhà khoa học không có bằng chứng chắc chắn nào cho thấy các công nghệ hiện nay có khả năng thực hiện ngay cả một số việc đơn giản mà bộ não con người có thể làm, chẳng hạn như nhận biết sự mỉa mai hay cảm nhận sự đồng cảm.

Con người biết cách đối phó với một thế giới hỗn loạn và luôn thay đổi. Máy móc gặp khó khăn trong việc xử lý những điều không giống với những gì đã xảy ra trong quá khứ. Con người có thể tưởng tượng điều mà thế giới chưa từng thấy. Máy móc thường chỉ lặp lại hoặc cải tiến những gì chúng đã thấy trước đây.

Hiệu quả thực sự của các mô hình ngôn ngữ lớn

GPT-5 là một bước tiến, nhưng vẫn còn rất xa so với cuộc cách mạng trí tuệ nhân tạo mà nhiều người kỳ vọng. Đây là tin xấu đối với các công ty AI ở Mỹ và nhà đầu tư đã đặt cược lớn vào công nghệ này. Và điều đó đòi hỏi phải xem xét lại các chính sách và khoản đầu tư, cả công lẫn tư, vốn được xây dựng dựa trên những kỳ vọng quá mức như thế.

Theo nhiều chuyên gia, chiến lược phát triển AI ở Mỹ chỉ hướng tới xây dựng các mô hình có quy mô ngày càng lớn hơn là sai lầm nghiêm trọng, đã đặt quá nhiều niềm tin vào một giả thuyết mang tính suy đoán và chưa được chứng minh. Chiến lược này gọi ngắn gọn là "Scaling Rule (Qui luật về Quy mô)" dựa trên ý tưởng cho rằng việc huấn luyện các mô hình AI với qui mô dữ liệu ngày càng lớn và sử dụng ngày càng nhiều phần cứng cuối cùng sẽ dẫn đến trí tuệ nhân tạo tổng quát hoặc thậm chí là siêu trí tuệ vượt trội hơn con người.

Chính vì niềm tin này mà các công ty AI ở Mỹ đã đổ hàng trăm tỷ USD để xây dựng các trung tâm dữ liệu và các hệ thống siêu máy tính xử lý dữ liệu với hy vọng đạt được AGI trong thời gian sắp tới. Chỉ riêng trong năm 2025 các công ty như Meta, Google, Microsoft, Amazon đã chi hơn 320 tỷ USD cho xây dựng các data center cho AI. Năm 2026 này chỉ riêng 5 công ty Microsoft, Amazon, Google, Meta và Oracle đã thông báo họ sẽ chi khoảng 700 tỷ USD cho các trung tâm dữ liệu AI.

Việc đổ tiền vào các mô hình AI có quy mô khổng lồ đang gây ra vấn đề nghiêm trọng về hạ tầng cơ sở. Chỉ tính trong năm 2025 các trung tâm dữ liệu ở Mỹ đã tiêu thụ hơn 250 nghìn triệu kWh (TWh) và ước tính tăng đến 426 TWh năm 2030 (để tiện so sách, năm 2025 Việt Nam tiêu thụ ước tính khoảng 290-354 TWh).

Theo nhiều chuyên gia AI, việc mở rộng quy mô đã đem lại hiệu quả trong một thời gian và đạt được những tiến bộ ấn tượng. Nhưng vận may bắt đầu kết thúc. Các mô hình ngôn ngữ lớn, vốn là nền tảng của các hệ thống như GPT-5, chẳng qua chỉ là những cỗ máy tái tạo dữ liệu có tính thống kê, vì vậy chúng sẽ tiếp tục gặp phải các vấn đề liên quan đến sự thật, ảo giác và khả năng suy luận. Việc mở rộng quy mô lớn hơn nữa sẽ không đưa chúng ta đến được mục tiêu tối thượng AGI.

Chẳng hạn, hệ thống trí tuệ nhân tạo Grok 4, được phát hành vào tháng 7/2025, có lượng dữ liệu huấn luyện gấp 100 lần so với Grok 2, nhưng chỉ tiến bộ hơn một chút. Mô hình Llama 4 khổng lồ của Meta, lớn hơn nhiều lần so với phiên bản trước đó, cũng bị coi là một thất bại, và GPT-5 cũng cho thấy rõ ràng rằng việc mở rộng quy mô đã không còn hiệu quả nữa.

Đại kiện tướng Garry Kasparov đang thi đấu và bị đánh bại bởi máy tính Deep Blue của IBM. — Các AI chuyên dụng đặc biệt hiệu quả, đơn cử như Deep Blue của IBM đánh bại đại kiện tướng Kasparov. Nguồn ảnh: britannica

AI chuyên dụng đặc biệt hiệu quả

Những kết quả theo hướng AGI không mấy khả quan gần đây không làm cho các tỷ phú công nghệ chùn bước trong giấc mơ chinh phục AGI và ‘siêu trí tuệ’. Mối quan tâm và lo ngại về AI thể hiện trong những lần thị trường chứng khoán công nghệ chao đảo gần đây.

Theo nhiều chuyên gia nếu muốn khai thác triệt để sức mạnh của AI, ngành công nghệ nên ngừng tập trung quá nhiều vào những công cụ AI tổng quát phù hợp với mọi đối tượng, mà thay vào đó tập trung vào các công cụ AI chuyên dụng, "nhỏ nhưng tinh" được thiết kế để giải quyết những vấn đề cụ thể. Đó mới thực sự là sức mạnh của AI.

Hãy lấy cờ vua làm ví dụ. Nếu bạn yêu cầu một mô hình ngôn ngữ lớn như ChatGPT hoặc tương tự chơi một ván cờ vua, nó sẽ chơi một cách khó khăn và thường xuyên đi sai luật. Các mô hình AI tổng quát này dường như không bao giờ nắm bắt đầy đủ luật chơi, ngay cả sau khi tiếp xúc với một lượng vô cùng lớn dữ liệu về cờ vua.

Ngược lại, các chương trình chuyên dụng cho cờ vua được lập trình ngay từ đầu để tuân theo một bộ quy tắc được xây dựng dựa trên các khái niệm cốt lõi như cấu trúc bàn cờ và các nước đi khả thi, có thể dễ dàng đánh bại ngay cả những người chơi lão luyện nhất. Tiêu biểu như trường hợp Deep Blue của IBM đánh bại đại kiện tướng, vô địch cờ vua Kasparov năm 1997.

Hay như chương trình AlphaFold do nhóm DeepMind của Google xây dựng, dùng máy học để phân tích dữ liệu và dự đoán cách protein gấp lại - bước cực kỳ quan trọng trong nghiên cứu y sinh. Nhiều nhà khoa học thường xuyên sử dụng AlphaFold để phát triển thuốc mới và nghiên cứu các con đường phân tử trong não. Hơn 200 triệu protein đã được phân tích, hy vọng sẽ mang đến các loại thuốc mới và những tiến bộ trong nông nghiệp.

Xe tự lái của công ty Waymo cũng sử dụng các hệ thống AI được huấn luyện kỹ lưỡng với các thiết bị và phần mềm chuyên dụng cho các mục đích cụ thể, chẳng hạn như phát hiện vật thể, tích hợp dữ liệu hình ảnh từ nhiều cảm biến, nắm bắt rõ môi trường xung quanh và ra những quyết định kịp thời. Với kiến trúc cốt lõi của hệ thống lái xe tự động đã được tích hợp sẵn, AI chuyên dụng của Waymo có thể học hỏi và cải thiện khả năng lái xe hiệu quả hơn nhiều so với cách hoạt động của các mô hình ngôn ngữ lớn theo hướng AGI.

Điều quan trọng là hệ thống này cũng như các hệ thống AI chuyên dụng khác (không phải là AGI) được xây dựng để chỉ giải quyết một vấn đề cụ thể, và nó giải quyết cực kỳ hiệu quả.

Việc chuyển hướng không có nghĩa là các nhà nghiên cứu từ bỏ việc theo đuổi AGI. AGI vẫn đóng một vai trò hữu ích và quan trọng trong một số nhiệm vụ, chẳng hạn như lập trình máy tính, tổng hợp phân tích dữ liệu và dịch thuật ...

Tuy nhiên, nhân loại sẽ được phục vụ tốt hơn nếu các công ty và chính phủ dành nhiều nguồn lực hơn cho việc xây dựng các công cụ chuyên biệt cho khoa học, y học, công nghệ và giáo dục. Đó có lẽ là điểm thay đổi mấu chốt cần phải được thực hiện thay vì vẫn đổ hàng núi tiền cho phát triển AGI như hiện nay.

---

Tài liệu tham khảo

‘Why We’re Unlikely to Get Artificial General Intelligence Anytime Soon’ New York Times, 16/05/2025. www.nytimes.com/2025/05/16/technology/what-is-agi.html
OpenAI Launches GPT-5, the Next Step in Its Quest for AGI spectrum.ieee.org/openai-gpt-5-agi
‘Welcome to the AI trough of disillusionment’, The Economics May 21st 2025. https://www.economist.com/business/2025/05/21/welcome-to-the-ai-trough-of-disillusionment
Silicon Valley Is Investing in the Wrong AI, New York Times, 03/09/2025. https://www.nytimes.com/2025/09/03/opinion/ai-gpt5-rethinking.html

Trở lại Khoa học - Công nghệTrở lại Khoa học - Công nghệ