Liam Price không có bằng cấp toán học chính quy, thậm chí chưa từng đặt chân vào giảng đường đại học. Nhưng tháng trước, anh đã tạo ra một bước đột phá mới trong nghiên cứu toán học với sự trợ giúp của ChatGPT.
Tại nhà riêng ở vùng tây nam nước Anh, Price đã dùng công cụ trí tuệ nhân tạo (AI) phổ biến này để giải bài toán Erdős 1196, một trong hơn 1.000 bài toán mà nhà toán học người Hungary Paul Erdős (1913-1996) đã sưu tầm. Điểm đặc biệt so với những trường hợp AI giải toán khác là trong bài toán này, ChatGPT đã sử dụng một phương pháp tiếp cận mới khiến các nhà toán học cũng bất ngờ.
Trong một bài đăng trên mạng xã hội X, nhà toán học Jared Duker Lichtman tại Đại học Stanford (Mỹ) nhận xét rằng sự kiện này giống như việc AI tạo ra một khai cuộc cờ vua mà chưa ai từng nghĩ đến, do chúng ta thường bị ràng buộc bởi thẩm mỹ và quy ước của con người.
Đây chỉ là một trong nhiều kết quả đáng chú ý của AI trong lĩnh vực toán học. Giờ đây, các hệ thống AI không chỉ thực hiện các phép tính thuần túy theo kiểu liên tục thử đến cạn đáp án (brute-force: thường dùng để mô tả các thuật toán kiểm tra tất cả các giải pháp khả thi cho một bài toán cho đến khi tìm ra kết quả chính xác), mà còn có khả năng suy luận logic chặt chẽ - vốn là lĩnh vực chuyên môn của các nhà toán học từ thời Euclid hơn 2.300 năm trước.
Đáng chú ý, nhiều tiến bộ đến từ các hệ thống dựa trên mô hình ngôn ngữ lớn (LLM) đa dụng như GPT, Gemini và Claude vốn không được huấn luyện chuyên biệt về toán học.
ChatGPT đã sử dụng một phương pháp tiếp cận mới khiến các nhà toán học cũng bất ngờ. Ảnh: Canva
Dấu hiệu "tư duy" toán học
Về cơ bản, các mô hình AI vẫn sử dụng các phương pháp giải toán có trong những tài liệu đã dùng để huấn luyện các mô hình. Tuy nhiên, đến bài toán Erdős 1196, các nhà toán học đã phát hiện ra những dấu hiệu "tư duy" độc đáo của các mô hình - AI tìm ra những mối liên hệ bất ngờ giữa các ngành toán. "Điều này thật đáng kinh ngạc," nhà toán học Sébastien Bubeck tại OpenAI nhận xét. "Một năm trước, mọi người còn nghĩ rằng những gì các mô hình ngôn ngữ lớn có thể làm chỉ giới hạn trong phạm vi dữ liệu huấn luyện".
Bubeck và nhiều người khác tin rằng sớm muộn gì các công cụ AI cũng sẽ đạt được những kết quả tương tự, thậm chí là vượt xa các nhà toán học hàng đầu. TS. Lương Minh Thắng, người đứng đầu nhóm nghiên cứu về năng lực suy luận siêu việt của AI tại Google DeepMind chia sẻ: "Tôi hy vọng vào khoảng năm 2030, AI và các nhà toán học có thể cùng nhau giành Huy chương Fields".
Cách tiếp cận sáng tạo
Năm 1966, Erdős đã nêu ra bài toán số 1196 liên quan đến tập hợp các số nguyên mà không số nào trong tập chia hết cho số khác trong cùng tập đó. Những người từng thử giải bài toán này trước đây đều tiếp cận theo hướng lý thuyết xác suất. Trong khi đó, GPT vẫn giữ nguyên hướng tiếp cận ban đầu của bài toán là số học. Theo nhà toán học Terence Tao ở Đại học California, lời giải của GPT đã ngầm thiết lập mối quan hệ giữa số học và xác suất.
Daniel Litt, nhà toán học tại Đại học Toronto (Canada), nhận xét kết quả này "khá thú vị" so với các lời giải của AI trước đó cho các bài toán Erdős. Ông thẳng thắn rằng mình không mấy ấn tượng với những kết quả mà AI đã đạt được trong lĩnh vực toán học hiện nay, đồng thời chỉ trích sự thổi phồng xoay quanh vấn đề này. Nhưng khi nói về tiềm năng tương lai, Litt lại bác bỏ luận điểm của những người hoài nghi năng lực giải toán của AI. Ông còn cho rằng lẽ ra AI phải đạt được những kết quả đột phá hơn bởi kiến thức toán học của các hệ thống này đã vượt qua con người, các hệ thống AI cũng có khả năng suy luận rất mạnh và không mệt mỏi hay chán nản.
"Một điều bí ẩn là chúng ta vẫn chưa hiểu điều gì làm nên năng lực toán học xuất sắc của một nhà toán học", Litt nói, đồng thời cho biết hiện vẫn chưa rõ liệu con người có sở hữu một "bí quyết" nào đó giúp họ có khả năng sáng tạo theo cách riêng mà AI không có hay không.
Nhà toán học Paul Erdős đang xem bài của Terence Tao, khi đó mới 10 tuổi (năm 1985). Ảnh: CC BY-SA 2.0
Con dao hai lưỡi
Cũng như nhiều lĩnh vực khác của AI, việc mở rộng quy mô - đặc biệt là tăng cường năng lực tính toán - cùng với việc cải thiện hiệu quả thuật toán sẽ giúp các mô hình trở nên mạnh hơn. Đơn cử, các mô hình đang được thử nghiệm nội bộ tại Google có thể tạo ra các chứng minh toán học dài hơn, và có thể sẽ sớm đạt mức 10 trang. "Việc tạo ra chứng minh dài 100 trang chưa nằm trong tầm tay của các mô hình AI hiện nay, chúng tôi đang nỗ lực hướng đến mục tiêu này và đã thấy những tín hiệu tích cực", TS. Lương Minh Thắng chia sẻ.
Tuy nhiên, ông cũng nhấn mạnh sự tiến bộ của các mô hình AI sẽ là một "con dao hai lưỡi". Hiện nay, những người phản biện các bài báo trong lĩnh vực toán học đang phải chịu áp lực rất lớn khi kiểm chứng độ chính xác của các bài báo có tác giả là con người. Vì các mô hình AI có thể tạo ra những bài báo trông rất thuyết phục, nhưng nó có thể bỏ sai một vài bước, dùng sai định lý, "ảo giác" khi cùng đầu vào nhưng đầu ra khác nhau, rất mất thời gian và công sức để xác định liệu AI có sai sót hay không.
Cũng giống như các nhà nghiên cứu trong nhiều lĩnh vực khác, các nhà chuyên môn lo ngại về sự bùng nổ của "rác AI" (AI slop).
Nhiều nhà nghiên cứu kỳ vọng các giải pháp công nghệ có thể góp phần giải quyết vấn đề này. Một phương pháp phổ biến là đưa văn bản vào một mô hình ngôn ngữ lớn (có thể là chính mô hình đã tạo ra văn bản đó) và yêu cầu kiểm tra độ chính xác. Chẳng hạn, Price thường đưa lời giải do ChatGPT đề xuất trở lại chatbot này, yêu cầu tự tìm lỗi sai và thử lại cho đến khi xác định kết quả đúng. Hiện nay, nhiều nhà toán học cũng bắt đầu áp dụng cách làm tương tự để kiểm tra các bản thảo.
5 năm tới sẽ ra sao?
Nhóm nghiên cứu của Google đã phát triển một hệ thống AI đa tác nhân chuyên biệt có tên Aletheia, tích hợp một module "kiểm chứng" dành riêng cho các nội dung toán học. Dù hữu ích song các hệ thống AI vẫn bỏ sót nhiều lỗi sai và đôi khi tìm ra những lỗi không tồn tại.
Theo các nhà nghiên cứu, chiến lược hiệu quả hơn là biểu diễn toán học bằng Lean - một ngôn ngữ lập trình để viết chứng minh toán học. Các nhà nghiên cứu có thể sử dụng Lean để biểu diễn và kiểm chứng các chứng minh toán học. Bin Dong, nhà toán học tính toán tại Đại học Bắc Kinh và cộng sự đã sử dụng cách tiếp cận này để giải một bài toán đại số. Trong khi đó, công ty khởi nghiệp Math, Inc. ở California đã sử dụng một công cụ tương tự để đẩy nhanh quá trình "chuyển đổi" một công trình đoạt Huy chương Fields sang ngôn ngữ Lean.
Một trong những hệ thống AI có khả năng tạo ra chứng minh trực tiếp bằng Lean hoặc những ngôn ngữ tương tự là AlphaProof của Google DeepMind. Ảnh: Google Deepmind.
Một hướng tiếp cận khác là xây dựng các công cụ AI có khả năng tạo ra chứng minh trực tiếp bằng Lean hoặc những ngôn ngữ tương tự. Một trong những hệ thống AI tiên phong theo hướng này là AlphaProof của Google DeepMind. Nhưng hiện nay, phạm vi các nội dung toán học có thể viết trực tiếp bằng Lean hoặc chuyển đổi sang Lean vẫn còn khá hạn chế (Lời giải của ChatGPT cho bài toán Erdős số 1196 là một trường hợp hiếm hoi có thể được biểu diễn và kiểm chứng hoàn toàn tự động - Barreto đã thực hiện bằng phần mềm của Math, Inc.). Việc mở rộng khả năng biểu diễn toán học của Lean là một quá trình cực kỳ công phu, hiện nay, có nhiều nhóm tình nguyện viên đang tham gia vào quá trình này. TS. Lương Minh Thắng nhận định: "Hiện nay, chỉ có một số ít bài toán có thể được biểu diễn dưới dạng ngôn ngữ lập trình, còn đa phần vẫn phải dùng ngôn ngữ tự nhiên".
Những giới hạn này thể hiện rõ khi các nhà nghiên cứu thử nghiệm First Proof - một bộ tiêu chuẩn đánh giá (benchmark) năng lực toán học của các hệ thống AI vào đầu tháng Hai năm nay. Các chuyên gia ở nhiều ngành toán học đã đưa ra những câu hỏi mà chỉ riêng họ biết đáp án, vì các kết quả chưa công bố của họ đã xác định được mệnh đề nào đúng và mệnh đề nào sai. Bất cứ ai cũng có thể gửi lời giải do AI tạo ra. Gần như mọi lời giải đều được viết bằng ngôn ngữ tự nhiên, chỉ có một lời giải duy nhất được kiểm chứng bằng Lean. Một số lời giải đã được xác minh thủ công, nhưng phần lớn các lời giải khác vẫn chưa thể kiểm chứng.
Vào tháng Sáu tới, ban tổ chức First Proof sẽ tiếp tục đưa ra một loạt câu hỏi mới cho các hệ thống AI và xác minh lời giải theo cách thủ công. Nhiều nhà nghiên cứu đang mong chờ thử nghiệm này. Bộ tiêu chuẩn sẽ tập trung vào các mô hình có thể truy cập công khai mà đa số nhà toán học có thể tiếp cận. "Chúng tôi hy vọng những gì mình làm sẽ phục vụ cộng đồng toán học", Williams – một trong những người khởi xướng sáng kiến First Proof, bày tỏ.
Phần lớn các nhà nghiên cứu cho rằng trong tương lai gần, con người vẫn giữ vị trí chủ đạo trong lĩnh vực toán học. "Việc lựa chọn bài toán nào để nghiên cứu phụ thuộc nhiều vào kinh nghiệm cá nhân. Trước mắt, đây vẫn là công việc của con người", Mark Sellke, nhà toán học tại OpenAI, nhận xét.
"Bây giờ tôi thậm chí không dám hình dung 5 năm tới sẽ ra sao", Javier Gómez-Serrano, nhà toán học tại Đại học Brown, chia sẻ. "Mọi thứ đang thay đổi quá nhanh, giờ đây, điều gì cũng có thể xảy ra."
Nhiều nhà nghiên cứu nhấn mạnh rằng giữa làn sóng biến đổi sắp tới, điều quan trọng là đảm bảo lĩnh vực toán học vẫn phải lấy con người làm trung tâm. Việc để máy móc tạo ra những ý tưởng vượt ngoài tầm hiểu biết của những bộ óc xuất sắc nhất là điều vô nghĩa, thậm chí là nguy hiểm. "Xét đến cùng, mục tiêu của toán học là hiểu các hiện tượng toán học. Muốn vậy, con người phải luôn hiện diện trong quá trình đó. Chúng ta không thể chỉ để AI tạo ra kết quả rồi tuyên bố 'Định lý này là đúng'".
Thanh An dịch
---
Nguồn:
Elizabeth Gibney, ‘It is incredible’: How AI is transforming mathematics, Nature (2026). https://www.nature.com/articles/d41586-026-01553-1