Mythos: Nỗi lo AI siêu mạnh đã thành hiện thực

AI siêu mạnh Claude Mythos là phép thử đầu tiên cho thấy một AI có thể đe dọa an ninh mạng toàn cầu, trong khi thế giới chưa hề có hiệp ước kiểm soát AI siêu mạnh.

Anthropic, công ty khởi nghiệp về trí tuệ nhân tạo (AI) ra đời năm 2021, mới đây được tạp chí Times phong tặng danh hiệu ‘công ty đột phá nhất thế giới ('The Most Disruptive Company in the World’). Thế giới chỉ mới biết đến Anthropic, trong khi các mô hình AI công ty này chỉ vừa phát hành đã gây ra không biết bao sóng gió trên thế giới.

Việc phát hành mô hình Claude đã khiến cả thế giới công nghệ phần mềm chao đảo. Khả năng lập trình phi thường của nó khiến thị trường tuyển dụng ngành khoa học máy tính trở nên hết sức u ám.

Hôm 07/04/2026, Anthropic thông báo về mô hình AI mới nhất của họ có tên là Claude Mythos, có khả năng đáng kinh ngạc trong việc phát hiện ra lỗ hổng bảo mật trong các hệ thống phần mềm hiện nay. Điều bất thường ở đây là Anthropic cho rằng mô hình AI này siêu mạnh đến mức quá nguy hiểm để phát hành rộng rãi, vì vậy trước mắt chỉ giới hạn trong một nhóm các đối tác gồm khoảng 40 công ty công nghệ, bao gồm Google, Broadcom, Nvidia, Cisco, Palo Alto Networks, Apple, Amazon và Microsoft và ngân hàng JPMorganChase lớn nhất của Mỹ ...

Thậm chí, một số đối thủ cạnh tranh của Anthropic cũng nằm trong nhóm đối tác, bởi lẽ mô hình AI mới này đại diện cho một bước nhảy vọt về hiệu suất, mang lại những tác động tích cực lẫn tiêu cực và có tầm quan trọng đặc biệt đối với an ninh mạng cũng như an ninh quốc gia của Mỹ và cả an ninh của toàn thế giới.

Điều gì xảy ra đằng sau những động thái bất thường như vậy?

Tin tốt và tin xấu

Trước hết là tin tốt: trong quá trình phát triển Claude Mythos, các nhà khoa học của Anthropic nhận ra hệ thống AI này không chỉ có khả năng viết mã phần mềm tốt hơn, ở mức độ phức tạp cao hơn bất kỳ mô hình AI nào hiện có. Quan trọng hơn là nó có thể phát hiện các lỗ hổng bảo mật trong hầu hết mọi hệ thống phần mềm phổ biến nhất một cách dễ dàng.

Tuy nhiên, mặt xấu là nếu công cụ này rơi vào tay những tổ chức hoặc cá nhân bất hảo, chúng có thể tấn công và xâm nhập gần như mọi hệ thống phần mềm lớn trên thế giới, gây hậu quả khôn lường. Viễn cảnh một thế giới mà các tài khoản ngân hàng không chỉ của mọi cá nhân mà cả các tổ chức đều trở nên không an toàn, hay các tin tức tuyệt mật về an ninh quốc phòng của các quốc gia có thể bị tiết lộ dễ dàng không còn là chuyện khoa học viễn tưởng nữa.

Chỉ trong vòng hai tuần, Mythos đã châm ngòi cho một cuộc chạy đua toàn cầu chưa từng thấy trong kỷ nguyên trí tuệ nhân tạo. Theo các nhà khoa học của Anthropic, Mythos có khả năng phát hiện và khai thác các lỗ hổng trên quy mô lớn ẩn giấu trong những phần mềm vận hành hệ thống ngân hàng, các mạng lưới điện quốc gia, các hãng hàng không, hệ thống điều hành của các chính phủ trên toàn thế giới bao gồm an ninh quốc phòng vv. Giờ đây mô hình AI này đã trở thành một quân bài địa chính trị; và quân bài ấy đang nằm trong tay một công ty khởi nghiệp mới chưa đầy 5 năm tuổi của Mỹ.

Quốc gia duy nhất bên ngoài lãnh thổ Mỹ được Anthropic chia sẻ về Mythos là Vương quốc Anh. Ngay sau đó, Thống đốc Ngân hàng Trung ương Anh đã cảnh báo Anthropic có thể đã tìm ra phương thức "phá toang toàn bộ thế giới an ninh mạng". Viện An ninh AI của nước này đã tiến hành thử nghiệm Mythos và công bố một báo cáo đánh giá độc lập, xác nhận rằng mô hình này có khả năng thực hiện các cuộc tấn công mạng phức tạp mà chưa từng mô hình AI nào trước đó làm được. Bộ trưởng phụ trách AI của Anh cho rằng "Mythos đánh dấu một bước tiến vượt bậc về năng lực an ninh mạng sử dụng AI," đồng thời cho biết nước Anh đang triển khai các biện pháp nhằm bảo vệ "cơ sở hạ tầng quốc gia trọng yếu."

Hệ quả an ninh khi tụt hậu trong cuộc đua AI

Lãnh đạo các quốc gia khác trên thế giới đang lo lắng và tìm cách xác định quy mô của những rủi ro an ninh cũng như phương hướng giải quyết. Ngân hàng Trung ương Châu Âu bắt đầu âm thầm chất vấn các ngân hàng thành viên về năng lực phòng vệ của họ. Một quan chức EU cho biết Ủy ban Châu Âu đã gặp gỡ Anthropic ít nhất ba lần kể từ khi mô hình Mythos được phát hành, tuy nhiên vẫn chưa được cấp quyền truy cập vào mô hình này. Bộ trưởng Tài chính Canada thậm chí còn ví mối đe dọa này với sự kiện eo biển Hormuz bị phong tỏa.

Đối với các đối thủ của Mỹ như Trung Quốc và Nga, Mythos đã làm nổi bật những hệ quả an ninh của việc tụt hậu trong cuộc đua AI. Một cơ quan truyền thông của Nga thậm chí còn gọi mô hình này là "nguy hiểm hơn cả vũ khí hạt nhân".

Những phản ứng này đã minh họa cho một thực tế mà các nhà nghiên cứu AI từ lâu đã cảnh báo – dù chỉ trên phương diện lý thuyết: Bất cứ ai dẫn đầu trong việc xây dựng các mô hình AI mạnh mẽ nhất sẽ nắm giữ những lợi thế địa chính trị to lớn. Cách đây hơn 1 năm, tại lễ trao giải Nobel Vật Lý năm 2024, Tiến sĩ Geoffrey E. Hinton người được coi là cha đẻ của học sâu đã nói "... chúng ta phải lo lắng về một số hậu quả xấu của AI có thể xảy ra, đặc biệt là mối đe dọa của những việc vượt quá ngoài khỏi tầm kiểm soát." Và điều này đã bắt đầu xảy ra. Hiện nay, các bước đột phá lớn về AI đang bắt đầu mang dáng dấp của những cuộc thử nghiệm vũ khí hơn là những đợt ra mắt sản phẩm thông thường.

Anthropic cho biết họ chưa có lộ trình cụ thể nào để mở rộng quyền truy cập một cách rộng rãi, tuy nhiên, họ sẽ phối hợp với chính phủ Mỹ cùng các đối tác trong lĩnh vực để xác định những bước đi tiếp theo. Công ty cũng chia sẻ rằng họ đã nhận được vô số cuộc gọi từ các chính phủ, doanh nghiệp và nhiều tổ chức khác nhằm tìm kiếm quyền truy cập cũng như thông tin.

Anthropic nói thêm rằng họ dự đoán các nhóm khác sẽ phát hành rộng rãi những mô hình AI sở hữu năng lực an ninh mạng tương tự trong vòng ít nhất 18 tháng tới. Điều này khiến cho các tổ chức và các chính phủ chỉ còn rất ít thời gian để thực hiện những biện pháp khắc phục an ninh cần thiết.

Thế giới chưa có hiệp ước kiểm soát AI siêu mạnh đe dọa an ninh toàn cầu

Trong khi đó, mới cách đây vài ngày Anthropic phải đối mặt với những vấn đề nan giải trong việc bảo mật Mythos. Đã xuất hiện các báo cáo cho rằng một nhóm không được cấp phép đã xâm nhập được vào Claude Mythos vốn được bảo vệ cực kỳ nghiêm ngặt. Anthropic cho rằng họ đang điều tra và không có bằng chứng nào cho thấy hệ thống nội bộ của họ đã bị xâm nhập, nhưng cũng có khả năng bị xâm nhập thông qua môi trường của các bên đối tác.

Nếu thông tin này là chính xác, đây có lẽ là một trong những minh chứng cho thấy rủi ro lớn nhất trong lĩnh vực AI không nằm ở bản thân mô hình, mà ở những kẻ có khả năng truy cập nó. Tương tự sự nguy hiểm của vũ khí hủy diệt hàng loạt khi lọt vào tay những kẻ bất hảo.

Mythos là dấu hiệu mới nhất cho thấy sự phân hóa ngày càng sâu sắc trên toàn cầu trong lĩnh vực AI. Các quốc gia thiếu cơ sở hạ tầng điện toán mạnh mẽ cùng các mô hình AI tiên tiến đang đứng trước nguy cơ phải phụ thuộc vào những công ty như Anthropic, Google và OpenAI, và hầu như không có tiếng nói nào trong việc định hình cách thức thiết kế cũng như các biện pháp bảo vệ đối với những sản phẩm của các công ty này.

Cuộc chạy đua xoay quanh Mythos diễn ra vào thời điểm mà sự hợp tác quốc tế về AI đang ở mức thấp nhất. Trong bối cảnh tình hình chính trị và quân sự căng thẳng trên thế giới, mâu thuẫn an ninh, chính trị và kinh tế khiến lòng tin và hợp tác giữa các chính phủ xuống thấp chưa từng có sau thời kỳ chiến tranh lạnh.

Hiện chưa có một văn kiện nào tương đương với Hiệp ước Không phổ biến Vũ khí Hạt nhân, cũng như không có cơ chế thanh sát chung hay các quy tắc thống nhất về cách thức xử lý những trường hợp như Mythos. Trong khi đó các tập đoàn công nghệ lại đang chạy đua quyết liệt nhằm vượt mặt bỏ qua các đối thủ. Điều đó dẫn tới một câu hỏi không còn là lý thuyết nữa: điều gì sẽ xảy ra nếu an ninh toàn cầu chỉ phụ thuộc vào một hoặc vài công ty.

Anthropic, một công ty khởi nghiệp mới chưa đầy 5 năm tuổi đã được đánh giá là ‘công ty có tính đột phá nhất thế giới’ lại đang làm đảo lộn nền an ninh của cả thế giới. Đằng sau các đột phá của công ty khởi nghiệp đó là gì sẽ được làm sáng tỏ trong các bài tiếp theo.

---

Tài liệu tham khảo:

[1] Reuter 04/2/2026 "Selloff wipes out nearly $1 trillion from software".

[2] Wall Street Journal. 15/2/2026. "Pentagon Used Anthropic’s Claude in Maduro Venezuela Raid"

[3] New York Times.22/ 4/ 2026. "Anthropic’s New A.I. Model Sets Off Global Alarms"

Trở lại Khoa học - Công nghệTrở lại Khoa học - Công nghệ