Chúng ta đã từng tập trung vào việc phát triển những AI có thể hành động giống con người. Giờ đây, chúng ta đang dạy AI cách hiểu chúng ta hơn. Ảnh: Canvas
Trong hệ thống nghiên cứu TRIBE v2 (TRansformer for In-silico Brain Experiments), mô hình mạng nơ-ron nhân tạo Transformer được sử dụng để mô phỏng các thí nghiệm não bộ trên máy tính.
Nói cách khác, nó hoạt động như một bộ não giả lập, có khả năng mô phỏng hoạt động thần kinh trên nhiều vùng não khác nhau. Nhờ đó, thay vì phải đặt người thật vào máy chụp cộng hưởng từ chức năng (fMRI) tốn kém, các nhà khoa học có thể dùng TRIBE v2 để dự đoán xem vùng não nào sẽ "phát sáng" khi được kích thích bằng hình ảnh, âm thanh, và lời nói.
TRIBE hoạt động như thế nào?
Tiền thân của TRIBE v2 là một mô hình đã giành chiến thắng trong cuộc thi Thử thách Algonauts 2025. Đây là cuộc thi do các nhà khoa học khởi xướng và tổ chức thường niên nhằm nghiên cứu các công nghệ ở giao điểm của trí tuệ sinh học và trí tuệ nhân tạo. Tại cuộc thi, mô hình của Meta đã qua mặt các mô hình của MIT và Stanford nhờ độ chính xác vượt trội trong việc giải mã phản ứng của não bộ, mặc dù chỉ được đào tạo trên bản quét não của bốn người.
Để huấn luyện mô hình Transformer trong hệ thống TRIBE v2, Meta đã sử dụng hơn 1.000 giờ dữ liệu fMRI được thu thập từ hơn 720 tình nguyện viên. Những người tham gia được tiếp xúc với các kích thích tự nhiên như phim ảnh và âm thanh, lời nói, giúp mô hình học được cách não bộ phản ứng trong các tình huống thực tế.
Mạng nơ-ron nhân tạo Transformer trong hệ thống TRIBE do các nhà nghiên cứu tại Google Brain (nay thuộc Google DeepMind) và Đại học Toronto công bố năm 2017. Đến nay, kiến trúc Transformer đã được áp dụng rộng rãi trong các chatbot ngôn ngữ nổi tiếng như ChatGPT của OpenAI hay Gemini của Google. Tuy nhiên, thay vì dự đoán từ kế tiếp, TRIBE v2 dự đoán hoạt động thần kinh trên các vùng não khác nhau.
Một trong những khả năng đáng chú ý nhất của nó là khả năng khái quát hóa không cần học trước (zero-shot generalization). Điều này có nghĩa là TRIBE v2 có thể đưa ra dự đoán cho những cá nhân mới, ngôn ngữ mới hoặc các nhiệm vụ mới mà không cần phải đào tạo thêm.
Mô tả cách hoạt động của TRIBE v2. Nguồn: Meta
Vì sao Meta tập trung vào hình ảnh và âm thanh?
TRIBE v2 nổi bật nhờ khả năng tích hợp đồng thời ba loại tín hiệu giác quan (hình ảnh, âm thanh và lời nói) để hình thành nhận thức, thay vì xử lý từng kênh riêng lẻ. Cách tiếp cận này đưa AI tiến gần hơn tới cơ chế hoạt động của não người, vốn luôn diễn giải thế giới bằng sự kết hợp của nhiều giác quan, trong đó thị giác và thính giác đóng vai trò chủ đạo.
Nhờ hợp nhất các dòng dữ liệu, TRIBE v2 xây dựng được một bản đồ não bộ thống nhất, góp phần làm rõ mối liên hệ giữa môi trường và phản ứng thần kinh. Trong các thử nghiệm, mô hình đạt độ chính xác cao hơn hai - ba lần so với các phương pháp đã có.
Theo Meta, TRIBE v2 đôi khi còn dự đoán hoạt động não "chuẩn" hơn cả dữ liệu fMRI. Lý do là dữ liệu thô từ các phiên chụp fMRI thường bị nhiễu bởi nhiều yếu tố như nhịp tim, cử động cơ thể hay sai số từ thiết bị.
Ngoài ra, TRIBE v2 không dự đoán từng tín hiệu lẻ tẻ mà tập trung vào phản ứng não kiểu trung bình, điển hình. Vì vậy, kết quả của nó thường giống với hoạt động não trung bình của một nhóm người hơn là dữ liệu fMRI của từng cá thể.
Biểu đồ cho thấy mô hình TRIBE v2 (màu xanh) có điểm số cao hơn hẳn các phương pháp tuyến tính (màu trắng) và các dữ liệu quét não khác (màu xám) trong dự đoán phản ứng của nhóm người đối với các nội dung mới (bài phát biểu và phim). Ảnh: Meta đăng trên X ngày 26/3/2026.
Bước ngoặt cho nhiều lĩnh vực
Việc dự đoán được phản ứng của não hứa hẹn mang lại những bước ngoặt lớn trong nhiều lĩnh vực.
Meta không chỉ công bố mô hình mà còn chia sẻ mã nguồn mở, bài báo nghiên cứu, bản demo và cho phép tải mô hình về dùng miễn phí. Do vậy, bất kỳ nhà nghiên cứu nào cũng có thể khai thác dữ liệu chi tiết về não bộ từ mô phỏng tính toán để thúc đẩy các khám phá trong lĩnh vực của mình.
Đối với y học và khoa học thần kinh, các nhà nghiên cứu có thể thực hiện hàng nghìn thí nghiệm ảo để tìm hiểu các rối loại như mất ngôn ngữ (aphasia) hoặc chẩn đoán bệnh thần kinh (như Alzheimer hay Parkinson) mà không cần các phiên chụp fMRI đắt đỏ.
Các nhà nghiên cứu có thể thực hiện hàng nghìn thí nghiệm mô phỏng não bộ trên máy tính cho mọi giả thuyết. Ảnh:Freepik
Với những công nghệ tương lai xa, đây sẽ là những viên gạch đầu tiên cho các công nghệ đọc tín hiệu não chính xác hơn, chẳng hạn như các chip điều khiển thiết bị bằng suy nghĩ, hoặc thiết bị thực tế ảo (AR/VR) nhập vai tiên tiến cho phép người dùng điều khiển phiên bản số của mình một cách tự nhiên. Kịch bản này chỉ khả thi khi mô hình não số có thể dự đoán và đồng bộ với hoạt động của não người ngoài đời thực.
Ở tương lai gần hơn, các nền tảng như TRIBE v2 có thể giúp kỹ sư thiết kế các mạng nơ-ron nhân tạo hiệu quả hơn, qua đó tăng tốc xử lý dữ liệu và giảm tiêu thụ năng lượng.
Nguy cơ bị lợi dụng
Dù mở ra nhiều hy vọng, công nghệ của Meta cũng gây ra những lo ngại sâu sắc.
TRIBE v2 không trực tiếp đọc suy nghĩ của con người, nhưng nó có thể dự đoán cách não phản ứng trước các kích thích cụ thể.
Một số nhà xã hội học lo rằng việc nắm giữ công cụ dự đoán phản ứng của não bộ có thể giúp Meta tạo sinh những nội dung đánh trúng cảm xúc người dùng, khiến họ càng khó rời mắt khỏi màn hình. Tình trạng này đã được chứng minh có thể gây ra hậu quả tiêu cực với cả trẻ em và người trưởng thành.
Đồng thời, họ quan ngại công cụ dự đoán phản ứng của não có thể bị lợi dụng để tiếp tay cho các nội dung thao túng tâm lý đám đông trong các sự kiện lớn như bầu cử, chiến tranh, xét xử v.v
Ngoài ra, còn có những mối băn khoăn xa hơn về "quyền riêng tư tư tưởng". Trước đây, quyền riêng tư thường chỉ dừng lại ở thông tin cá nhân (tên tuổi, địa chỉ, số điện thoại v.v) hoặc hành động bên ngoài. Nhưng khi công nghệ phát triển đến mức có thể "đọc" được sóng não, thì những suy nghĩ vốn được xem là vùng an toàn tuyệt đối và bí mật nhất của con người sẽ đứng trước nguy cơ bị phơi sáng.
Meta không cần xin phép quét não của toàn bộ dân số trái đất. Họ chỉ cần học từ một nhóm nhỏ tình nguyện viên để tìm ra 'bản đồ chung', từ đó dự đoán suy nghĩ, cảm xúc hoặc phản ứng của số đông. Các nhóm nghiên cứu khác cũng có thể làm tương tự, khi họ tự phát triển hoặc có trong tay mã nguồn mở của các mô hình như TRIBE.
Điều này làm dấy lên câu hỏi: dữ liệu não nên được bảo vệ như thế nào? Nếu không, các bên nắm giữ mô hình và dữ liệu não có thể biết bạn đang sợ hãi, phấn khích hay thèm muốn điều gì trước cả khi bạn kịp nhận ra. Con người sẽ đứng trước nguy cơ bị thao túng hành vi, hoặc tệ hơn là kiểm soát tư tưởng.
Những lo ngại nêu trên cần sớm được giải quyết, nhất là trong bối cảnh cuộc đua AI gắn với nghiên cứu não bộ ngày càng sôi động. Trong khi Meta dẫn đầu với TRIBE v2 dự đoán hoạt động não từ dữ liệu cảm giác, thì Google DeepMind theo đuổi việc lý giải các nguyên lý vận hành của não nhằm cải thiện AI. Các công ty như Neuralink, Synchron và Blackrock Neurotech cũng đang phát triển các công nghệ đọc tín hiệu thần kinh thông qua chip cấy não, mở ra hướng tiếp cận từ phần cứng. Ngoài ra, còn có hàng trăm nhóm nghiên cứu từ các trường đại học hàng đầu thế giới tham gia cuộc thi Thử thách Algonauts thường niên nhằm khám phá khả năng mô phỏng nhận thức con người bằng các phương pháp tính toán.
Quang Duy tổng hợp.
--
Tài liệu tham khảo:
Meta’s TRIBE AI: A New Foundation Model Decoding Human Brain Activity, https://neurosciencenews.com/meta-tribe-ai-brain-decoding-30398/
What is Meta Tribe v2? The AI model that maps how humans thin https://yourstory.com/ai-story/meta-tribe-v2-ai-model-human-thinking