Thứ ba, 30/6/2026, 07:49 (GMT+7)

Vì sao công ty AI săn đón các nhà nghiên cứu triết học

AI thực sự có khả năng suy luận và áp dụng các nguyên tắc đạo đức không hay chỉ mô phỏng hời hợt bên ngoài - điều đó phụ thuộc rất nhiều vào sự hợp tác giữa các nhà nghiên cứu triết học và các công ty công nghệ.

Mười năm trước, khi cuộc cách mạng AI bắt đầu bùng nổ, sinh viên khối ngành xã hội và nhân văn thường nhận được lời khuyên rằng "học lập trình đi" nếu muốn dễ tìm việc làm. Sự đời vốn dĩ khó lường, giờ đây trong khi các lập trình viên đang nơm nớp lo bị AI cướp việc thì các triết gia lại tham gia vào các công ty AI.

Đầu năm nay, Ngân hàng Dự trữ Liên bang New York đã công bố những số liệu rất bất ngờ, cho thấy cử nhân triết học tại Mỹ hiện nay dễ xin việc hơn so với những người đồng trang lứa học ngành khoa học máy tính. Cụ thể, trong năm 2024 - năm có dữ liệu thống kê gần nhất - tỷ lệ thất nghiệp của những người học khoa học máy tính lên tới 7%, trong khi con số này ở các cử nhân triết học ở mức 5,1%.

Đặc biệt, các công ty AI đang ráo riết săn đón những nhân tài triết học. "Số lượng nhà nghiên cứu triết học trong các công ty AI đang tăng," Iason Gabriel, chuyên gia đạo đức học đang dẫn dắt đội ngũ nghiên cứu về tác động xã hội của AI tại Google DeepMind, chia sẻ.

Nghiên cứu "hành vi" của AI

Iason Gabriel gia nhập DeepMind từ 10 năm trước, khi đó việc coi AI như một tác nhân có trách nhiệm đạo đức vẫn là điều xa vời. Vào thời điểm đó, ông chủ yếu tập trung vào các vấn đề kỹ thuật như định kiến trong thuật toán. Tuy nhiên, sự xuất hiện của các mô hình ngôn ngữ lớn vào đầu những năm 2020 đã thay đổi hoàn toàn cuộc chơi.

Năm 2024 - năm có dữ liệu thống kê gần nhất, tỷ lệ thất nghiệp của những người học khoa học máy tính lên tới 7%, trong khi con số này ở các cử nhân triết học ở mức 5,1%. Ảnh: University of St. Thomas — Năm 2024 - năm có dữ liệu thống kê gần nhất, tỷ lệ thất nghiệp của những người học khoa học máy tính lên tới 7%, trong khi con số này ở các cử nhân triết học ở mức 5,1%. Ảnh: *University of St. Thomas*

Ngày nay, các tác nhân AI đảm nhận công việc gửi email, lên lịch họp, viết mã lập trình - nói cách khác, chúng đang thực sự "hành động" trong thế giới thực. "Hành vi" của chúng không chỉ ảnh hưởng đến người dùng trực tiếp mà còn tác động đến cả những người xung quanh. Đây chính là trọng tâm nghiên cứu hiện tại của Gabriel.

Dù mọi người thường thích thảo luận những chủ đề như AI có ý thức hay siêu trí tuệ không, nhưng thực ra các triết gia trong những công ty AI chủ yếu giải quyết những rủi ro cấp thiết hơn, như những vấn đề về sự công bằng, thông tin sai lệch, nguy cơ bị kẻ xấu lợi dụng hay những sai sót khó lường từ các tác nhân AI.

Cùng với các đồng nghiệp tại DeepMind, Julia Haas - nhà triết học chuyên tìm hiểu về cách thức vận hành của tâm trí - đang tìm cách phân biệt liệu AI thực sự có khả năng suy luận và áp dụng các nguyên tắc đạo đức không hay chỉ là sự mô phỏng hời hợt bên ngoài.

Công việc của cô không liên quan trực tiếp đến các quy trình huấn luyện mô hình chủ lực Gemini của Google hay việc đóng gói nó thành các chatbot cho người dùng. "Tôi cho rằng công việc của mình nằm ở giai đoạn rất sớm trong toàn bộ quy trình phát triển", cô nói.

Định hình "thế giới quan" cho AI

Những giá trị mà triết học mang lại cho quá trình nghiên cứu và phát triển AI thực chất đã có từ thời cổ đại. Tiêu biểu là phương pháp Socrates - do triết gia Hy Lạp cổ đại Plato ghi chép lại. Phương pháp này sử dụng kỹ thuật đặt câu hỏi liên tục để giúp người đối thoại tự phát hiện ra giả định, điểm yếu trong lập luận, mâu thuẫn trong suy nghĩ, nhờ đó đi đến hiểu biết sâu hơn.

Hiện nay, nhiều hệ thống AI có xu hướng "nịnh bợ", chỉ nói những gì người dùng muốn nghe. Tuy nhiên, theo Jörg Noller, chuyên gia về triết học và AI tại Đại học Ludwig Maximilian (Munich, Đức), nếu các mô hình AI được huấn luyện theo phương pháp Socrates, chúng sẽ bớt thói quen chiều lòng người và sẵn sàng đi tìm sự thật hơn.

Bên cạnh đó là khái niệm về "sự vô tri Socrates". Trong tác phẩm Apology, Plato kể lại rằng triết gia Socrates từng khẳng định sự khôn ngoan của ông chủ yếu nằm ở việc nhận thức rõ bản thân mình không biết những gì. Việc "cấy" sự khiêm tốn này vào mô hình AI sẽ giúp hạn chế tình trạng tự tin thái quá - một nhược điểm rất phổ biến mà ông Noller gọi là "sự non nớt của AI".

Iason Gabriel nhận định việc áp dụng những tư tưởng trên đã giúp giảm thiểu tình trạng AI bịa đặt thông tin. Từ đó, ông cho rằng triết học chính là "công cụ đắc lực" giúp cải thiện quá trình suy luận dài và phức tạp của AI, hay còn gọi là "chuỗi suy nghĩ".

Việc đưa các lý thuyết, nguyên tắc và phương pháp tư duy của triết học vào quá trình thiết kế, huấn luyện và đánh giá AI có thể ảnh hưởng đến cách mô hình phản hồi trong những tình huống cụ thể.

Bức Alcibiades được Socrates chỉ dạy (1776) của Marcello Bacciarelli. Ảnh: Wikipedia — Bức "Alcibiades được Socrates chỉ dạy" (1776) của Marcello Bacciarelli. Ảnh: *Wikipedia*

Theo Thomas Powers, nhà triết học công nghệ tại Đại học Delaware (Mỹ), nếu bạn nạp cho trợ lý pháp lý AI các tác phẩm của John Locke, nó sẽ có xu hướng đề cao quyền sở hữu tài sản như một nền tảng của tự do chính trị.

Nếu bạn không thích hệ giá trị đó, các nhà phát triển có thể cung cấp những lựa chọn khác. Dòng mô hình "Granite" của IBM cho phép doanh nghiệp tùy chỉnh đầu ra của AI sao cho đồng điệu với triết lý và giá trị của họ. Francesca Rossi, Giám đốc bộ phận trách AI có trách nhiệm của IBM, cho biết tính năng này giúp người dùng tự quyết định điểm cân bằng giữa những giá trị triết học có thể xung đột với nhau, chẳng hạn giữa quyền tự chủ của cá nhân và sự hài hòa của xã hội.

"Dạy" AI hành xử tử tế

Triết học còn góp phần giải quyết bài toán cốt lõi về sự an toàn. Các nhà nghiên cứu từng ghi nhận vô số hành vi đáng lo ngại của AI, từ việc cố tình né tránh sự giám sát cho đến cả... đe dọa người dùng.

Để ngăn chặn tình trạng này, các nhà phát triển đang áp dụng phương pháp "Chủ nghĩa hiến pháp AI" (AI constitutionalism) hay xây dựng mô hình AI dựa trên bộ khung các quy tắc và nguyên lý được chọn lọc từ những văn bản triết học mang tính chuẩn mực về đạo đức hoặc pháp lý.

Anthropic là một trong những công ty ủng hộ tiếp cận AI constitutionalism. "Hiến pháp" cho mô hình Claude của hãng tổng hợp nhiều nguồn tư liệu - từ tư tưởng của triết gia Immanuel Kant, điều khoản dịch vụ của Apple cho đến Tuyên ngôn Quốc tế về Nhân quyền. Phiên bản hiến pháp AI mới nhất của Anthropic do nhà triết học Amanda Askell chủ trì soạn thảo, đã được công bố vào ngày 21/1 năm nay.

Nội bộ công ty thậm chí còn gọi vui bản tài liệu dài 78 trang này là "hồ sơ linh hồn" của Claude. "Quá trình viết ra bản hiến pháp giống như thực hành triết học ứng dụng vậy", Askell ví. "Hệt như việc dạy một con người cách sống tử tế".Tuy nhiên, câu hỏi lớn nhất được đặt ra là ngay từ đầu nên đưa những quy tắc nào vào các bản "hiến pháp"? Các nhà nghiên cứu triết học hiện đang tập trung vào hai khuôn khổ đạo đức chính. Một là thuyết bổn phận, gắn với tên tuổi của Immanuel Kant. Thuyết này đặt ra các quy tắc nghiêm ngặt, cấm những hành vi như nói dối, cấm cưỡng ép, và không được đối xử với con người như là phương tiện, ngay cả khi điều đó mang lại lợi ích cho số đông.

"Hiến pháp" AI của Anthropic bao gồm nhiều ràng buộc mang tính bổn phận như vậy. Theo TS Powers, những nguyên tắc này có thể giúp AI hành xử nhất quán hơn - một điểm cộng lớn khi triển khai robot tại nhà hay không gian công cộng.

Thứ hai là thuyết hệ quả. Thuyết này cân nhắc chi phí và lợi ích để đưa ra quyết định cuối cùng.

Triết học có thể giúp định hình thế giới quan của AI. Đồ họa: Anh Thư — Triết học có thể giúp định hình thế giới quan của AI. Đồ họa: *Anh Thư*

Những mô hình theo xu hướng thuyết hệ quả bao gồm ChatGPT của OpenAI và Gemini của Google. Chẳng hạn, các mô hình AI của Google được thiết kế với mục tiêu cốt lõi là tạo ra "lợi ích tổng thể lớn hơn nhiều so với những rủi ro có thể lường trước" - một mục tiêu điển hình của thuyết hệ quả.

Thuật toán hệ quả rất quan trọng đối với phần mềm xe tự lái. Nếu không thể tránh tai nạn, AI bắt buộc phải chọn cách va chạm gây thiệt hại nhỏ nhất. Chris Gerdes, kỹ sư cấp cao tại công ty xe tự lái Waymo, cho biết các công ty thường phát triển phần mềm lái xe theo định hướng hệ quả này.

Thuyết hệ quả cũng là trung tâm của các hệ thống vũ khí AI. Theo Jack Shanahan, cựu giám đốc Trung tâm Trí tuệ Nhân tạo Liên quân (đơn vị nghiên cứu AI cho lực lượng vũ trang Mỹ), trong các chiến dịch, quân đội phải tính toán để giảm rủi ro thương vong đối với dân thường xuống thấp nhất có thể.

Những câu hỏi đạo đức chưa có lời giải

Vẫn còn nhiều vấn đề hóc búa xung quanh các công nghệ AI. Đây chính là cơ hội của các nhà triết học.

Liệu có trường hợp nào AI được phép phá vỡ các quy tắc bổn phận khắt khe? AI phải đưa ra quyết định thế nào khi hậu quả còn chưa rõ ràng? Hệ thống AI có nên cân nhắc phúc lợi động vật hay tình trạng môi trường khi hành động không?

Stefan Heck, nhà triết học kiêm CEO của Nauto (công ty sản xuất hệ thống an toàn AI cho xe thương mại), đặt ra một câu hỏi đầy gai góc: Về mặt đạo đức, liệu xe tự lái nên ưu tiên cứu một người đi bộ còn trẻ hay một cụ già? Ông dự đoán sẽ có những vụ kiện tụng đạo đức cực kỳ phức tạp trong tương lai. Bởi suy cho cùng, thuật toán hệ quả công khai cho phép AI gây ra một tổn hại, miễn là để ngăn chặn một thảm họa tồi tệ hơn.

Roman Yampolskiy, nhà lý thuyết AI tại Đại học Louisville, lập luận rằng đạo đức vốn là thứ "không ổn định về mặt lịch sử, biến đổi theo từng nền văn hóa, dễ bị thao túng vì mục đích chiến lược, và thường chỉ có thể nhận diện được rõ ràng sau khi sự việc đã rồi".

Trong khi các triết gia góp phần định hình các mô hình AI thì AI cũng đang định hình chương trình giảng dạy triết học tại các trường đại học danh tiếng. Hiện nay, nhiều trường đã mở các khóa học về đạo đức AI hoặc các chương trình liên ngành giữa khoa học máy tính và triết học. Đó thậm chí còn được giới chuyên môn đánh giá là xu hướng của năm.

Tuy nhiên, vẫn có sự hoài nghi nhất định đối với công việc của các nhà nghiên cứu triết học làm việc cho các phòng thí nghiệm AI. GS Edward Harcourt, giám đốc Viện Đạo đức AI tại Đại học Oxford (Anh), bày tỏ nỗi băn khoăn liệu họ có còn giữ được vai trò hoàn toàn khách quan, trung lập, khi nhận lương của những công ty vì lợi nhuận? Ông đồ rằng, việc các công ty công nghệ đẩy mạnh sự tham gia của các nhà nghiên cứu triết học trong quá trình phát triển AI phần nào có động cơ tự khuếch trương bản thân, làm cho công việc và sản phẩm của mình có vẻ quan trọng hơn và cao siêu hơn trong mắt công chúng.

Hà Trang tổng hợp

---

Nguồn tham khảo:

Why big AI labs are hiring so many philosophers. The Economist.
https://www.economist.com/science-and-technology/2026/06/24/why-big-ai-labs-are-hiring-so-many-philosophers?

To Land a Job in AI, Try Reading Kant. Wired.
https://www.wired.com/story/to-land-a-job-in-ai-try-reading-kant/

Someone Finally Wants to Hire Philosophers. The Atlantic.
https://www.theatlantic.com/technology/2026/06/ai-companies-hiring-philosophers/687417/

Trở lại Khoa học - Công nghệTrở lại Khoa học - Công nghệ

Tia Sáng
Chuyên trang tri thức của VnExpress
Tổng biên tập: Phạm Văn Hiếu

Địa chỉ: Tầng 10, Tòa A FPT Tower,
số 10 Phạm Văn Bạch, phường Cầu Giấy, Hà Nội
Điện thoại: (024) 39428445
Email: tiasang@vnexpress.net