Tình trạng này phản ánh xu hướng con người ngày càng chủ quan, phó thác cho AI, dẫn đến nguy cơ năng lực đánh giá độc lập bị cùn mòn và khả năng để lọt sai sót trong các kết quả do AI cung cấp ngày càng cao.
AI càng chính xác thì con người càng mất cảnh giác
"Chúng ta đang tin tưởng máy móc quá dễ dàng", TS. Trần Nhật Quang, giảng viên Công nghệ thông tin và nghiên cứu viên về đạo đức AI tại RMIT Việt Nam, thốt lên khi phân tích nghiên cứu về việc các bác sĩ dễ dàng "giao việc" và tin tưởng kết quả tư vấn của AI cho bệnh nhân.
Tình huống này đã được mô tả kỹ lưỡng trong một bài báo khoa học trên tạp chí npj Digital Medicine [1] hồi năm ngoái: bệnh nhân nhắn tin cho bác sĩ để hỏi về các tình trạng y tế khác nhau, chẳng hạn tác dụng phụ của thuốc, các triệu chứng đáng lo, bệnh mãn tính, nhiễm trùng lây truyền qua đường tình dục...
Vì hệ thống được tích hợp với ChatGPT 4.0 nên AI sẽ tự động tạo ra các bản nháp phản hồi và lưu lại để các bác sĩ chăm sóc sức khỏe ban đầu có kinh nghiệm từ 15-20 năm xét duyệt. Bác sĩ có thể chỉnh sửa bản nháp của AI trước khi gửi đi. Có 20 bác sĩ tham gia thử nghiệm này.
Đa số các bác sĩ đồng ý hoặc hoàn toàn đồng ý với những ý kiến AI đưa ra. Chỉ một số ít phản đối. 80% các bác sĩ tham gia đồng tình rằng các bản nháp do AI tạo ra đã giúp họ giảm tải công việc và 75% cảm thấy chúng an toàn.
Chúng ta có xu hướng tin tưởng vào các đề xuất của máy tính hơn cả phán đoán của bản thân, ngay cả khi có những bằng chứng rõ ràng rằng các đề xuất đó là sai. Thiết kế: Ngô Hà
Vấn đề là, bốn trong số 18 phản hồi nháp do AI soạn ra chứa các lỗi được phân loại ''sai lệch khách quan" (sai về sự kiện, dữ liệu, thông tin có thể kiểm chứng) hoặc "bỏ sót thông tin có nguy cơ gây hại". Với mỗi lỗi này, có từ 13 -15 bác sĩ tham gia đã không xử lý triệt để, dẫn đến 35–45% số bản nháp lỗi đã được bác sĩ gửi đi mà không hề chỉnh sửa.
Theo TS. Trần Nhật Quang, những sai sót đó không bắt nguồn từ năng lực của bác sĩ mà từ việc họ đã quá tin tưởng AI và không kiểm chứng kỹ những bản nháp do AI cung cấp trong quá trình phê duyệt. Hiện tượng này ngày càng trở nên phổ biến và được gọi là "thiên kiến tự động hóa" (automation bias) - là khi chúng ta có xu hướng tin tưởng vào các đề xuất của máy tính hơn cả phán đoán của bản thân, ngay cả khi có những bằng chứng rõ ràng rằng các đề xuất đó là sai.
Tình huống nêu trên không hiếm. Năm 2025, một luật sư Mỹ đã bị tòa án xử phạt do nộp một bộ hồ sơ có trích dẫn một án lệ chưa từng tồn tại do AI bịa ra. Vị luật sư này đã nhận trách nhiệm và cho biết trợ lý của ông đã sử dụng ChatGPT để soạn thảo văn bản mà không kiểm chứng kỹ càng.
Trước nữa, năm 2024, một trường đại học Úc cáo buộc 6.000 sinh viên gian lận dựa vào kết luận của công cụ phát hiện AI Turnitin. Đến khi nhận nhiều khiếu nại và kiểm tra thấy công cụ này không hiệu quả, nhà trường đã quyết định ngừng sử dụng. Tuy vậy, sự đã rồi.
Có thể một số sinh viên chỉ bức xúc trước việc họ "không được tin tưởng" và nhà trường quá vô trách nhiệm khi "để một công cụ quyết định số phận của người học". Nhưng một số phải gánh chịu hậu quả thật sự nặng nề. Nữ sinh viên Madeleine chia sẻ với kênh ABC rằng cô phải mất 6 tháng để minh oan, và cảm thấy cực kỳ bất lực vì hầu hết các vị trí thực tập điều dưỡng mà cô nhắm đến đều đòi hỏi phải có bằng tốt nghiệp đại học, trong khi cô đang bị nhà trường "tạm hoãn kết quả" để xem xét.
Chúng ta có xu hướng tin tưởng vào các đề xuất của máy tính hơn cả phán đoán của bản thân. Điều này khá dễ hiểu: khi AI càng chính xác thì con người càng thả lỏng sự cảnh giác. "Thế là, thay vì đóng vai trò gác cổng đầy cảnh giác, con người có nguy cơ phê duyệt một cách hình thức cho những gì máy móc đề xuất", TS. Trần Nhật Quang nói.
Để chung sống an toàn với AI, chúng ta cần duy trì một đầu óc tỉnh táo, luôn kiểm chứng kỹ lưỡng các thông tin mà AI tạo ra trước khi chấp nhận chúng. Thiết kế: Ngô Hà.
Nhưng con người vẫn phải gánh chịu trách nhiệm cho lỗi hệ thống
Theo TS. Trần Nhật Quang, hiện tượng này liên quan đến một vấn đề đạo đức nan giải các nhà nhân học gọi là "vùng hấp thụ trách nhiệm" (moral crumple zone) [2].
Khái niệm "vùng hấp thụ trách nhiệm" mô tả tình trạng một cá nhân phải gánh chịu trách nhiệm cho những sai sót hoặc hậu quả phát sinh từ một hệ thống tự động hoặc tự trị, trong khi họ chỉ có khả năng kiểm soát rất hạn chế đối với cách vận hành của nó. Nói cách khác, khi xảy ra sự cố, trách nhiệm thường được dồn về con người thay vì được phân tích trên toàn bộ cấu trúc kỹ thuật và tổ chức đã tạo ra sự cố.
Trong ngành kỹ thuật ô tô, vùng hấp thụ lực (crumple zone) được thiết kế để hấp thụ ngoại lực trong các vụ va chạm, nhằm giảm tác động lên hành khách để bảo vệ họ. Còn trong các hệ thống AI hỗ trợ ra quyết định, con người lại trở thành "vùng hấp thụ".
Như trong vụ tai nạn ô tô năm 2018 ở Tempe, bang Arizona, Mỹ, một người đi bộ đã thiệt mạng do bị xe tự hành thử nghiệm của Uber đâm trúng khi băng qua đường vào ban đêm. Sau vụ tai nạn, người tài xế giám sát an toàn của xe lúc đó bị truy tố tội vô ý làm chết người. Quá trình điều tra cho thấy có rất nhiều lỗi nghiêm trọng từ cả hệ thống tự lái của xe và sự chú tâm của tài xế. Nhưng cuối cùng, chỉ có con người bị trừng phạt. Công ty Uber không bị khởi tố hình sự, và gia đình nạn nhân cũng không khởi kiện Uber mà tự dàn xếp bồi thường tiền mặt.
Trong thời đại AI, thiên kiến tự động hóa có khả năng làm cho "vùng hấp thụ trách nhiệm" trở nên phổ biến và nghiêm trọng hơn, TS. Trần Nhật Quang nhận xét. Khi quá tin tưởng vào các khuyến nghị của một hệ thống mà họ không hoàn toàn kiểm soát hoặc thấu hiểu, khả năng phát hiện và hiệu chỉnh sai sót của con người có xu hướng giảm. Tuy nhiên, khi sự cố xảy ra, họ lại trở thành đối tượng đầu tiên bị quy trách nhiệm.
Bảo đảm vai trò của con người và trách nhiệm của nhà phát triển AI
Để không bị nhấn chìm bởi thiên kiến tự động hóa, TS. Trần Nhật Quang khuyến nghị giải pháp kết hợp cả ba yếu tố kỹ thuật, con người và pháp lý.
Về mặt kỹ thuật, các hệ thống AI nên được thiết kế với "cơ chế bắt buộc tư duy" [3]. Thay vì cho ra ngay đáp án hoàn chỉnh, AI trong trường học hay công sở phải yêu cầu người dùng tự đưa ra lời giải trước khi biết đáp án. Cách làm này buộc người dùng phải tư duy, biến AI thành một nguồn tham khảo thay vì công cụ làm thay.
Về mặt con người, các chương trình đào tạo không nên chỉ tập trung vào ưu điểm của AI mà cần trang bị cho người dùng khả năng nhận diện, đánh giá và hoài nghi đối với các kết quả do AI tạo ra. Người dùng cần được nâng cao nhận thức và kiến thức về những hạn chế và rủi ro cố hữu của các hệ thống AI, chẳng hạn như hiện tượng tạo ra thông tin sai lệch hoặc bịa đặt (hallucination); diễn đạt câu trả lời với mức độ tự tin cao, bất kể độ chính xác; hay xây dựng các lập luận có vẻ hợp lý trên bề mặt nhưng thực chất thiếu tính nhất quán về logic do được hình thành chủ yếu từ các mô hình xác suất thống kê. Chỉ khi nhận thức đầy đủ về những giới hạn này, con người mới có thể vận dụng tư duy phản biện một cách hiệu quả để kiểm chứng, đánh giá và sử dụng thông tin do AI cung cấp.
Cuối cùng là hành lang pháp lý làm chốt chặn để quy trách nhiệm cho các công ty AI. Chúng ta cần triển khai tốt các luật để đảm bảo rằng các công ty liên quan tuân thủ tiêu chuẩn an toàn và chịu trách nhiệm khi thiệt hạ xảy ra.
Đạo luật AI của Liên minh Châu Âu đã bắt đầu xử lý trực tiếp vấn đề thiên kiến tự động hóa thông qua điều 14, quy định rõ về việc giám sát của con người và yêu cầu các hệ thống AI phải được thiết kế sao cho người dùng có thể nhận thức đầy đủ về các hạn chế của nó, đặc biệt là các hệ thống có tính rủi ro cao như y tế và quân sự.
Sắc lệnh hành pháp 14110 của Mỹ nhấn mạnh về việc ngăn ngừa sự phụ thuộc quá mức vào AI trong các lĩnh vực hệ trọng như y tế, tư pháp hình sự và việc làm, nhằm đảm bảo vai trò của con người trong việc phán định và chịu trách nhiệm.
Luật Trí tuệ nhân tạo có hiệu lực từ ngày 1/3/2026 của Việt Nam cũng đề cập việc bảo đảm duy trì sự kiểm soát và khả năng can thiệp của con người đối với mọi quyết định và hành vi của hệ thống AI.
"Suy cho cùng, mọi biện pháp đều hướng đến một nguyên tắc chung là bảo đảm AI đóng vai trò công cụ hỗ trợ quá trình ra quyết định của con người chứ không thay thế phán đoán của con người", TS. Trần Nhật Quang kết luận. "Để chung sống an toàn với AI, chúng ta cần duy trì một đầu óc tỉnh táo, luôn kiểm chứng kỹ lưỡng các thông tin mà AI tạo ra trước khi chấp nhận chúng."
---
Tài liệu tham khảo:
[1] Biro, J.M., Handley, J.L., Malcolm McCurry, J. et al. (2025), Opportunities and risks of artificial intelligence in patient portal messaging in primary care. npj Digit. Med. 8, 222 (2025). https://doi.org/10.1038/s41746-025-01586-2
[2] Elish, M. C. (2019). Moral Crumple zones: Cautionary tales in Human-Robot Interaction. Engaging Science Technology and Society, 5, 40–60. https://doi.org/10.17351/ests2019.260
[3] Buçinca, Z., Malaya, M. B., & Gajos, K. Z. (2021). To trust or to think: Cognitive Forcing Functions Can Reduce Overreliance on AI in AI-assisted Decision-making, Proceedings of the ACM on Human-Computer Interaction, 5(CSCW1), 1–21. https://doi.org/10.1145/3449287