Bằng cách này, thiên kiến của con người và AI có thể tạo ra một vòng lặp, trong đó những thành kiến nhỏ ban đầu làm tăng nguy cơ mắc lỗi của con người.
"Con người vốn dĩ đã có thiên kiến, vì vậy khi chúng ta huấn luyện các hệ thống AI bằng dữ liệu do con người tạo ra, các thuật toán AI sẽ học theo những thiên kiến được nhúng trong dữ liệu đó. Sau đó, AI có xu hướng khai thác và khuếch đại các thiên kiến này để cải thiện khả năng dự đoán chính xác của nó," Giáo sư Tali Sharot - đồng tác giả nghiên cứu (Trung tâm Max Planck UCL về Tâm thần học Tính toán và Nghiên cứu Lão hóa, Viện Công nghệ Massachusetts), cho biết.
"Và chúng tôi phát hiện rằng khi con người tương tác với các hệ thống AI thiên kiến, họ có thể trở nên thiên kiến hơn, tạo ra hiệu ứng 'quả cầu tuyết' mà trong đó những thiên kiến nhỏ trong dữ liệu gốc được AI khuếch đại, làm tăng thiên kiến ở người sử dụng AI."
![]() |
Hình minh họa. Nguồn: Pixabay/CC0 Public Domain |
Nghiên cứu cho thấy những người tương tác với AI thiên vị có xu hướng đánh giá thấp năng lực của phụ nữ và đánh giá cao khả năng của đàn ông da trắng giữ các vị trí cao.
Nhóm nghiên cứu đã thực hiện một loạt thí nghiệm với hơn 1.200 người tham gia.
Trong một thí nghiệm, nhóm huấn luyện AI dựa trên một tập dữ liệu gồm các đánh giá của con người về việc các khuôn mặt trong ảnh trông hạnh phúc hay buồn, và các kết quả đánh giá này có xu hướng hơi thiên về đánh giá khuôn mặt là buồn. AI học theo thiên kiến này, khuếch đại nó và có xu hướng đánh giá một khuôn mặt bất kỳ là buồn.
Một nhóm người khác cũng được yêu cầu đánh giá các khuôn mặt là vui hay buồn, và họ được biết kết quả đánh giá của AI với từng bức ảnh.
Sau một thời gian tương tác với hệ thống AI này, họ đã tiếp thu thiên kiến của AI và có xu hướng đánh giá khuôn mặt là buồn nhiều hơn so với trước khi tương tác với AI. Điều này cho thấy AI học thiên kiến từ dữ liệu do con người tạo ra, sau đó khuếch đại thiên kiến vốn có ở một nhóm người khác.
Các kết quả tương tự cũng được phát hiện trong các thí nghiệm đánh giá hướng di chuyển của một tập hợp các chấm trên màn hình hoặc đánh giá hiệu suất tác vụ của người khác, trong đó người tham gia có xu hướng đánh giá quá cao hiệu suất của nam giới, sau khi tương tác với một hệ thống AI được cố ý lập trình với thiên kiến giới.
Trong thí nghiệm với hệ thống AI tạo sinh phổ biến Stable Diffusion, nhóm nghiên cứu yêu cầu AI tạo ra ảnh của các nhà quản lý tài chính. Kết quả chỉ ra hình ảnh nam giới da trắng xuất hiện quá mức so với tỷ lệ thực tế.
Sau đó, người tham gia được yêu cầu chọn ai là người có khả năng nhất làm nhà quản lý tài chính trước và sau khi xem các hình ảnh do AI tạo ra. Kết quả cho thấy họ càng có xu hướng chọn nam giới da trắng hơn sau khi xem những hình ảnh này.
Tiến sĩ Moshe Glickman - đồng tác giả nghiên cứu, cho biết: "Không chỉ con người thiên kiến góp phần tạo nên các hệ thống AI thiên kiến, mà các hệ thống AI cũng có thể thay đổi niềm tin của con người, khiến người dùng các công cụ AI trở nên thiên vị hơn trong nhiều lĩnh vực, từ đánh giá xã hội đến nhận thức cơ bản."
Giáo sư Sharot nhấn mạnh rằng các nhà phát triển thuật toán có trách nhiệm lớn trong việc thiết kế hệ thống AI: "Ảnh hưởng của thiên kiến AI có thể mang lại những hậu quả sâu sắc khi AI ngày càng hiện diện trong nhiều khía cạnh của cuộc sống."
Cả hai tác giả đều nhận định rằng việc tương tác với AI chính xác có thể cải thiện khả năng đánh giá của con người, vì vậy, điều quan trọng là các hệ thống AI phải được tinh chỉnh để trở nên công bằng và chính xác nhất có thể.
Nghiên cứu đã được công bố trênNature Human Behaviour.
Nguồn:
https://techxplore.com/news/2024-12-bias-ai-amplifies-biases.html
https://dx.doi.org/10.1038/s41562-024-02077-2
Phạm Nhật
