Việc phân loại AI theo mức độ rủi ro là cần thiết và có cơ sở thực tiễn, bởi nguồn lực quản lý của nhà nước là hữu hạn và mức độ nguy hiểm của các hệ thống AI cũng khác nhau. Tuy vậy, không dễ để đo lường những rủi ro này.
Có thể thấy, đối với mạng xã hội, tổn thương không nằm ở một nội dung riêng lẻ, mà ở nhịp lặp của toàn bộ trải nghiệm: gợi ý, tự động phát, cuộn vô hạn, thông báo, rồi lại gợi ý. Một thiếu niên bất an về ngoại hình có thể không bị tổn thương bởi một video cụ thể, nhưng khi thuật toán liên tục đề xuất những nội dung cùng một kiểu về sắc đẹp, cơ thể hay ngoại hình, người đó có thể dần nhìn bản thân qua những chuẩn mực lệch lạc. Lo âu, suy giảm khả năng tập trung, khó kiểm soát thời gian và mức độ sử dụng, hay so sánh xã hội liên tục đều có thể phát sinh từ cách nền tảng tổ chức trải nghiệm.
Sự xuất hiện của AI, vì thế, buộc pháp luật phải học thêm cách nhìn nhận những chi phí không đo được: những tổn thương không có giá thị trường, không có xác suất rõ ràng, tích lũy qua thời gian và ẩn trong thiết kế của môi trường số.
Các hệ thống AI có thể gây ra những tổn hại phân tán và khó xác định quan hệ nhân quả trực tiếp. Ảnh minh họa: Cottonbro Studio/Pexels
Giấc mơ đo lường pháp luật
Trong suốt nửa cuối thế kỷ XX, trường phái Luật và Kinh tế (Law and Economics) đã làm thay đổi cách nhìn về pháp luật. Đặc biệt qua các công trình của Richard Posner, pháp luật được đặt vào ngôn ngữ của chi phí, lợi ích, động cơ và hiệu quả [1]. Một quy tắc pháp lý, theo đó, không chỉ được nhìn từ các tiêu chuẩn công bằng hay đạo đức, mà còn được đặt trong câu hỏi: nó tạo ra chi phí gì, ai được lợi, ai chịu thiệt, và xã hội có vận hành hiệu quả hơn hay không.
Cách tư duy này nằm ở khả năng buộc nhà làm luật bước ra khỏi những tuyên bố chuẩn tắc chung chung để đối diện với bài toán nguồn lực. Thử hình dung một nhà máy gây ô nhiễm đặt gần khu dân cư. Nếu chi phí di dời nhà máy là 100 tỷ đồng, trong khi tổng mức bồi thường thiệt hại cho người dân chỉ khoảng 40 tỷ đồng, một phép tính hiệu quả thuần túy có thể nghiêng về phương án giữ nguyên nhà máy và bồi thường cho người dân. Từ góc nhìn của nhà làm luật, đây là một khoản đã được tính đến trong bài toán chi phí - lợi ích. Nhưng từ góc nhìn của cộng đồng bị ảnh hưởng, điều đó có thể mang một ý nghĩa khác: phần mất mát của họ đã được đưa vào bảng tính như một cái giá có thể chấp nhận.
Nhưng những phép tính như vậy không thể phản ánh đầy đủ mọi tổn thất. Làm thế nào để lượng hóa cảm giác bất an kéo dài, nỗi lo về sức khỏe trong tương lai, hay cảm giác bị buộc phải hy sinh của một cộng đồng?
Chính ở điểm này, lý thuyết triển vọng của Kahneman và Tversky mang lại một bài học quan trọng cho pháp luật: con người không nhìn nhận được và mất theo cách cân bằng. Thông thường, mất đi một thứ mình đang có gây tác động tâm lý mạnh hơn nhiều so với niềm vui khi nhận thêm một lợi ích có giá trị tương đương. Vì vậy, một kết quả có thể được xem là lợi ích ròng trong bảng tính xã hội, nhưng lại là mất mát trong trải nghiệm của người phải gánh chịu nó [2].
Pháp luật dĩ nhiên vẫn cần đo lường rủi ro, tính toán chi phí - lợi ích và xác định đâu là những lĩnh vực cần ưu tiên dành nguồn lực để bảo vệ. Vấn đề nằm ở sự tự tin quá mức vào khả năng lượng hóa mọi tổn thương, nhất là những tổn thương không có giá thị trường và không dễ chứng minh bằng thiệt hại vật chất.
Giới hạn của công thức quản trị rủi ro
Trong thời đại AI, giới hạn cố hữu của các mô hình quản trị dựa trên đo lường và đánh giá rủi ro lại xuất hiện dưới một hình thức mới.
Quản trị dựa trên rủi ro trong pháp luật AI có thể được xem là phiên bản kỹ trị của cùng giấc mơ đo lường: biến tổn thương tiềm tàng thành nhóm rủi ro, xác suất, mức độ nghiêm trọng và nghĩa vụ tuân thủ.
Dù vậy, không phải mọi rủi ro đều biểu hiện dưới dạng những thiệt hại hữu hình như tai nạn, lỗi kỹ thuật hay hành vi phân biệt đối xử có thể chứng minh bằng thống kê. Nhiều tổn thương nằm ở những vùng mềm hơn: sự lệ thuộc ngày càng sâu vào hệ thống, cảm giác mất dần quyền tự chủ trong quyết định, bị thao túng hành vi một cách tinh vi, hay bị cuốn vào các vòng lặp tương tác được thiết kế để kéo dài sự chú ý. Những thiệt hại này, có thể gọi là chi phí đạo đức, thường diễn ra chậm, phân tán và khó xác định quan hệ nhân quả trực tiếp, nhưng điều đó không làm chúng trở nên kém quan trọng hơn đối với con người.
Trong quản trị rủi ro, rủi ro thường được hình dung qua công thức giản lược: Rủi ro = Xác suất xảy ra × Mức độ nghiêm trọng. Dĩ nhiên, các mô hình quản trị rủi ro trong thực tế phức tạp hơn công thức này, nhưng công thức ấy cho thấy trực giác nền tảng của cách tiếp cận: rủi ro cần được xác định qua khả năng xảy ra và mức độ hậu quả. Với các nguy cơ có hình dạng rõ, như tai nạn kỹ thuật, rò rỉ dữ liệu, tấn công mạng, sai lệch mô hình hoặc phân biệt đối xử có thể chứng minh bằng thống kê, công thức này có giá trị rõ ràng.
Tuy nhiên, công thức bộc lộ rõ giới hạn khi đối diện với những tổn thương đạo đức không có giá thị trường, thiếu các thước đo ổn định, và thường nằm ngoài hoặc ở bên lề các mô hình đánh giá rủi ro truyền thống.
Giới hạn đầu tiên nằm ở xác suất. Với các tổn thương đạo đức, xác suất rất khó xác định vì tổn thương không phát sinh từ một sự kiện đơn lẻ. Một video riêng lẻ không gây nghiện. Nhưng hàng nghìn video được gợi ý liên tục, cá nhân hóa và thiết kế để kéo dài sự chú ý có thể dần làm thay đổi khả năng dừng lại của một người [3].
Rất khó đo lường cảm giác khi bị giám sát liên tục bởi một hệ thống chấm điểm. Ảnh minh họa: Hoàng Việt
Giới hạn thứ hai nằm ở mức độ nghiêm trọng. Có thể đo số giờ dùng ứng dụng, số lượt tương tác, số đơn hàng một tài xế nhận được trong một ca. Nhưng rất khó đo sự xói mòn quyền tự chủ cá nhân theo thời gian, hoặc cảm giác bị giám sát liên tục bởi một hệ thống chấm điểm không giải thích đầy đủ lý do.
Giới hạn thứ ba nằm ở quan hệ nhân quả. Chi phí đạo đức thường không phát sinh từ một hành vi đơn lẻ, mà được tích tụ qua nhiều tương tác nhỏ, nhiều lựa chọn thiết kế nhỏ và nhiều gợi ý hành vi lặp lại. Pháp luật vốn quen với việc truy tìm sự kiện, hành vi và hậu quả cụ thể. Với các chi phí đạo đức, điều cần được nhìn thấy lại là cấu trúc thiết kế đứng phía sau chuỗi tương tác ấy.
Cần năng lực liên ngành để đánh giá tác động thực tế của AI
Một hệ thống AI có thể nhận diện một số dấu hiệu bên ngoài của chi phí đạo đức, như thời gian sử dụng quá mức hay tần suất tương tác bất thường, nhưng không thật sự hiểu những dấu hiệu đó như một trải nghiệm gắn với nhân phẩm, bối cảnh xã hội và quan hệ quyền lực. Nó có thể phân loại một người là người dùng có mức tương tác cao, trong khi từ góc nhìn đạo đức, người đó có thể đang mất dần khả năng dừng lại. Giới hạn này đến từ chính cách hệ thống được thiết kế: AI tối ưu hóa thứ được giao để tối ưu, như mức độ tương tác, duy trì người dùng, độ chính xác hay tỷ lệ chuyển đổi. Những gì không nằm trong hàm mục tiêu có nguy cơ bị gạt ra ngoài.
Tựu trung, các tổn thương đạo đức không khớp hoàn toàn với logic chi phí - lợi ích nhưng vấn đề không nằm ở bản thân thuật toán. Khi mô hình kinh doanh, thiết kế sản phẩm và mục tiêu tối ưu cùng hướng về việc giữ con người tương tác lâu hơn, chia sẻ nhiều hơn, phản hồi nhiều hơn, chi phí đạo đức trở thành hệ quả có thể dự đoán.
Đạo luật AI của EU là ví dụ rõ ràng của nỗ lực hệ thống hóa quản trị AI dựa trên rủi ro [4]. Khối này phân chia hệ thống AI theo các mức từ rủi ro không thể chấp nhận, bị cấm, đến rủi ro cao với nghĩa vụ pháp lý chặt chẽ, rồi đến các nhóm rủi ro hạn chế và tối thiểu. Việc cấm một số kỹ thuật thao túng, khai thác điểm yếu của cá nhân hoặc nhóm dễ tổn thương và xây dựng hệ thống chấm điểm xã hội cho thấy pháp luật EU đã nhìn thấy một phần chi phí đạo đức. Tuy vậy, Đạo luật chưa gọi chi phí đạo đức là một nhóm pháp lý độc lập, mà xử lý chúng thông qua ngôn ngữ quyền cơ bản, minh bạch và cấm thao túng.
Việt Nam đã ban hành Luật Trí tuệ nhân tạo vào cuối năm 2025, đánh dấu bước chuyển từ cách tiếp cận quản lý phân tán sang một khuôn khổ pháp lý chuyên biệt cho AI. Tuy nhiên, nếu việc đánh giá và phân loại rủi ro AI chỉ dừng ở hồ sơ kỹ thuật, nghĩa vụ báo cáo và các thủ tục tuân thủ, nhiều tác động tiêu cực đối với con người vẫn có thể nằm ngoài tầm quan sát của cơ quan quản lý. Việc nhận diện và xử lý những tổn hại khó đo lường và khó quy trách nhiệm trực tiếp cho một hệ thống cụ thể như nghiện hành vi, lo âu, lệ thuộc cảm xúc và mất quyền tự chủ đòi hỏi năng lực liên ngành: kỹ thuật AI, tâm lý học, xã hội học, khoa học hành vi, thiết kế sản phẩm, bảo vệ trẻ em và quản trị lao động nền tảng.
Nếu thiếu năng lực này, quản trị dựa trên rủi ro có nguy cơ trở thành một bài tập tuân thủ trên giấy tờ: hệ thống AI được phân loại, hồ sơ được hoàn thiện và quy trình được thực hiện đầy đủ, nhưng những tác động thực tế đối với con người lại không được nhận diện và kiểm soát một cách hiệu quả.
---
Chú thích:
[1] Posner, R. A. (2014). Economic Analysis of Law (9th ed.). Wolters Kluwer.
[2] Kahneman, D., & Tversky, A. (1979). Prospect theory: An analysis of decision under risk. Econometrica.
[3] Horwitz, J., & Seetharaman, D. (2021, September 14). How TikTok’s algorithm figures out your deepest desires. The Wall Street Journal.
'
[4] European Union. (2024). Regulation (EU) 2024/1689 laying down harmonised rules on artificial intelligence (Artificial Intelligence Act). Official Journal of the European Union.