Mối nguy của AI: Đã tệ còn tệ hơn

AI đang làm trầm trọng thêm những vấn đề cũ nhưng vẫn chưa tìm được cách giải quyết.

Hình ảnh giáo hoàng Francis mặc một chiếc áo khoác phao lớn màu trắng. Tổng thống Donald Trump bị cảnh sát bắt giữ, đều là hình ảnh giả mạo, được tạo ra nhờ AI.

Kể từ khi ChatGPT ra mắt vào 30/11/2022, truyền thông tràn ngập những thông tin thổi phồng, những lời cảnh báo và tranh luận về “thiện, ác, tà” của trí tuệ nhân tạo. Loại hình AI mà người ta thảo luận có khả năng sản xuất một lượng lớn văn bản, lời nói, hình ảnh có vẻ chân thực như thể chúng được tạo ra bởi con người. Công nghệ này được dựa trên kỹ thuật học máy, nghĩa là phần mềm được đào tạo sử dụng một lượng lớn dữ liệu – bao gồm lượng lớn dữ liệu văn bản, lời nói hoặc hình ảnh thật do con người tạo ra – để nó có thể tự đánh giá khả năng từ nào sẽ nối tiếp từ nào trong một văn bản, một lời nói, hay làm sao để kết hợp các bức ảnh hoặc làm gì để bắt chước một phong cách nhất định. Theo giáo sư tâm lý và trí tuệ nhân tạo Gary Marcus, loại AI này là một phiên bản nâng cấp tột bậc của autocomplete (một phần mềm tự chỉnh sửa chính tả và đoán trước từ ngữ, ý đồ của người viết trong các đoạn tin nhắn). 

Dĩ nhiên ChatGPT cũng vấp phải những lỗi “chết người”, kể cả về những vấn đề đơn giản. Khi một đồng nghiệp cùng tôi thử một vài câu lệnh, chúng tôi nhận ra rằng cứ khi nào hỏi về tiểu sử của một ai đó là phần mềm này lại đưa ra thông tin sai về năm sinh, năm mất, về trường đại học mà người đó làm việc và liên kết…, kể cả khi Wikipedia đã có hẳn một bài viết về người này với thông tin chính xác. Khả năng cao là lỗi này chỉ là tạm thời và thế hệ chat bot tiếp theo sẽ tốt hơn rất nhiều. 

Khả năng phát triển vũ bão trong thuật toán trí tuệ nhân tạo khiến nhiều người lo lắng, bởi vì họ dự cảm nhiều nguy cơ trong tương lai. Rất nhiều nỗi sợ này dựa trên bối cảnh của phương Tây và chưa chắc đã đúng với Việt Nam. 

* Tội phạm sẽ dễ dàng có thể gửi những tin nhắn hết sức thuyết phục, như đến từ bạn bè hoặc gia đình, khiến các nạn nhân sẵn sàng dâng các thông tin cá nhân và bị ăn cắp danh tính. Những tội phạm cũng dễ dàng lừa người gửi tiền bằng cách thêu dệt những câu chuyện về người thân họ đang gặp nguy khốn, phát ra những lời đe dọa, bịa ra những lời mời gọi lừa gạt và nhiều hình thức lừa đảo khác. 

* Rất nhiều người viết kịch bản, làm quan hệ công chúng, viết quảng cáo và nhiều nghề tưởng như sẽ có một vị trí vững chắc sẽ bị thay thế bởi bot. 

Thời đại chúng ta, sẽ khó khăn để thiết lập một cơ quan giám sát quốc tế về AI – một cơ quan nhận được sự ủng hộ và hợp tác của hầu hết các quốc gia, trong đó có tất cả các quốc gia quyền lực nhất – như thời điểm mà IAEA ra đời. 

* Những người sử dụng chat bot muốn tìm kiếm sự giúp đỡ, chẳng hạn như lời khuyên về y tế, có thể nhận lại những thông tin sai lệch gây hại cho họ. Hơn nữa, họ có thể tự cung cấp thông tin cá nhân của mình, như các chỉ định về tình trạng sức khỏe để rồi thông tin này được phục vụ cho mục đích đào tạo bot. Nhiều người liên quan đến công ty đằng sau con bot này sẽ tiếp cận những thông tin của họ, dẫn đến việc họ bị xâm phạm đời tư nghiêm trọng. 

* Ngày càng nhiều bài luận và bài giới thiệu bản thân của các ứng viên nộp đơn vào đại học là do bot viết và những sinh viên đại học cũng sẽ nộp bài làm trong khóa học về khoa học xã hội và nhân văn, cũng do bot viết. Kể từ khi ChatGPT ra mắt vào tháng 11 vừa qua, có rất nhiều báo cáo về sự gian lận sử dụng AI trong các trường Đại học Mỹ một cách rộng rãi, đặc biệt là đối với các khóa nhập môn. Sinh viên thường xuyên hoặc nộp nguyên một bài làm do ChatGPT viết hoặc là chỉ chỉnh sửa phiên bản của ChatGPT làm một chút để người chấm khó nhận ra ngay đây là sản phẩm của một chat bot. 

* Các phe phái chính trị có thể dễ dàng và nhanh chóng phát tán những lời bôi nhọ bịa đặt nhưng dễ “dắt mũi” người đọc về đối thủ trên internet. 

* Những nhóm cực đoan sẽ đăng những thông tin sai lệch trên mạng xã hội để kích động những đám đông bạo lực. Phong trào phân biệt chủng tộc, phong trào bài ngoại và các vụ xả súng sẽ dâng cao. 

Phần lớn những vấn đề này chẳng có gì mới và không hề xuất phát từ AI. Những vụ lừa đảo, chiếm đoạt và cướp danh tính dường như là chuyện xưa cũ trên internet. Một lượng bằng chứng đáng kể đã cho thấy rằng Chính phủ Nga đã cố ý điều hướng những cử tri Mỹ trong sự kiện bầu cử tổng thống năm 2020 bằng cách phao tin bôi nhọ Hilary Clinton và Đảng Dân chủ qua mạng xã hội. Trong đại dịch Covid-19, những thông tin sai lệch về vaccine trên những trang web có lượt truy cập khủng là một phần nguyên nhân dẫn đến tỉ lệ tử vong cao ở Mỹ. Công nghệ chỉnh sửa ảnh đã tạo điều kiện cho bất kì ai cũng có thể tạo ra những bức ảnh bị bóp méo và giả mạo mà chưa cần đến AI. Từ lâu trước khi AI ra đời, sinh viên có thể mua bán các bài viết cho khóa học của họ trên các website hoặc trả tiền cho ai đó làm hộ họ. Bài luận xin vào đại học của nhiều sinh viên cũng hay được nhiều phụ huynh viết hộ. Ở Mỹ, chỉ có những người có tiền mới có thể thực hiện những gian dối kiểu này để bảo vệ đặc quyền tầng lớp xã hội và duy trì sự bất bình đẳng xã hội từ thế hệ này đến thế hệ khác. Nếu vậy, giờ đây ta thậm chí có thể nói AI sẽ “dân chủ hóa việc gian dối” vì nó sẽ tạo điều kiện cho cả học sinh nghèo nhanh chóng tạo ra bài nghiên cứu và bài luận mà chỉ mất rất ít tiền hoặc miễn phí. 

Dự báo một số ngành nghề như quan hệ công chúng, quảng cáo, tương tác, chăm sóc khách hàng sẽ thay đổi nhờ AI. Ảnh: Getty.

Sự thay đổi do AI tạo ra sẽ là (1) Gia tăng quy mô khủng khiếp của những vấn đề đã và đang diễn ra; (2) Việc tạo ra những sản phẩm thông tin giả mạo và sai lệch đánh vào niềm tin của người xem sẽ ngày càng dễ và ngày càng rẻ; và (3) Sự xuất hiện của một số lượng khủng khiếp các chất liệu trên mạng khiến người ta gần như không thể phân biệt được đó là do máy tạo ra, khiến người ta nghi ngờ những gì gọi là sự thật, sự nguyên bản, sự xác tín, sự tin cậy. 

Đã có nhiều chiến lược đề ra để đối mặt với những nguy cơ của AI. Những người đứng sau ChatGPT nói rằng nên có một tổ chức giám sát quốc tế quy định và theo dõi AI, giống như Cơ quan Năng lượng Nguyên Tử Quốc tế (IAEA) đã làm cho việc sử dụng năng lượng nguyên tử vì mục đích hòa bình. Tuy nhiên, ở thời đại chúng ta, sẽ khó khăn để thiết lập một cơ quan giám sát quốc tế mới – một cơ quan nhận được sự ủng hộ và hợp tác của hầu hết các quốc gia, trong đó có tất cả các quốc gia quyền lực nhất – như thời điểm mà IAEA ra đời. 

Một giải pháp khác để trả lời cho vấn đề các chứng từ giả mạo là tạo ra một hệ thống chứng nhận được bảo vệ bằng mật mã, đảm bảo rằng một văn bản (ảnh, chữ, ghi âm hay video) này là bản gốc, chưa bị chỉnh sửa hoặc bổ sung gì. Những chứng nhận sự nguyên bản này là một chủ đề mà người ta đã nghiên cứu kĩ trong ngành mật mã học. Chúng hoạt động theo cách sau: bất kì một văn bản số nào đều có thể được nhìn nhận như một dãy của 0 và 1. Tác giả của văn bản này sẽ đưa nó vào một hàm băm tiêu chuẩn và đầu ra của nó là một dãy bits ngắn hơn, gọi là “giá trị hàm băm” của văn bản đó, đóng vai trò như dấu vân tay của mỗi người vậy. Tác giả sẽ ký chữ ký số vào giá trị hàm băm đó và gửi văn bản cùng với giá trị hàm băm đã ký tới Cơ quan chứng nhận (CA). CA sẽ tính toán giá trị hàm băm của văn bản (tức là đối chiếu với kết quả họ tính được và giá trị mà tác giả gửi đến xem có giống nhau không) và xác nhận chữ ký tác giả. Sau đó CA sẽ công nhận giá trị hàm băm đó và gắn nó với văn bản được gửi đến. Giá trị hàm băm được công nhận cuối cùng đó chính là “giấy chứng nhận” của nó. 

Khi một văn bản đã được chứng nhận theo hướng mật mã như vậy, ai cũng có thể kiểm chứng giá trị hàm băm (bằng cách áp dụng hàm băm mà tác giả của nó đã sử dụng) và chữ kí của CA (sử dụng khóa công khai của CA, được nhúng vào tất cả các trình duyệt web tiêu chuẩn). Một khi làm như vậy, người đọc, người nghe, người xem đều có thể chắc chắn rằng văn bản đó không bị sửa hay thêm thắt gì và tên hoặc tổ chức được ghi nhận là tác giả của văn bản đó thực sự là người tạo ra nó. 

Thử thách lớn ở đây là làm sao để giáo dục công chúng về sự cần thiết trong việc kiểm tra và xác nhận chứng chỉ đó. Các trình duyệt có thể được thiết lập theo cách để chứng chỉ này hiện ra một cách nổi bật và quá trình xác minh sẽ hết sức đơn giản và thân thiện với người dùng. Tuy nhiên, lựa chọn xác nhận một chứng chỉ là thứ mà một người dùng internet sẽ hay bỏ qua. Nếu họ không tự xác nhận thì họ không biết văn bản đó có thật hay giả. Rất buồn là Mỹ có một tỉ lệ lớn người dân không quan tâm đến sự thật hay sự giả dối và vui vẻ tin vào những bản ghi âm và video toàn những lời bịa đặt nhưng khớp với quan điểm trước đó của họ. 

Một cách tiếp cận với vấn đề sinh viên sử dụng AI để gian dối trong bài luận ứng tuyển vào đại học là việc tìm lại niềm tin vào kết quả của các bài thi chuẩn hóa, vốn bị đa số trường bỏ rơi ở Mỹ nhưng vẫn là phương án chủ lực để tuyển chọn sinh viên ở hầu hết các quốc gia châu Á. Tuy nhiên, một hạn chế quan trọng của các bài thi chuẩn hóa là nó chủ yếu đo lường khả năng ghi nhớ dữ kiện và trình bày một vài bước logic liên quan đến tính toán. Nói chung nó không đánh giá được kĩ năng giải quyết vấn đề và tư duy phản biện của học sinh. Hơn nữa, một học sinh dành nhiều thời gian học các khóa luyện thi và luyện đề sẽ có lợi thế lớn hơn rất nhiều so với những học sinh không có thời gian hay tiền bạc để làm vậy. Với lí do này, hầu hết các đại học của Mỹ đã hạ thấp tầm quan trọng hoặc bỏ kết quả thi chuyển hóa trong quy trình tuyển sinh. 

Nhưng bỏ đi rồi thì các trường này vẫn chưa có một phương án thay thế đáng tin cậy nào cho các bài thi chuẩn hóa. Điểm số ở trường phổ thông thì bị thổi phồng, bởi vậy có vô số những ứng viên có điểm số tối đa trong tất cả các môn học của mình. Giấy giới thiệu của giáo viên và những người khác cũng bị đánh bóng – họ chỉ chăm chăm nói về những điểm tích cực của ứng viên. Và, như đã nói ở trên, những bài luận mà ứng viên gửi chưa chắc đã là do họ tự viết. Chưa ai có một giải pháp tốt cho vấn đề căn cốt của việc tìm được những dữ liệu đáng tin cậy và xác đáng, đủ khả thi để đánh giá các đơn nhập học vào đại học. 

Hay cũng chưa ai có một giải pháp cho việc sinh viên sử dụng AI để gian lận khi làm các bài tiểu luận, báo cáo hoặc nghiên cứu. Một giải pháp khả dĩ là chỉ yêu cầu một bài viết ngắn, hoàn thiện ngay trong giờ lên lớp, phải viết tay và không được phép sử dụng bất kì thiết bị điện tử nào. cách khác là tổ chức trung tâm kiểm tra và đề bài cũng chỉ yêu cầu một bài viết ngắn, sinh viên chỉ được kết nối với các thiết bị của trung tâm và các thiết bị này ngắt kết nối với internet. 

Tôi dạy một khóa tập trung viết luận tên là “Những trường hợp sử dụng Toán học sai lầm dẫn đến thúc đẩy sự bất công, bất bình đẳng và phân biệt chủng tộc,” trong đó những sinh viên học cách tìm kiếm những lỗi ngụy biện trong các tư duy định lượng và viết giải thích về các ngụy biện này theo cách đại chúng cũng có thể hiểu được. Một bài tập của tôi là viết một điểm sách 750 từ về cuốn “The Mismeasure of Man” (Tạm dịch là Thước đo sai lệch của con người), một cuốn sách kinh điển của nhà cổ sinh vật học và sinh học tiến hóa nổi tiếng Stephen Jay Gould. Cuốn sách lý giải lịch sử của những nhận định giả khoa học về thuyết da trắng thượng đẳng vốn được dùng để biện minh cho chủ nghĩa thực dân của châu Âu, chế độ nô lệ và phân chia chủng tộc ở Mỹ. Tôi yêu cầu trong điểm sách của mình, các sinh viên phải bao gồm một giải thích rõ ràng – rõ ràng kể cả đối với các sinh viên ngành khoa học xã hội và nhân văn – về ngụy biện toán học chính mà Gould phát hiện ra trong tư duy thống kê của những tác giả nhận định rằng những khác biệt giữa các nhóm người trong kết quả các bài kiểm tra xuất phát từ sự khác biệt về gene quy định trí thông minh giữa họ. Tôi nói với sinh viên của mình rằng họ hoàn toàn có thể đơn giản hóa phần toán học một chút để lời giải thích có thể vừa với khuôn khổ 750 từ và công chúng có thể hiểu được dễ dàng. Để bài luận được điểm cao, sinh viên phải dành phần lớn dung lượng trong phần điểm sách để giải thích thứ mà Gould gọi là “Ngụy biện đơn giản hóa (reification fallacy) trong phương pháp thống kê phân tích nhân tố. 

Theo hiểu biết của tôi, không có bất kì một điểm sách nào về cuốn của Gould hay một nguồn tài liệu online nào giải thích cụ thể toán học của ông cả. Lời giải thích trong sách cũng được, nhưng quá dài và quá chi tiết cho một điểm sách; và quá phức tạp và dông dài với hầu hết các sinh viên khoa học xã hội – nhân văn và đại chúng không làm khoa học có thể hiểu được. Bài viết trong khóa học của tôi đều hướng đến công chúng, bởi vậy nó cần một tư duy độc lập và cẩn trọng, điều mà AI khó có thể làm tốt được, ít nhất là trong một tương lai ta có thể hình dung ra. 

Trong khóa học dành cho sinh viên năm ba và bốn, giống như khóa tôi đã dạy, tôi nghĩ để có điểm cao, các bài viết của sinh viên phải thể hiện một cấp độ tư duy vượt xa những gì một chat bot có thể làm được. Nếu chúng ta đặt ra yêu cầu cao cho bài luận của sinh viên, có lẽ chúng ta không phải lo lắng về việc một chat bot có thể làm hộ họ.□

Hảo Linh dịch 

Tác giả