AI có thể bắt chước các sắc thái hài hước của con người?

Khi con người ngày một tìm đến AI để cho các liệu pháp điều trị hoặc thậm chí bầu bạn, có người tin rằng các mô hình này vẫn còn ẩn chứa nhiều điều đáng mong đợi khác nữa.

AI đang được kỳ vọng sẽ có được sự hài hước.

Sau nhiều thập kỷ làm nghề viết các kịch bản hài cho những chương trình truyền hình phát vào đêm muộn, Joe Toplyn đã tạo ra những màn hài hước cho các MC truyền hình nổi tiếng như David Letterman, Jay Leno. Ông cũng đã mở những khóa dạy viết tác phẩm văn chương hài hước cho người lớn và dạy hàng trăm sinh viên về cách xây dựng các bản thảo trào lộng. Ông cũng phân tích hàng trăm truyện cười để hiểu về những mẫu hình bên trong chúng và điều gì khiến chúng trở nên tức cười, ông thậm chí còn xuất bản một cuốn sách về chủ đề này. Vì vậy, khi AI tạo sinh xuất hiện, Toplyn đã tự hỏi: liệu có thể kết hợp các kỹ năng ngôn ngữ của các mô hình ngôn ngữ lớn, với những bài học mà ông đã dạy sinh viên để tạo ra một cỗ máy biết viết truyện cười?

Kết quả là ra đời một công cụ AI cừ khôi tên là Witscript – một ứng dụng trên web có mức phí sử dụng là 5,99 USD một tháng, cho phép người sử dụng có thể đưa vào đó những gợi ý như những tin nóng hổi và các miêu tả hình ảnh để rồi nhận lại những truyện cười, những đoạn văn hài hước và nhiều hình thức chơi chữ thông minh.

Năm ngoái, Toplyn và Witscript đã thử ganh đua trong một cuộc thử nghiệm viết truyện cười. Cả hai cùng có thời gian là ba ngày để viết những câu chuyện cười mới về tám cây thường xuân. Toplyn chọn dạng chuyện cười thế mạnh của mình và lựa chọn những chất liệu hứa hẹn nhất cho Witscript – sau đó mời họa sĩ biếm họa Mike Perkins truyền tải những dòng gây cười này đến với khán giả Los Angeles. Một nửa câu chuyện do Toplyn viết, phần còn lại là do Witscript.


Cho đến bây giờ, các mô hình ngôn ngữ lớn chỉ có được sự hài hước nếu như chúng sử dụng ngôn ngữ theo các cách mà con người vẫn làm vì sự hài hước ở nhiều hình thức khác nhau là “một trong những thứ người nhất, nhân văn nhất về ngôn ngữ và giao tiếp”, theo Tristan Miller, chuyên gia về ngôn ngữ học điện toán.

Cùng với Ori Amir, một nhà khoa học thần kinh ở Pomona College và một nghệ sĩ hài độc thoại (stand-up) thường biểu diễn trước khán giả, Toplyn thu âm các buổi trình diễn và đo lường thái độ thưởng thức của khán giả thông qua độ lớn của tiếng cười cũng như thời gian vang vọng của tiếng cười qua từng tình huống hài hước. Toplyn và Amir phát hiện ra là, qua thước đo đó, những tình huống hài hước do người hay A.I. tạo ra đều ngang bằng nhau. Họ đã trình bày kết quả này tại Hội thảo đầu tiên về Sự hài hước điện toán (computational humor) – một nhánh của ngôn ngữ học điện toán và trí tuệ nhân tạo sử dụng máy tính trong nghiên cứu về sự hài hước. 

Cho đến tận bây giờ, các chuyện cười đều được nghĩ là quá sức với AI. Chúng được coi là quá phức tạp và một mô hình AI có thể cần có “một năng lực suy nghĩ giống người” để ghi nhận hoặc tạo ra truyện cười, Toplyn nói. Và giờ thì suy nghĩ này không còn đúng nữa.  

Với sự tiên tiến của các mô hình ngôn ngữ lớn, và các công cụ được xây dựng trên những mô hình ngôn ngữ lớn như Witscript, việc tạo ra tiếng cười không còn là biên giới cuối cùng. Dẫu sự hài hước bao hàm cả một phổ rộng biểu hiện nằm ngoài bản thân từ ngữ – một sự im lặng mang tính chiến lược hoặc quãng thời gian để các cặp lông mày nhướn lên cũng có thể tương đương với tiếng cười – “hóa ra là với AI, việc tạo ra một vài dạng câu chuyện hài hước còn dễ hơn là lái một chiếc ô tô an toàn”, Amir nói.

Một bức họa của Gerrit van Honthorst.

Nhưng các chuyên gia cảnh báo là còn có một khoảng cách lớn giữa việc làm con người cười với kỹ năng làm chủ các sắc thái hài hước của con người. Hài hước là thứ rất tinh tế, Christian F. Hempelmann, một nhà nghiên cứu về ngôn ngữ học điện toán tại ĐH A&M Đông Texas, nói. Vì vậy, cần phải hiểu các quy ước xã hội – và biết khi nào nên phớt lờ chúng đi. Và sự hài hước có những chức năng xã hội đầy quyền lực: những câu nói hài hước có thể được dùng như một phương thức để con người vượt qua được những khoảnh khắc ngượng ngùng, xấu hổ, có thể ẩn chứa một lời lăng mạ ngấm ngầm hoặc dấn thêm một bước nữa trong một mối quan hệ nào đó… Và tại khoảnh khắc mà các ứng dụng AI ngày càng được sử dụng như những liệu pháp điều trị, các trợ lý và thậm chí là bạn bè, nhiều chuyên gia cho rằng điều quan trọng là việc các mô hình này sẽ phải hiểu và phản hồi một cách phù hợp trước những hình thức tinh tế khác nhau của sự hài hước, ví dụ như lời châm biếm mỉa mai, sự thiếu tôn trọng và cả sự khiếm nhã. Nếu một người trả lời một nhắc nhở về một cuộc hẹn nội soi ruột kết, “ừ giết tôi đi”, thì một trợ lý ảo AI phải biết rằng không được phép hiểu câu này theo nghĩa đen.

Trong nghệ thuật gây hài hước, có một sự khác biệt cơ bản giữa việc tạo ra một câu chốt hạ trong một câu chuyện cười và việc sử dụng yếu tố hài hước mà con người vẫn thường làm, theo nhận xét của Tristan Miller, một chuyên gia về ngôn ngữ học điện toán tại ĐH Manitoba. Nguyên nhân là bởi các mô hình máy móc hiện hành không biểu hiện được đầy đủ cách thức và các lý do khiến con người tạo ra yếu tố hài hước. Cho đến bây giờ, các mô hình ngôn ngữ lớn chỉ đạt được sự hài hước nếu như chúng sử dụng ngôn ngữ theo các cách mà con người vẫn làm, Miller nói, vì sự hài hước ở nhiều hình thức khác nhau là “một trong những thứ người nhất, nhân văn nhất về ngôn ngữ và giao tiếp”.


Các chuyên gia cảnh báo, vẫn còn có một khoảng cách lớn giữa việc AI làm con người cười với kỹ năng làm chủ các sắc thái hài hước của con người.

Tiếng cười đã thu hút trí tò mò các nhà khoa học trong nhiều thế kỷ. Tuy nhiên nhiều nhà triết học, trong đó có Plato và Descartes, đã bác bỏ tiếng cười và đề xuất rằng con người sử dụng sự hài hước chỉ để thiết lập sự ưu việt của mình hoặc của vị thế trong một nhóm xã hội nào đó, thông qua việc tạo ra tình huống chế giễu người khác. Nhà khoa học thần kinh Herbert Spencer và các nhà lý thuyết khác thì cho rằng tiếng cười là một dạng giải tỏa căng thẳng thần kinh để ứng phó với sự không phù hợp hoặc phi lý. Gần đây, các chuyên gia khoa học thần kinh đã tìm cách để hiểu điều gì trong các mẫu hình ngôn ngữ trở thành nguyên nhân tạo ra tiếng cười. Theo một lý thuyết phổ biến, những câu nói gây cười nhất thường đóng vai trò tác động qua lại của sự nhập nhằng về nghĩa, sự phi lý và một giải pháp đột ngột xuất hiện xóa bỏ sự phi lý này, qua đó kích thích các kết nối thần kinh.

Ví dụ: Có hai con cá trong một cái bể. Một con nói với con còn lại “Cậu cầm súng nhé, tớ sẽ cầm lái”. Như nhà khoa học dữ liệu Thomas Winters viết trong một bài báo năm 2021 về hài hước điện toán, truyện cười này hợp lý bởi cái nhập nhằng của từ “tank” – có thể là bể nước hoặc xe tăng – và cái phi lý của hình ảnh con cá cầm súng. Cái hài hước thể hiện trong sự cân bằng giữa các từ tạo nên hình ảnh trái ngược nhau: hình ảnh hợp lý của con cá trong bể nước và hình ảnh kỳ cục của con cá trên một cái xe tăng. Việc tạo ra sự cân bằng đó là thách thức học hỏi với các thuật toán, nhà nghiên cứu về hài hước điện toán Julia Rayz của trường Đại học Purdue, nhận xét.

AI vẫn còn chưa hiểu hết giá trị của sự hài hước nhưng đã bắt đầu tạo ra những câu chuyện mang sắc thái hài hước.

Gần đây, các mô hình ngôn ngữ lớn đã bắt đầu quá trình vượt qua thử thách này. Năm ngoái, nhà nghiên cứu tâm lý học xã hội Drew Gorenz của ĐH Nam California và cộng sự đã tìm thấy ChatGPT 3.5, sau khi được gợi ý học hỏi khoảng 50 tiêu đề trên một tạp chí trào phúng của Mỹ là The Onion, đã có thể viết những tít bài theo phong cách châm biếm của tờ này, đủ tốt để đối đầu với những sản phẩm do con người tạo ra. Một nhóm 200 độc giả đã đánh giá tít bài của AI tương đương với tít bài gốc của tạp chí.

Với Witscript, quá trình này còn đi xa hơn thế. Toplyn, người sáng tạo Witscript, đã dành nhiều năm để đưa hài kịch trở thành một khoa học. Ông phân tích hàng trăm truyện cười, chưng cất quá trình viết truyện hài này vào một nhóm các thuật toán đơn giản. Những diễn viên hài xuất sắc thường làm được việc này một cách tự nhiên, ví dụ họ có thể xây dựng được một cốt truyện, một tiến trình và tạo ra một câu chốt hạ cho một truyện cười và sau đó tạo ra một cây cầu trung gian để nối các chất liệu lại với nhau.

Để tạo được một hệ thống có thể thực hiện được nhiệm vụ tương tự, Toplyn kết hợp các thuật toán viết truyện hài của mình với một mô hình ngôn ngữ lớn. Bằng việc trao cho Witscript các quy tắc logic và các cách có cấu trúc để tổ chức thông tin, ông đã cho phép hệ thống này tạo ra một câu theo theo chủ đề mà người dùng nhập vào và sử dụng nó tạo ra một câu tương ứng. Khung bên trong này đem lại cho Witscript khả năng lựa chọn từ ngữ và hòa trộn các âm tiết và từ để tìm ra sự hài hước. Ví dụ, trong một chia sẻ trên mạng xã hội X vào tháng sáu vừa qua, Toplyn gõ lên Witscript lời gợi ý “Christie’s đang bán đấu giá viên kim cương màu hồng 10 cara từng thuộc về hoàng hậu Marie Antoinette” và nhận được câu trả lời “Viên kim cương có một vết cắt hoàn hảo – giống như đầu bà ấy”. Câu nói hài hước này có cả lối chơi chữ và sự hiểu biết nhất định về số phận bi thảm của Marie Antoinette.


Các thuật toán có thể làm tăng sự thiên kiến trong lĩnh vực chăm sóc sức khỏe và các quyết định tài chính, các câu dí dỏm do AI tạo ra có thể kích động sự phân biệt giới, chủng tộc và các dạng thiên kiến độc hại khác.

Toplyn là một trong số các nhà nghiên cứu tin là một AI hài hước nhiều hơn có thể tạo ra nhiều lợi ích cho thế giới thật. Khi nỗi cô đơn ngày một trở thành thứ bệnh dịch nguy hiểm, con người càng tìm kiếm sự đồng hành của AI. Họ sẽ phải cảm thấy dễ dàng trao đổi với một trợ lý ảo hoặc một người bạn robot nếu như đối tác có thể nói một câu chuyện hài hước “một dạng hài hước mà bạn bè họ có thể quăng ra trong các cuộc trò chuyện”,  Toplyn nói.

Những dấu hiệu của sự hài hước có thể mang lại sự thăng tiến nghề nghiệp: một nghiên cứu gần đây cho thấy “sự khoe khoang hài hước” có thể cải thiện sự thành công của những ứng viên phỏng vấn xin việc và thành công của doanh nghiệp trong việc tìm kiếm tài trợ cho các dự án. Các công cụ AI có thể giúp người dùng cách chơi chữ trong các bài viết để xoa dịu căng thẳng hoặc soạn các bức thư dí dỏm và những đoạn ngắn hài hước trên mạng xã hội, Gorenz nói. Khi lên kế hoạch tổ chức một sự kiện về rượu vang và phô mai, Gorenz đã thử dùng ChatGPT để tạo ra một email với câu kết hài hước như ‘Giữ liên lạc với Brie” – Brie là tên gọi một loại phô mai. “Có thể đưa thêm những dấu ấn nhỏ bé này cho bất cứ điều nào bạn có thể”, ông nói.


Dẫu AI có thể được gợi ý viết một truyện cười, nó sẽ không bao giờ có thể sử dụng sự hài hước để thoát khỏi một tình huống khó khăn hoặc khám phá những khả năng của mình như con người. 

Cho đến giờ, có thể chưa dự đoán được sự hài hước mà AI tạo ra về cả giọng điệu lẫn chất lượng và cũng chưa thấy được bối cảnh cá nhân và bối cảnh rộng hơn của một vài câu hóm hỉnh, Rayz nói. Cũng như các thuật toán có thể làm tăng sự thiên kiến trong lĩnh vực chăm sóc sức khỏe và các quyết định tài chính, các câu dí dỏm do AI tạo ra có thể kích động sự phân biệt giới, chủng tộc và các dạng thiên kiến độc hại khác.

Roger Saumure, một nghiên cứu sinh đang nghiên cứu về marketing ở ĐH Pennsylvania, nhận thấy rằng khi mình hỏi các mô hình ngôn ngữ lớn như  ChatGPT, tương tác với công cụ tạo hình ảnh như Dall-E, để tạo ra những bức tranh hài hước hơn thì nó có thể tạo ra “những thay đổi rất kỳ quặc và theo khuôn mẫu” như thay thế một người đàn ông tầm vóc trung bình thành một người béo phì đeo kính quá khổ.

Saumure và giáo sư hướng dẫn đã nghiên cứu vấn đề này sâu hơn. Họ gợi ý ChatGPT tạo ra những bức vẽ người đọc, giặt giũ hoặc làm những việc thông thường khác, sau đó tiếp tục gợi ý nó tạo ra những hình ảnh gây cười. Kết quả thật đáng ngạc nhiên: sự hiện diện của “nhóm thiểu số về giới và chủng tộc suy giảm một cách đáng kể”, Saumure nói, còn các nhà nghiên cứu quan sát thấy sự gia tăng rõ nét trong sự hiện diện của những người “cao bất thường, người lớn tuổi hơn và người khiếm thị”. Saumure cho rằng điều này có thể phản ánh một sự thiên kiến chống lại những nhóm người nhất định đã có sẵn trong dữ liệu được thu thập để huấn luyện các mô hình ngôn ngữ lớn này.

Dữ liệu nhấn mạnh vào tầm quan trọng của việc không được bỏ sót các thuật toán về hài hước, Saumure nói. Nhưng Toplyn nói, đây không phải là điều ngạc nhiên bởi kết quả nhấn mạnh vào số lượng “những người đáng sợ trong xã hội của chúng ta nghĩ rằng ‘người béo nghĩa là người đáng buồn cười’”.

Một sự thật nữa truyện cười do AI tạo ra, theo Hempelmann, là rất nhiều thứ trong đó quá xoàng xĩnh. Ông chỉ ra, dẫu Witscript có thể tạo ra một tập truyện hài thành công trong một cuộc thi sáng tạo truyện hài thì đó là bởi Toplyn, một chuyên gia hài nên đã cung cấp những gợi ý cho Witscript và sau đó tự chọn một truyện gây hài nhất trong hàng tá thứ mà ứng dụng AI này viết ra.

Dạng quá trình tinh tuyển này đòi hỏi hiểu biết của cả hai bên, khán giả và người trình diễn, Toplyn nói. Witscript có thể viết được những mẩu hài hước nhưng con người mới là yếu tố quyết định liệu các sản phẩm này có thật sự gây cười không.

Liệu AI có thể biết khi nào – và tại sao – nó đang hài hước không? Đó là một câu hỏi đang dấy lên trong đầu nhiều nhà nghiên cứu về sự hài hước điện toán, và câu trả lời cho nó rất phức tạp và không đồng nhất.

ChatGPT không được thiết kế để tạo ra sự hài hước; nó được thiết kế để tạo văn bản và dự đoán văn bản. “Nó không thể cảm nhận được những biểu cảm liên quan đến tiếng cười và thực sự nhận thức được một tiếng cười đúng”, Gorenz giải thích.

“Nhưng nó vẫn có thể tạo ra những điều gây hài,” ông nói. “Đó là dạng đề xuất rằng có lẽ tất cả những gì bạn cần là có nhiều dữ liệu và ghi nhận khuôn mẫu để nhận ra điều gì làm nên một trò hài hước để tự tạo ra một thứ tương tự. Bạn có thể không cần phải hiểu đúng những thứ mà bạn viết ra”. 

Nhưng với Hempelmann, một bậc thầy hài hước phải hiểu được mục đích của mình. “Sự hài hước là cách bạn chơi đùa với ý nghĩa”,  Hempelmann nói – nó cho phép con người khám phá đa dạng ý tưởng mà không cần phải làm rõ ý định của mình. Một trò đùa có thể chạm đến những giá trị chung nhưng một khi vượt qua lằn ranh để bước vào những địa hạt cấm kị thì vẫn có thể được ‘thu hồi’ bằng câu chống chế ‘ồ không không, tôi không có ý định nói như vây, tôi chỉ đùa thôi”, ông lưu ý.

Sự hài hước, nói theo cách khác, cho phép con người đo lường được ý định, các nguyên tắc và hành trang cảm xúc của người khác theo một cách tinh tế và kín đáo hơn. Một số nghiên cứu trước đây cho thấy các động cơ đằng sau một trò hài hước – và con người cần giữ kín nó – có thể là những nhân tố quan trọng của sự hài hước: trong dữ liệu chưa được công bố, cả Toplyn và Gorenz đều đã phát hiện ra rằng, con người thấy trò đùa ít hài hơn khi họ nhận ra nó do AI viết.

Dẫu AI có thể được gợi ý viết một truyện cười, nó sẽ không bao giờ có thể sử dụng sự hài hước để thoát khỏi một tình huống khó khăn hoặc khám phá những khả năng của mình, Hempelmann nói. “Nó không có những nhu cầu như của con người”. Ông thấy đây là rào cản chính giữa việc kể một câu chuyện cười và đạt được sự hài hước bậc thầy. Khi hỏi liệu một AI sẽ có thể bắc cầu qua khoảng trống này không, ông chúm môi thổi phù vào một quả mâm xôi.

“Chỉ có con người mới làm được như vậy”, Hempelmann nói, đó là một tương tác thể hiện cảm xúc với sự hài hước, thậm chí ngay cả khi tình thế không hoàn toàn vui vẻ. “Bạn có thể tìm thấy ở đó sự thô tục, bạn có thể tìm thấy sự táo tợn xâm chiếm, bạn có thể tìm thấy trong trò hài hước ấy một sự thật mới,” ông cho biết thêm. “Tất cả những điều đó, chỉ con người mới có thể làm được”.□

Tô Vân dịch

Nguồn: https://www.smithsonianmag.com/innovation/can-artificial-intelligence-learn-the-nuances-of-human-humor-180987052/

Bài đăng Tia Sáng số 15/2025

Tác giả

(Visited 10 times, 10 visits today)