Khi AI học làm thơ

LTS: Bài viết này đã được đăng tải trên tạp chí New Yorker từ năm 2020. Năm năm trôi qua, trải qua biết bao thế hệ AI, giờ đây con người đã hầu như không thể phân biệt được thơ do con người và máy tính viết ra nữa. Tuy nhiên, những suy tư về cách mà ta nên nhìn nhận những sản phẩm “nghệ thuật” của AI trong tương lai vẫn còn đậm tính thời sự.

AI có nên thay đổi cách chúng ta đón nhận nghệ thuật?

Lịch sử về những cỗ máy thông minh là sự chuyển dịch liên tục của những viễn kiến: Máy móc có thể làm việc này rồi, thế còn việc khác thì sao? "Việc khác" thường là một thành tựu khiến ta kinh ngạc - như thứ gì đó gắn chặt với cảm xúc – điều có vẻ rất đỗi con người. Một robot có thể hút sạch vụn bánh trong phòng khách của bạn thì không hề ấn tượng hay đáng sợ bằng một robot có thể khiến bạn nghẹn ngào xúc động.

Thơ ca là một địa hạt tốt để hướng đến: nó bắt nguồn từ cảm hứng và sự hài hước – những điều sâu sắc mang tính người – vậy nhưng, trong nhiều dạng thức của nó, thơ ca lại tiến gần đến tính toán và thuật toán. Thơ ca dường như đã được ngầm định trong bản tuyên ngôn "táo bạo" năm 1955 - lần đầu tiên giới thiệu về lĩnh vực trí tuệ nhân tạo, khẳng định rằng "sẽ có nỗ lực tìm ra cách làm cho máy móc sử dụng ngôn ngữ, tạo lập nên các khái niệm trừu tượng". Những người tiên phong trong lĩnh vực AI chưa bao giờ đề cập trực tiếp đến thơ ca, nhưng nếu để ý, bạn có thể thấy tinh thần đó trong tham vọng của họ khi nghiên cứu "các quy tắc" liên hệ tư duy con người với việc "vận dụng" từ ngữ của máy, trong nỗ lực khám phá mối quan hệ giữa sáng tạo và ngẫu nhiên – chưa kể đến mục tiêu lớn hơn của họ là tạo ra những cỗ máy có thể "tự hoàn thiện mình".

Thơ sonnet chiếm một vị trí dường như lý tưởng: đây là một hình thức nghệ thuật phong phú (tốt cho các nhà thơ) với những quy tắc rõ ràng (tốt cho máy móc).

*Encomials (cận-kiệt tác) – Tuyển tập thơ sonnet có sự hỗ trợ của máy tính xuất bản vào năm 2018.*

Có nhiều điểm cộng hưởng giữa lập trình và thơ ca hơn bạn có thể hình dung. Khoa học máy tính là một hình thức nghệ thuật của từ ngữ và dấu câu, được sắp đặt một cách thận trọng và có chủ đích, dù không nhất thiết phải được triển khai để tạo ra bất ngờ hay khát khao. Khi trình bày trên trang giấy, mỗi chương trình đều sử dụng thụt lề, chia theo khổ, và một hệ thống phân cấp trực quan đặc biệt để truyền tải ý nghĩa. Trong những bối cảnh tốt đẹp nhất, người đọc kỹ mã lệnh sẽ được thưởng thức cảm giác kinh ngạc về cách các ý tưởng được gói gọn trong từ ngữ. Lập trình có thẩm mỹ tối giản riêng, bắt nguồn từ yêu cầu tạo ra phần mềm không chiếm nhiều dung lượng và không tốn nhiều thời gian thực thi. Các lập trình viên cố gắng diễn đạt ý định của họ bằng ít lệnh nhất có thể; William Carlos Williams, với phong cách giản dị và những hình ảnh đơn giản, biểu tượng của ông, hẳn sẽ đánh giá cao điều đó. "Con đường chưa ai đi" của một nhà thơ chính là câu lệnh "if-then-else" (nếu - thì - không thì) của một lập trình viên. Nhiều thế hệ lập trình viên đã bắt đầu những bước đi đầu tiên bằng cách tìm những cách khác nhau để máy tính nói "Hello, World" (Xin chào, thế giới). Có thể nói, điều này cũng đúng với các nhà thơ.

Nhiều lập trình viên có mối liên hệ với thơ ca – Ada Lovelace, người được coi là lập trình viên đầu tiên trong lịch sử, là con gái của nhà thơ Anh, Nam tước Byron – nhưng khó lòng mà nói gì thêm về điều này. Thơ sonnet chiếm một vị trí dường như lý tưởng: đây là một hình thức nghệ thuật phong phú (tốt cho các nhà thơ) với những quy tắc rõ ràng (tốt cho máy móc). Ranjit Bhatnagar, một nghệ sĩ kiêm lập trình viên, đánh giá cao cả hai khía cạnh này. Năm 2012, ông đã sáng tạo ra Pentametron, một dự án nghệ thuật khai thác mạng xã hội Twitter (giờ là X) để tìm những dòng tweet có bóng dáng thể thơ năm nhịp iamb. Đầu tiên, sử dụng từ điển phát âm do Đại học Carnegie Mellon tạo ra, ông xây dựng một chương trình để đếm âm tiết và nhận biết vần điệu. Sau đó, với một đoạn mã riêng để gieo vần, ông bắt đầu ghép các tweet lại để tạo ra các bài thơ sonnet. Trong Tháng sáng tạo Tiểu thuyết Quốc gia (NaNoGenMo) đầu tiên năm 2013, Bhatnagar đã nộp tác phẩm "I got a alligator for a pet!" (Tôi có con cá sấu làm thú cưng) – một tuyển tập 504 bài thơ sonnet được Pentametron tạo ra.

Mã của Bhatnagar yêu cầu mỗi dòng phải là một tweet, hay ít nhất là một dòng suy nghĩ hoàn chỉnh (hoặc chí ít cũng đạt chuẩn một dòng suy nghĩ đăng trên Twitter). Nó cũng hết sức cố gắng tuân theo các quy tắc nghiêm ngặt về vần và nhịp điệu. Đây là cách mà bài thơ "Chúc ngủ ngon, mai lại là một ngày khác!" (các tiêu đề cũng do máy viết) bắt đầu:

Tôi cố học thứ chết tiệt này

Thầy còn chẳng thèm dạy

Cũng chẳng buồn cố, dù mảy may

Twitter của tôi chưa bị khóa thế này...

Có hai người bắt quàng với tôi

Bỗng thèm bánh chuối quá thôi

Hãy tử tế - chỉ là lời chót lưỡi

Giờ chỉ cần Jonny Walker Blue - nốc một hơi

Ngày tháng qua chẳng đọng lại gì

Mai cũng chẳng có gì rực rỡ

Người thì cố, người thì khinh bỉ

Chẳng ưa Sabrina, dù sao đi nữa

Niềng răng bị nứt, khốn thật,

Kẻ mắt Maybeline mới là đỉnh nhất!!!

Trong tuyển tập thơ sonnet có sự hỗ trợ của máy tính gần đây nhất của Bhatnagar, "Những cận-kiệt tác (Encomials), ông đã nới lỏng những niêm luật này. Để máy có thể tạo ra tác phẩm nghe như con người viết, Bhatnagar nhận ra rằng ông phải cân bằng tinh tế giữa tính chuẩn xác và tính chân thực. "Nếu nó mắc quá nhiều lỗi thì sẽ không giống con người, vì vậy tôi hy vọng nó sẽ chỉ mắc vừa đủ lỗi," ông nói.

Mary Flanagan, một nhà thơ, nghệ sĩ và giáo sư nhân văn số, cho rằng ý tưởng các bài thơ do máy tạo ra phải vượt qua Bài kiểm tra Turing thật nhàm chán. "Con người đã giỏi trong việc tạo ra những bài sonnet nghe như của con người rồi, vậy tại sao lại bắt máy tính làm điều đó?

Bất chợt, Bhatnagar xem xét các nhật ký tự sửa lỗi của Pentametron, một kho lưu trữ những tweet đã bị loại bỏ vì chúng gần với thể thơ năm nhịp iamb nhưng không hoàn hảo. Trước khi bị đưa vào "đống rác" này, các dòng chữ đều bị loại bỏ dấu câu, chuyển chữ hoa thành chữ viết thường. Bhatnagar đã xây dựng một chương trình mới để lùng sục kho ngữ liệu này và viết các bài thơ sonnet với các dòng chuyển tiếp – tức là những cụm từ vắt từ dòng này sang dòng tiếp theo một cách tự nhiên:

Tôi muốn trở lại khi còn nhỏ.

Muốn cuộn mình lại, rỗng không.

Đôi khi mình cũng cần buông bỏ.

Đàn đúm làm chi, chỉ lông bông.

Về quê nhà ngập nắng. Đời là

toàn lừa dối. Tôi hận mình thay.

Tôi biết, tôi vị kỉ, trời ơi, đây là

lần thứ hai. Tôi luôn gặp may.

Tôi không cô đơn. Tôi nhớ

lại lần nữa. Tôi yêu nắng gió bao la.

Trốn trong nhà tới tối. Tôi bỏ lỡ

một tâm hồn hạnh phúc. Tôi tìm đường ra.

Tại sao? Tôi vẫn không thoát khỏi bóng tối.

Cuộn mình trên giường - Đời là lừa dối.

*Để AI học làm thơ, dù chỉ trình độ ngây ngô bằng một đứa trẻ, dữ liệu để huấn luyện vẫn cần cực kì lớn. Ảnh: Joe Russell/joenrussell.itch.io*

Các thuật toán của Bhatnagar kết hợp khéo léo giữa khai thác dữ liệu và tìm khuôn mẫu để xây dựng các bài thơ sonnet từ những thứ hầm bà lằng trong không gian của Twitter. Đây là thơ ca theo kiểu chắp nối hơn là sáng tác thực sự. Tôi không hẳn là một nhà thơ, nhưng như nhiều người khác, tôi đã được học viết thơ từ thời học sinh. Một giáo viên lớp hai của tôi, cô Clark đã khuyến khích tôi thử sáng tác bài thơ năm dòng (limerick) của riêng mình.

Tôi yêu thích cả khía cạnh chơi chữ lẫn bản chất niêm luật nghiêm ngặt của việc sáng tác; có lẽ đây là báo hiệu của việc tôi sẽ trở thành một nhà toán học và khoa học máy tính về sau này. Một bài thơ năm dòng, theo một nghĩa nào đó, được mô tả bằng một thuật toán: Một khởi đầu kiểu Mad Lib ("Có một [ông già / quý bà] [từ / với / người] ..."), theo sau là năm dòng với vần điệu lần lượt là aabba. Tôi tự chạy phần mềm thơ nhỏ này trong đầu mình, tạo ra hàng tá bài thơ năm dòng vô nghĩa, đầy đủ những yếu tố ngô nghê của trẻ con.

Nếu trẻ em có thể học cách viết thơ từ đầu, vậy máy móc thì sao? Tôi đã có thể bắt đầu sáng tác sau khi đọc chỉ vài ví dụ. Bộ não của tôi – giống như bộ não của hầu hết trẻ em – không cần quá nhiều nguyên liệu để có thể bắt chước. Với học máy, công nghệ AI mới nhất, máy tính cuối cùng cũng có thể làm giống vậy. Nhưng ngay cả những kỹ thuật học máy phức tạp nhất hiện nay - các mạng nơ-ron sâu, công nghệ tiên tiến nhất – sẽ cần cực kì nhiều dữ liệu để huấn luyện hay trở nên chính xác hơn trong một nhiệm vụ cụ thể. Kiến trúc mạng nơ-ron, được mô phỏng và đặt tên theo mạch não của chúng ta, đã trở thành trợ thủ đắc lực giúp ta dịch ngôn ngữ (ví dụ Google Dịch) và nhận dạng hình ảnh (như gắn thẻ ảnh), phần lớn nhờ vào sự sẵn có của dữ liệu: Internet đầy những từ ngữ và hình ảnh cho những nơ-ron này học tập in silico (mô phỏng). Nhưng khi thiếu dữ liệu, máy móc không thể bắt đầu học ngay từ đầu. Đó là lý do tại sao nhiệm vụ tưởng chừng đơn giản là dạy máy sáng tác một bài sonnet lại là một kỳ công lập trình phức tạp; những cỗ máy học sâu cần nhiều đầu vào hơn một học sinh trung bình.

Định nghĩa về văn chương sẽ vừa mở rộng vừa thu hẹp khi con người và các công cụ viết tiến hóa cùng nhau. Thực tế, gần như tất cả các tác phẩm chúng ta đọc – bao gồm cả thơ ca – đều được máy móc chạm tới.

Kevin Knight, một nhà khoa học máy tính tại Đại học Nam California, là một trong những nhà nghiên cứu đầu tiên nghiên cứu xem làm thế nào mạng nơ-ron sâu có thể được sử dụng để giải quyết các thách thức của việc dịch thuật. Chuyên môn chính của Knight là xử lý ngôn ngữ tự nhiên, lĩnh vực khoa học máy tính liên quan đến việc tạo ra và hiểu ngôn ngữ con người. Không có mạng nơ-ron, ngay cả những chương trình tốt nhất cũng không thể viết được câu hoàn chỉnh. Chúng chỉ có thể nối các mảnh ngôn ngữ lại với nhau. Như Knight nói, chúng "không thể duy trì một chủ đề. Thậm chí không thể duy trì ngữ pháp."

Năm 2015, Marjan Ghazvininejad, một trong những nghiên cứu sinh của Knight, bắt đầu làm việc với Hafez, một chương trình được sử dụng để tạo ra thơ sonnet và các thể thơ khác, được đặt tên theo nhà thơ trữ tình Ba Tư thế kỷ 14. Dự án của cô có hai phần: thứ nhất, mã hóa các quy tắc sáng tác - khuôn mẫu mà mọi bài sonnet sẽ phải tuân theo - sau đó quyết định điền gì vào khuôn mẫu đó. Giai đoạn đầu tiên khá dễ dàng: các lập trình viên giỏi việc đưa ra quy tắc, và chương trình giỏi việc tuân theo chúng. Thêm vào đó, như Knight giải thích, nhóm của Ghazvininejad đã nghĩ ra một số cải tiến thông minh, như bảo máy tính chọn từ cuối của mỗi dòng trước, sau đó chọn các cặp vần điệu có vẻ có chủ đề giống nhau.

Nhưng ngôn từ để máy làm thơ từ đâu ra mà có? Mặc dù thế giới thơ trữ tình nghèo dữ liệu – chỉ có một số lượng khiêm tốn các bài sonnet có sẵn trên Internet – Ghazvininejad và các cộng sự của cô nhận ra rằng thế giới gần gũi với thơ - lời ca, lại giàu dữ liệu. Nhóm của cô quyết định huấn luyện chương trình của họ trên 95.000 bài hát được lấy từ Cơ sở dữ liệu Lời bài hát. Với mỗi bài thơ, Hafez đáp ứng một chủ đề cho trước – chẳng hạn như các cuộc bầu cử tổng thống – sau đó thu thập các từ có vần trong cơ sở dữ liệu và nối chúng lại với nhau bằng cách sử dụng các mạng nơ-ron ngày càng hoàn thiện của nó.

Ghazvininejad đã dành nhiều năm nghiên cứu xử lý ngôn ngữ, nhưng ngay cả cô cũng ấn tượng với kết quả. Hafez đã tạo ra một bài sonnet có cụm từ "Lời hứa Honky Tonkin" (Honky Tonkin là tên một bài hát theo phong cách nhạc đồng quê, ra đời năm 1947 - ND). Theo Knight, cụm từ này chỉ xuất hiện một hoặc hai lần trong kết quả tìm kiếm Google: Hafez thực sự đang tạo ra tác phẩm độc đáo - giống như do một đứa trẻ của những năm 60 viết nên.

Quá trình huấn luyện máy này cũng giúp tạo ra tính mạch lạc và phong cách - đặc tính độc đáo nhất thể hiện dấu ấn con người. Một bài thơ, được tạo ra từ gợi ý "wave" (sóng), mang một cảm giác viễn tưởng tăm tối:

Nhặt lên dòng điện đau âm thầm

Thấy bấp bênh như cơn sóng lừng

Chưa từng nhói lên nỗi siêu âm

Hay nằm dưới mộ lạnh sống lưng

Không gian mở ra giữa hai vận tốc chờ

Ngước lên nhìn một vận tốc cực đại

Quốc gia vô diện với lòng tham dại khờ

Trống vắng sự tò mò thơ dại

Hay biết đâu xuyên qua phương trình sóng

Không quán tính, con tàu lao đi tĩnh lặng

Chỉ có năng lượng từ sự rung động

Còn chẳng có gì ngoài cay đắng

Bao quanh bởi đồ thị sin omega T

Là bờ đối diện nơi tôi và em đứng tái tê

Cách dùng từ ở đây có vẻ nhất quán đến đáng tin: "vận tốc," "quán tính," và "rung động" đều thuộc cùng một phạm trù toán học. "cực đại," "omega," và "năng lượng" tạo nên một giọng điệu khác. Hơn thế nữa, có một cảm giác về sự nhất quán của chủ đề, phảng phất tính tự sự. Dẫu vậy, tuy không phải là nhà phê bình – chỉ là một độc giả – tôi vẫn nhận thấy có điều gì đó không ổn. Tôi đọc nó và thấy bị kẹt lại thay vì được cuốn đi. Tôi cảm nhận được sự hiện diện của cỗ máy, loay hoay trong một thứ văn học nhừa nhựa.

Liệu tôi có nên đặt câu hỏi: Điều đó có quan trọng không?

Thực ra, người ta hình dung và xây dựng Hafez nhằm trở thành một ứng viên cho Bài kiểm tra Turing về Nghệ thuật Sáng tạo năm 2016 tại Dartmouth, mà tôi đã góp phần tổ chức. Một cỗ máy vượt qua Bài kiểm tra Turing nếu người ta không thể phân biệt nó với con người. Thách thức của Hafez là đánh lừa các giám khảo để họ nghĩ rằng những bài sonnet của nó được viết bởi các nhà thơ thật. Cuối cùng, nó đã thắng cuộc thi, nhưng không vượt qua được Bài kiểm tra Turing. Hafez tốt hơn các máy khác nhưng vẫn có thể phân biệt được với con người. Khi các bài sonnet do máy viết được xen kẽ giữa các tác phẩm do con người viết, không có một nhà thơ AI nào đánh lừa được đa số giám khảo cuộc thi.

Bài kiểm tra Turing từ lâu đã là tiêu chuẩn để đánh giá trí tuệ nhân tạo, nhưng trong bối cảnh sáng tạo nghệ thuật – thay vì mô phỏng nhận thức – có lẽ nó không phải là thước đo giá trị nhất, hoặc thú vị nhất. Một trong những đồng nghiệp của tôi, Mary Flanagan, một nhà thơ, nghệ sĩ và giáo sư nhân văn số, cho rằng ý tưởng các bài thơ do máy tạo ra phải vượt qua Bài kiểm tra Turing thật nhàm chán. "Con người đã giỏi trong việc tạo ra những bài sonnet nghe như của con người rồi, vậy tại sao lại bắt máy tính làm điều đó? Hãy làm điều gì đó mới mẻ!"

Phản ứng của Flanagan gợi lên một câu hỏi khác: Với sức mạnh của các kỹ thuật mới trong trí tuệ nhân tạo, tại sao không nghĩ rộng hơn về những loại hình nghệ thuật có thể tạo ra nhờ sử dụng nó? Chúng ta có thể nghĩ "do máy tạo ra" như một loại nhãn GMO văn học – hoặc chúng ta có thể nghĩ đó là một thể loại nghệ thuật hoàn toàn mới, và đáng giá. Khi chúng ta tương tác ngày càng nhiều với máy móc, cả chủ định và vô thức, những kỳ vọng của chính chúng ta về cả công việc và nghệ thuật sẽ thay đổi, và các nhãn mác sẽ bắt đầu tan biến. Định nghĩa về văn chương sẽ vừa mở rộng vừa thu hẹp khi con người và các công cụ viết tiến hóa cùng nhau. Thực tế, gần như tất cả các tác phẩm chúng ta đọc – bao gồm cả thơ ca – đều được máy móc chạm tới. Một số nhà văn - hiện tại chỉ có một vài người, nhưng chắc chắn sẽ nhiều hơn trong tương lai – đang sử dụng máy tính như những cộng tác viên sáng tạo. (Nếu đã từng chấp nhận gợi ý của Gmail khi soạn thư, bạn cũng đã có một cộng tác viên như vậy.) John Seabrook đã nghiên cứu ý nghĩa của trí tuệ nhân tạo này đối với tương lai của những hành vi viết lách thực dụng, hằng ngày. Tháng hai năm 2019, dự án OpenAI, một dự án trị giá hàng tỷ đô la được thành lập để thúc đẩy AI "thân thiện", đã thông báo rằng chương trình học sâu của họ có thể hoàn thành các câu và thậm chí cả đoạn văn. Sau đoạn văn là bài luận, truyện ngắn, tiểu thuyết. Tại sao không phải là sonnet? Nếu ngừng đánh giá robot bằng khả năng bắt chước – mức độ làm chủ tính người đến đâu - của chúng, chúng ta có thể bắt đầu đánh giá cao sức mạnh sáng tạo của máy móc dưới một góc nhìn mới. Thậm chí chúng có thể lay động chúng ta.

Trong cuốn "You Are Not a Gadget" (Bạn không phải là một công cụ), Jaron Lanier, một người tiên phong trong thực tế ảo và thường xuyên triết lý về tương lai số, khuyến khích độc giả phản biện lại việc dễ dãi tiếp nhận công nghệ. Có lẽ việc máy móc làm thơ sonnet là một phần của sự phản kháng đó, một phong trào cyberpunk văn học, một bước đi kiểu chủ nghĩa nghệ thuật Dada. Khi khám phá những cách thức mà các công cụ công nghệ cao mới khiến ta cảm thấy thân thuộc hay kinh ngạc, chúng ta tiếp tục khám phá những khía cạnh trong ý nghĩa của việc làm người, với tư cách là người viết và người đọc, người sáng tạo và người tiêu dùng. Liệu máy móc có thể làm thơ hay không? Thơ ca là gì? Những viễn kiến lại tiếp tục thay đổi.□

Tuệ Tâm lược dịch

Bản gốc: https://www.newyorker.com/culture/annals-of-inquiry/the-mechanical-muse

Bài đăng Tia Sáng số 5/2025

Trở lại Văn hóa - Xã hộiTrở lại Văn hóa - Xã hội