Thử nghiệm sáng tác âm nhạc bằng AI
Âm nhạc đến từ đâu? Nếu đặt câu hỏi này, nhiều người trong chúng ta sẽ bảo nó xuất phát từ “tâm hồn”, hay từ “trái tim” của người sáng tác ra nó.
Âm nhạc là biểu hiện rõ ràng nhất của tình cảm con người, của người này với người kia; các hợp âm nào đó, các giai điệu nào đó dường như truyền đạt toàn bộ ngôn ngữ cảm xúc. Khi nghe một bản giao hưởng của Beethoven hoặc một sonata cho piano của Chopin, có thể nói rằng ta đang nghe biểu hiện của những hòa âm và nghịch âm bên trong nhà soạn nhạc, được truyền tải một cách kỳ diệu qua nhiều thế kỉ. Nhưng khi nào chúng ta xúc động đến thế bởi một bản nhạc do máy tính viết không?
Về cơ bản, các nhà khoa học máy tính mô tả các thuật toán “là một bộ quy tắc xác định một chuỗi các hoạt động, hướng dẫn máy tính cách thức giải quyết vấn đề hoặc đạt được một mục tiêu nhất định”. Dù bạn tin hay không thì hầu hết âm nhạc cũng tuân thủ một bộ các thuật toán ngấm ngầm và rõ ràng liên quan đến hình thức, nhịp điệu, cấu trúc câu nhạc và độ dài câu nhạc. Điều này thoạt tiên có vẻ khác thường vì ta thường xuyên coi âm nhạc là biểu hiện rõ ràng nhất của cảm xúc con người được truyền đạt bằng ngôn ngữ cảm xúc. Ta thường coi hành động sáng tác là kết quả của cảm hứng, tính độc đáo, sự sáng tạo, và một cỗ máy hoàn toàn không có khả năng tìm kiếm những cảm xúc bằng tâm hồn như vậy, đúng không nhỉ? Có lẽ chúng ta thích nghĩ rằng không. David Cope, giáo sư âm nhạc danh dự tại Đại học California, Santa Cruz, có ý kiến khác: “Vấn đề không phải là liệu máy tính có tâm hồn không mà là liệu chúng ta có tâm hồn không”.
Cope đã dành hàng chục năm cho một nghiên cứu ám ảnh về vấn đề này. Từ năm 1980, Cope nhận hợp đồng viết một vở opera. Trong nhiều tuần và nhiều tháng, ông ngồi bên cây piano hoặc nhìn chằm chằm vào tờ giấy chép nhạc trống trơn nhưng chẳng nghĩ được gì. Trong cơn tuyệt vọng, ông bắt đầu nghịch máy tính. Những gì ông tìm thấy ở đó đã thay đổi cuộc đời ông và có lẽ ảnh hưởng đến cả tiến trình lịch sử âm nhạc. Cope từ lâu đã có niềm tin rằng tất cả âm nhạc về cơ bản đều lấy cảm hứng từ việc “đạo nhái”. Các nhà soạn nhạc vĩ đại đều hấp thụ âm nhạc có sẵn và bộ não của họ “tái tổ hợp” các giai điệu và câu nhạc theo những cách đặc biệt, đôi khi có thể truy nguyên nguồn gốc. Tất cả chúng ta đều có một cơ sở dữ liệu bên trong được dùng làm tài liệu tham khảo âm nhạc; các nhà soạn nhạc là những người có khả năng thao tác điều khiển cơ sở dữ liệu ấy theo các mẫu hình mới. Với sự hỗ trợ của một chiếc máy tính đời đầu, ông nhận ra rằng mình có thể thử nghiệm điều này.
Cope thấy rất khó mời bất kỳ nghệ sĩ nghiêm túc nào chơi tác phẩm của Emmy, mặc dù nó đưa ra nhiều sản phẩm giống “đồ thật”. Các nhà phê bình tự cho là không thấy tính người đích thực, không nghe thấy chiều sâu cảm xúc trong đó, Cope bị xem là nhà soạn nhạc không có trái tim.
Những thử nghiệm đầu tiên của ông với trí tuệ âm nhạc nhân tạo là những bản nhạc tổng hợp vụng về, những bản cóp nhặt từ các tác phẩm dễ nhận biết; nhưng dần dần, khi lập trình đi lập trình lại và nhập vào một lượng lớn tài liệu tham khảo được mã hóa, ông nhận ra mình có thể bắt đầu định hình ký ức âm nhạc. Khoảnh khắc bùng nổ đến vào một buổi chiều năm 1983, sau khi ông đã làm việc một thời gian bằng cách cố gắng tách rời và tập hợp lại các bản hợp xướng (thánh ca bốn bè) theo phong cách J. S. Bach. Ông có một chương trình dựa trên các quy tắc, phức tạp và nặng về mã hóa. Cope phát triển “một công cụ phân tích nhỏ” có chức năng chèn một vài yếu tố ngẫu nhiên vào đề xuất của AI. Ông bắt đầu phân tích âm nhạc của Bach không chỉ về toán học mà còn bằng cái bất ngờ của diễn tiến, đánh giá theo cảm nhận của riêng mình. Emmy (viết tắt của “Experiments in Musical Intelligence” Những thử nghiệm trí tuệ âm nhạc), công cụ do ông phát triển dường như có một cá tính riêng. Khi được cung cấp đủ tác phẩm của một nhà soạn nhạc, Emmy có thể giải cấu trúc, xác định các yếu tố đặc trưng và tái tổ hợp chúng theo những cách mới. Một ngày nọ, Cope nhấn nút bật Emmy lên, ra ngoài lấy bánh sandwich và khi ông trở về, nó đã tạo ra 5.000 bản hợp xướng từ dữ liệu của Bach. Ông chợt nhận ra là Bach không tồn tại trong phần mà AI đề xuất và ở nhiều chỗ, quy tắc sáng tác của Bach đã bị phá vỡ.
Cope mất gần một năm để xoay sở tìm hãng thu âm thực sự để sản xuất nhạc. Thật sự cam go. Cùng một ngày ông nhận được hai thư từ chối. Thư thứ nhất bảo “Chúng tôi chỉ xuất bản âm nhạc đương đại còn cái này, theo định nghĩa của chúng tôi, không phải là âm nhạc đương đại.” Thư thứ hai nói: “Chúng tôi chỉ làm nhạc cổ điển, còn đây không phải là nhạc cổ điển.” Ông bèn hỏi: “Thế thì nó là cái gì?”.
Rút cục vào năm 1993, Cope phát hành album Bach by Design và chờ đợi phản hồi. Giờ đây khi nghe album đó – và các album tiếp theo, bao gồm Virtual Mozart và Virtual Rachmaninoff, người nghe vẫn không khỏi cảm thấy bối rối và ngạc nhiên. Những gì Cope tạo ra không chỉ là sao chép, nó mang “DNA” của phong cách sáng tác gốc nhưng lại hoàn toàn mới. Phản ứng đầu tiên của giới nhạc là lo sợ sau đó là đả kích. Cope thấy rất khó mời bất kỳ nghệ sĩ nghiêm túc nào chơi tác phẩm của Emmy, mặc dù nó đưa ra nhiều sản phẩm giống “đồ thật”. Các nhà phê bình tự cho là không thấy tính người đích thực, không nghe thấy chiều sâu cảm xúc trong đó, Cope bị xem là nhà soạn nhạc không có trái tim.
Một trong những vấn đề, theo Cope, thì âm nhạc của Mozart hay một số nhà soạn nhạc khác là vẫn còn ẩn chứa tiềm năng vô tận. Mozart, với thiên tài về cấu trúc của mình – nếu ông có phương tiện – hẳn đã sử dụng trí tuệ của máy tính theo cách chính xác như vậy. “Khi bạn để cơ sở dữ liệu tự suy luận, đó thực sự là thỏa thuận một lần; bạn nhấn nút và hàng trăm hàng nghìn bản sonata hay những tác phẩm tương tự chảy tràn ra”. Tuy nhiên, Cope nhận ra trong lịch sử âm nhạc, để hiểu một nhà soạn nhạc một cách trọn vẹn thì cần phải độ lùi thời gian, phần nhiều sau khi họ qua đời, và sự kết thúc tạo nên ý nghĩa cho những gì đã xảy ra trước đó. Với suy nghĩ này, Cope đã để Emmy dừng hoạt động, sau khi giới hạn năng lực của nó ở 11000 tác phẩm chọn lọc.
Emmy – trú ngụ trong chiếc Power Mac 7500 cổ lỗ sĩ (đã ngừng sản xuất năm 1996) giờ ngồi không trong góc văn phòng của ông. Rồi Cope làm việc bằng cách nuôi “con gái” của Emmy là Emily Howell, công cụ được huấn luyện bằng các tác phẩm của 36 nhà soạn nhạc “bắt đầu với Palestrina [một nhạc sĩ cung đình Ý thế kỉ 16] và kết thúc với David Cope thế kỉ 21”. Sản phẩm của ông và Emily Howell mang tính cộng tác hơn nhiều. Cope sẽ hỏi Emily một câu hỏi về âm nhạc, đưa ra một câu nhạc. Emily sẽ trả lời bằng hiểu biết của mình về những gì xảy ra tiếp theo. Cope chấp nhận hoặc từ chối công thức, giống như cách ông sẽ làm nếu ông đang soạn nhạc “theo cách thông thường”. Ông ví von: “Nó hơi giống việc đàm phán với một đứa trẻ: công cụ này là một chiếc bình rỗng và tôi rót những mẩu nhạc nhỏ vào đó, và nó phản ứng với những gì tôi đã đưa vào… Tôi nghĩ, nó đang tạo ra kết quả tốt nhưng mất rất nhiều thời gian”.
Album đầu tiên của Emily Howell, From Darkness, Light [Từ bóng tối, ánh sáng], được soạn thành sáu chương nhạc và biểu diễn trên hai piano, đã được phát hành vào đầu năm 2010. Phản ứng phần lớn là im lặng; các nhà phê bình, những người xúc động hưởng ứng, cũng làm vậy bằng những lời lẽ khinh khỉnh thường lệ về “sự vắng mặt của con người đích thực”. Cope vẫn không nản lòng: “Người ta bảo tôi rằng họ không thấy tâm hồn trong âm nhạc. Khi họ nói vậy, tôi rút ra một trang đầy những nốt nhạc và yêu cầu họ chỉ cho tôi xem tâm hồn nằm ở đâu. Chúng ta thích nghĩ những gì chúng ta nghe được là tâm hồn nhưng cảm xúc mà chúng ta có được khi nghe nhạc là thứ chúng ta tạo ra, nó không nằm trong các nốt nhạc. Nó đến từ sự thấu hiểu cảm xúc trong mỗi chúng ta, âm thanh chỉ châm ngòi cho điều đó xảy ra”.
Nhưng Cope không bỏ quên Emily. Nó vẫn trong quá trình hoàn thiện và hướng tới phong cách trưởng thành. “Năm năm nữa tôi tin rằng Emily sẽ thực sự tiến xa hơn”, ông nói. Đó hẳn là một quá trình gây tò mò, giống như quan sát một tâm trí bên ngoài hoạt động. Nó đã dạy ông điều gì về bản thân? “Hai điều. Cơ chế của bộ não đơn giản đến khó tin, nhưng khả năng tạo ra sự phức tạp phi thường của nó sẽ liên tục khiến chúng ta kinh ngạc”.
Emily sẽ sống lâu hơn ông chăng? “Emily ấy cần một nguồn kích thích. Con người cũng vậy, bạn không thể tạo ra âm nhạc mà không tham khảo thứ âm nhạc khác. Giống như chúng ta, cô ấy cần được kích thích bởi một thứ gì đó”.
“Các công cụ là phần mở rộng của tôi. Tôi đã dành gần 60 năm cuộc đời để sáng tác, một nửa trong số đó được tạo ra như mọi nhà soạn nhạc khác và một nửa trong số đó là từ công nghệ. Với tôi, việc quay trở lại cách sáng tác truyền thống sẽ giống như việc dùng tay không đào hố sau khi đã có xẻng, hoặc đi bộ đến điểm hẹn trong khi có thể sử dụng ô tô” (David Cope).
Giờ đây, có một hệ quả là ông không thể tưởng tượng được khả năng quay trở lại viết lách chỉ bằng giấy bút và trực giác của chính mình: “Các công cụ là phần mở rộng của tôi. Tôi đã dành gần 60 năm cuộc đời để sáng tác, một nửa trong số đó được tạo ra như mọi nhà soạn nhạc khác và một nửa trong số đó là từ công nghệ. Với tôi, việc quay trở lại cách sáng tác truyền thống sẽ giống như việc dùng tay không đào hố khi đã có xẻng, hoặc đi bộ đến điểm hẹn trong khi có thể sử dụng ô tô”.
Dù tự tin mình là một trong những người đi tiên phong nhưng khi khởi đầu, Cope không khỏi cảm thấy cô đơn. Sau một quá trình như vậy, ông đã được chú ý: gần đây một ban nhạc pop hàng đầu tiếp cận ông và đặt vấn đề là liệu Emily có thể tạo ra một số bản hit hay không. Mặc dù các yếu tố “tái tổ hợp” của âm nhạc đại chúng chỉ là một cú rẽ ngắn hạn nhưng ông cho là không có gì ngạc nhiên người ta cần cái mới trong tạo nhạc chuông và nhạc game. “Trong 10 năm tới,” Cope dự đoán, “âm nhạc thuật toán sẽ là trụ cột trong cuộc sống của chúng ta”.
Nếu âm nhạc có thể được rút gọn thành các công thức và phương trình, liệu nó có bắt đầu làm suy yếu các quan niệm về ý nghĩa của âm nhạc đối với chúng ta không? Douglas Hofstadter, tác giả cuốn sách quan trọng về các nguyên tắc nhận thức cơ bản, Gödel, Escher, Bach, từ lâu đã thuyết giảng về hàm ý của công trình của Cope trong việc hiểu cách thức hoạt động của tâm trí – và âm nhạc. Ông nói rằng “Trong 20 năm làm việc trong lĩnh vực trí tuệ nhân tạo, chưa từng gặp “thứ gì kích thích tư duy hơn những thử nghiệm của David Cope”. Hofstadter đã đúc kết những suy nghĩ của mình về công trình của Cope thành một bài giảng đầy đủ được trình bày theo nhịp điệu bắt đầu bằng một câu hỏi có thể chứng thực nền tảng cho sự hiểu biết về soạn nhạc trong tương lai:
Âm nhạc có phải là một nghề
Hay là một nghệ thuật?
Nó đến chỉ từ việc đào tạo
Hay trào ra từ trái tim?
Các bản etude của Chopin
Có bộc lộ trạng thái tâm hồn ông?
Hay Frédéric Chopin
Chỉ là “chàng công tử mẫu mực” bóng bẩy nào đó?
Hofstadter rất thích câu nói nổi tiếng của một nhà soạn nhạc mà Cope dẫn ra “Nghệ sĩ giỏi thì vay mượn, nghệ sĩ vĩ đại thì ăn cắp”, mặc dù ông lo ngại rằng một số bí ẩn của quy trình sáng tạo có thể bị mất mát trong quá trình thực hiện và cùng với đó là một phần hiểu biết của chúng ta về ý nghĩa của việc làm người. Về phần mình, Cope vẫn giữ nguyên cảm giác kinh ngạc trước các nhà soạn nhạc – những thiên tài trong việc tái tổ hợp kết quả những người đã đi trước.
David Cope giờ đây đã trở thành đề tài chính của một bộ phim tài liệu. Được nhà làm phim kiêm đạo diễn Jae Shim ở Los Angeles đạo diễn, “Opus Cope: Một vở opera thuật toán” tôn vinh công việc đột phá của nhà soạn nhạc David Cope và những cách thức sâu sắc mà theo đó con người và máy móc có thể sáng tạo. Cách tiếp cận của Jae làm mờ ranh giới giữa phim tài liệu và phim hư cấu “bởi sẽ đưa người xem vượt ra ngoài quan sát đơn thuần để đi đến một thực tế lớn hơn”. Bộ phim được làm trong năm năm và lên kế hoạch phát hành toàn quốc trên mạng truyền hình PBS ở Hoa Kỳ và trình chiếu tại hệ thống rạp Laemmle ở LA vào năm 2023.□
Ngọc Anh tổng hợp
Nguồn: https://www.theguardian.com/technology/2010/jul/11/david-cope-computer-composer?fbclid=IwAR0Njo2gRuyEY09IhyYTcLi0yptkqEHvbLcjPnp5tCv_GA3-WWzUauPEghk