Những giới hạn của điện ảnh AI

Các khung hình điện ảnh AI đẹp mã liệu có giá trị thẩm mỹ cốt lõi?

Tuần trước, tờ Wall Street Journal đưa tin Hell Grind, một bộ phim dài 95 phút với chi phí sản xuất 500.000 USD - trong đó 400.000 USD là chi phí dành cho năng lực điện toán của trí tuệ nhân tạo - được công chiếu tại Cannes [1].

Các thông điệp truyền thông ban đầu từ Higgsfield AI, công ty đứng sau dự án, cũng tạo ấn tượng rằng tác phẩm điện ảnh AI này là một phần của Cannes Film Festival danh giá. Đích thân Alex Mashrabov, nhà sáng lập kiêm CEO của hãng, tuyên bố trên LinkedIn: "Hôm nay, chúng tôi đã công chiếu bộ phim điện ảnh AI dài 95 phút đầu tiên trên thế giới ở Cannes. [...] Giám đốc nghệ thuật của Cannes từ chối cấm AI trong quy trình tuyển chọn và né tránh tranh cãi bằng cách nhắc đến kỹ xảo của Avatar. Lần đầu tiên, ngành công nghiệp đã chuyển từ việc tranh luận liệu AI có bước vào điện ảnh hay không sang tranh luận về cách nó sẽ được sử dụng như thế nào."

Một cảnh trong phim Hell Grind. — *Hell Grind* là phim truyện dài đầu tiên được sản xuất hoàn toàn bằng AI.

Tuy nhiên, đại diện chính thức của Liên hoan phim Cannes xác nhận Hell Grind không nằm trong chương trình lựa chọn của họ [2]. Bộ phim thực ra được trình chiếu tại rạp Cinema Olympia vào ngày 21/5 trong một sự kiện do bên thứ ba tổ chức, và sau đó tiếp cận Marché du Film - khu chợ mua bán bản quyền hoạt động song song với liên hoan.

Marché du Film vận hành như một không gian giao thương quy mô lớn, nơi các công ty có thể trả phí để mua quyền hiện diện và quảng bá dự án của mình. Việc Higgsfield AI tận dụng không gian thương mại của Marché du Film, kết hợp với các tuyên bố mang tính lập lờ về địa danh "Cannes", cho thấy tồn tại một chiến lược đánh tráo khái niệm. Thay vì xây dựng một hệ quy chiếu giá trị mới cho phim AI, họ đặt tác phẩm của mình vào vùng ảnh hưởng biểu tượng của Cannes Film Festival, qua đó vay mượn tính chính danh từ một thiết chế đã được xác lập.

Chi phí của thuật toán và nhu cầu được công nhận

Để hiểu rõ hơn về nhu cầu tìm kiếm tính chính danh, chúng ta cần đi sâu vào quá trình sản xuất thực tế của Hell Grind, phim truyện dài đầu tiên được sản xuất hoàn toàn bằng AI. Theo mô tả từ phía dự án, Hell Grind thuộc thể loại hành động-viễn tưởng, được hoàn thành trong vỏn vẹn 14 ngày bởi 15 nhân sự, gồm đạo diễn, giám đốc hình ảnh, biên tập viên và đội ngũ vận hành AI - nhiều thành viên trong đó đến từ chính Higgsfield.

Đội ngũ làm phim Hell Grind phải viết những lệnh dài đến 3.000 từ để tạo ra khoảng 15 giây hình ảnh. — Đội ngũ làm phim *Hell Grind* phải viết những prompt dài đến 3.000 từ để tạo ra khoảng 15 giây hình ảnh.

Bản chất công nghiệp của bộ phim lộ rõ khi 80% ngân sách được trả trực tiếp cho các nhà cung cấp đám mây như CoreWeave và Nebius để duy trì hoạt động máy chủ. Quá trình làm phim chủ yếu xoay quanh việc nhập lệnh (prompting) thông qua các công cụ như Soul Cinema, Soul Cast và Dreamina Seedance 2.0. Mỗi prompt hướng dẫn cho AI một cách hết sức tỉ mỉ, dài khoảng 3.000 từ, và chỉ tạo được một đoạn phim khoảng 15 giây.

Số liệu cho thấy để hoàn thiện 253 cảnh quay cho 25 phút đầu tiên, đội ngũ đã phải tạo ra tới 16.181 đoạn video thô và loại bỏ phần lớn trong số đó. Mặc dù vậy, kết quả vẫn bị một số nhà phê bình đánh giá là thiếu tự nhiên, giật cục và giống như một bản trình diễn công nghệ hơn là điện ảnh.

Tuy nhiên, giới hạn của điện ảnh AI không đơn thuần nằm ở chất lượng các hình ảnh mà ở cách chúng được hình thành ngay từ đầu.

Thứ nhất, trong điện ảnh truyền thống, mỗi khung hình là kết quả của một chuỗi quyết định có chủ đích, được liên kết chặt chẽ với toàn bộ tác phẩm thông qua ý đồ của đạo diễn.

Ngược lại, điện ảnh tạo sinh bằng AI vận hành theo một logic khác. Đó là logic của việc lấy mẫu xác suất trong không gian dữ liệu. Mỗi khung hình được sinh ra như một nghiệm cục bộ, tối ưu theo phân phối thống kê thay vì một ý đồ xuyên suốt. Việc sử dụng prompt về bản chất chỉ đóng vai trò điều hướng ở cấp độ bề mặt. Nó có thể ảnh hưởng đến đặc điểm thị giác hoặc phong cách, nhưng không đủ khả năng thiết lập một cấu trúc ý nghĩa liên tục theo nghĩa chặt chẽ.

Thứ hai, sức nặng của khung hình điện ảnh đến từ việc nó tuân thủ tuyệt đối các quy luật tự nhiên về quang học, động lực học và chiều sâu không gian. Những quy luật này tạo ra một "cảm giác vật lý" chân thực mà bộ não người có thể cảm nhận ngay lập tức.

Ngược lại, các mô hình AI hiện nay rất giỏi bắt chước vẻ bề ngoài, nhưng như nhà nghiên cứu Yann LeCun từng chỉ ra, chúng thiếu một "mô hình thế giới" (world model) nội tại. AI chỉ đang "đoán" các điểm ảnh dựa trên xác suất thống kê từ dữ liệu cũ chứ không hề hiểu các quy luật vật lý đang vận hành thế giới.

Hệ quả là, một bức ảnh hay thước phim do AI tạo ra có thể trông rất hợp lý ở từng chi tiết nhỏ, nhưng tổng thể lại rời rạc và phi lý. Người xem thấy rõ hình hài của vật thể, nhưng không cảm nhận được chúng đang thực sự cùng tồn tại trong một không gian thực. Đó là một kiểu "đẹp mã" về mặt thị giác nhưng trống rỗng về mặt hiện thực.

Cuối cùng, mối nguy hiểm lớn nhất của nghệ thuật tạo sinh nằm ở xu hướng "trung bình hóa". Lịch sử nghệ thuật cho thấy những bước ngoặt vĩ đại không bao giờ đến từ việc làm vừa lòng số đông, mà đến từ sự đứt gãy cùng những cú bẻ lái cố tình ra khỏi quy chuẩn.

Ngược lại, bản chất của AI là một cỗ máy tìm kiếm sự an toàn. Trí tuệ nhân tạo, bằng việc ngốn ngấu dữ liệu khổng lồ, luôn có xu hướng hội tụ về những mẫu hình phổ biến và an toàn nhất [3]. Về mặt toán học, các mô hình AI hoạt động theo nguyên lý giảm thiểu rủi ro, tức là xu hướng "kéo về mức trung bình" (regression to the mean). Để tạo ra một khung hình "hợp lý", thuật toán sẽ chọn những điểm ảnh có xác suất xuất hiện cao nhất dựa trên hàng triệu dữ liệu trong quá khứ.

Khi mọi chi tiết đều được tối ưu theo thị hiếu số đông, AI đồng hóa nghệ thuật bằng một bộ lọc của sự trung bình và dễ đoán, không hề có không gian cho những sai lệch mang tính thiên tài.

Khi đặt ba yếu tố này cạnh nhau, có thể thấy một giới hạn rõ ràng. Đây không phải là vấn đề có thể giải quyết chỉ bằng việc tăng dữ liệu hay sức mạnh tính toán mà xuất phát từ chính cách hệ thống vận hành.

Sự trống rỗng về cốt lõi thẩm mỹ của các sản phẩm được làm ra từ AI tạo sinh đã kích hoạt phản ứng đề phòng mạnh mẽ từ công chúng và giới chuyên môn. Ngay tại Cannes 2026, diễn viên, biên kịch, nhà sản xuất Seth Rogen thẳng thừng gạt bỏ ý tưởng dùng AI để hỗ trợ viết kịch bản. Ông khẳng định: "Nếu bản năng của bạn là tìm đến AI, bạn không nên làm biên kịch', đồng thời giễu cợt làn sóng video do AI tạo ra tràn ngập trên mạng xã hội là ‘thứ rác rưởi ngu ngốc nhất tôi từng thấy trong đời’." [4]

Trong khi đó, khán giả đại chúng phản ứng quyết liệt bằng hành động thực tế. Điển hình là làn sóng tẩy chay dữ dội nhắm vào bộ phim kinh dị Late Night with the Devil từ cách đây hai năm [5]. Chỉ vì các đạo diễn thừa nhận có sử dụng công cụ Midjourney để thiết kế ba bức ảnh cắt cảnh (bumper graphics), cộng đồng người hâm mộ và các họa sĩ đã đồng loạt kêu gọi quay lưng với bộ phim, biến một tác phẩm có chất lượng nghệ thuật thành tâm điểm của một cuộc khủng hoảng truyền thông.

Trước thái độ gay gắt của công chúng và các rào cản đạo đức, giới công nghệ nhận ra rằng thuật toán và máy chủ không thể tự sinh ra sự tôn trọng văn hóa. Do đó, họ buộc phải vay mượn uy tín từ con người và các tổ chức đã được thừa nhận.

Việc Higgsfield AI đưa Hell Grind đến sự kiện gần Cannes, và đặc biệt là việc mời Adilkhan Yerzhanov - nhà làm phim từng có tác phẩm The Gentle Indifference of the World lọt vào hạng mục Un Certain Regard của Cannes 2018 - tham gia đồng biên kịch, chính là nỗ lực tẩy trắng bản chất máy móc của dự án. Bằng cách nhúng một tác giả thực thụ của hệ thống điện ảnh di sản vào dự án AI, công ty công nghệ hy vọng có thể chính danh hóa vị thế nghệ thuật của mình.

Dùng quyền lực tài chính để xác lập quyền lực văn hóa

Chiến lược dùng tài chính để "mua" sự gắn kết với các thiết chế truyền thống của Higgsfield AI không phải là hiện tượng mới, mà lặp lại một quỹ đạo quen thuộc trong lịch sử công nghệ. Trường hợp của Netflix là minh chứng rõ ràng cho quá trình chinh phục quyền lực biểu tượng thông qua các thiết chế như Oscar.

Ban đầu Netflix xuất hiện với hình ảnh một kẻ thách thức Hollywood và hệ thống rạp chiếu truyền thống. Tuy nhiên, sau đó nền tảng này dần chuyển sang chiến lược thâm nhập vào chính hệ thống đó. Họ nhận ra rằng có hàng trăm triệu người dùng không đồng nghĩa với uy tín nghệ thuật, thành công thương mại không tự động chuyển thành vị thế văn hóa, và trên hết, muốn được xem là một "studio điện ảnh lớn", Netflix cần được các thiết chế trao uy tín của ngành điện ảnh như Oscar thừa nhận.

Bởi vậy, họ sử dụng nguồn lực tài chính khổng lồ để giành lấy sự công nhận từ chính những thiết chế mà họ từng thách thức. Cụ thể, Netflix bỏ tiền hợp tác với các đạo diễn và diễn viên hàng đầu Hollywood để sở hữu những tác phẩm có khả năng cạnh tranh tại Oscar, Cannes hay Venice; chi mạnh cho các chiến dịch vận động giải thưởng; và chấp nhận "luật chơi" của Hollywood (để đủ điều kiện tranh giải Oscar, nền tảng phải cho phim chiếu rạp trước khi phát hành trên nền tảng).

Hiện tượng này cũng đang tái diễn trong những ngành khác, ví dụ ngành xuất bản. Microsoft đã ký thỏa thuận cấp phép với HarperCollins để sử dụng kho sách phục vụ huấn luyện AI [6]. Việc một công ty công nghệ nghìn tỷ đô trả tiền cho một nhà xuất bản lâu đời cho thấy một giới hạn rõ ràng. Dữ liệu trôi nổi trên internet, dù khổng lồ, không thể thay thế những hệ thống đã được biên tập, kiểm chứng và tích lũy uy tín qua thời gian.

Tuy nhiên, cho đến hiện tại, các thiết chế như Academy Awards hay Cannes vẫn ưu tiên những tác phẩm mà vai trò sáng tạo trung tâm thuộc về con người, và chưa sẵn sàng trao cùng mức độ công nhận cho những tác phẩm được tạo ra chủ yếu bởi hệ thống AI.

Hay như đạo diễn Hayao Miyazaki - huyền thoại hoạt hình Nhật Bản và đồng sáng lập Studio Ghibli - miêu tả: "Tôi thực sự thấy thứ này là một sự xúc phạm trắng trợn đối với sự sống." [7]

---

Chú thích:

[1] This film cost $500,000 to make. $400,000 was AI compute costs. The Wall Street Journal, 20/5/2026. https://www.wsj.com/cio-journal/this-cannes-film-cost-500-000-to-make-400-000-was-ai-compute-costs-a823b08d

[2] Cannes film festival says the Wall Street Journal is wrong: It’s not debuting an AI-generated feature film this week. Futurism, 22/5/2026. https://futurism.com/artificial-intelligence/cannes-not-showing-ai-generated-movie

[3] AI models collapse when trained on recursively generated data. Nature, 24/7/2024. https://www.nature.com/articles/s41586-024-07566-y

[4] ‘We’re expanding the cinematic toolbox’: AI fault lines on show at Cannes. The Guardian, 24/5/2026. https://www.theguardian.com/film/2026/may/24/ai-cannes-film-festival-seth-rogen

[5] ‘Late Night with the Devil’ directors respond to AI backlash: ‘We experimented with three images’. The Hollywood Reporter, 21/3/2024. https://www.hollywoodreporter.com/news/general-news/late-night-with-the-devil-directors-ai-art-backlash-1235857216/

[6] HarperCollins to allow tech firms to use its books to train AI models. The Guardian, 19/11/2024. https://www.theguardian.com/books/2024/nov/19/harpercollins-tech-firms-books-train-ai-models-nonfiction-artificial-intelligence

[7] Kaku Arakawa. (2016). Never-Ending Man: Hayao Miyazaki [Documentary]. NHK.

Trở lại Văn hóa - Xã hộiTrở lại Văn hóa - Xã hội