AI ghi nhận biểu cảm trong nghệ thuật thị giác

Các chuyên gia về trí tuệ nhân tạo đã có khả năng tạo ra những máy tính có thể “thấy” thế giới xung quanh nó – ghi nhận các vật thể, con vật, và những hành động trong tầm hiểu biết của chúng. Đây là những công nghệ nền tảng cho ô tô tự lái, máy bay không người lái và các hệ an ninh trong tương lai.

Hiện tại thì một nhóm nghiên cứu đang nỗ lực làm việc để dạy các máy tính ghi nhận không chỉ các vật thể trong một bức ảnh mà còn cách những bức ảnh đó khơi gợi cảm xúc của con người như thế nào – ví dụ các thuật toán với trí tuệ cảm xúc.

“Khả năng này sẽ trở thành yếu tố quan trọng để tạo ra trí tuệ nhân tạo không chỉ thông minh hơn mà còn có chất người hơn”, Panos Achlioptas, một nghiên cứu sinh về khoa học máy tính tại trường đại học Stanford hiện đang cộng tác với những đồng nghiệp Pháp và Saudi Arabia, nói.

Để đạt được mục tiêu này, Achlioptas và các thành viên của nhóm nghiên cứu đã thu thập một bộ dữ liệu mới mang tên ArtEmis, mới được xuất bản gần đây trên arXiv như một dạng tiền ấn phẩm. Bộ dữ liệu đó có khoảng 81.000 bức vẽ WikiArt và chứa 440.000 câu phản hồi dưới do hơn 6.500 người viết ra để chỉ dấu cách mỗi bức tranh khơi gợi cảm xúc gì ở họ – và bao gồm những giải thích về việc tại sao họ lại chọn lấy một biểu cảm nhất định. Sử dụng những phản hồi đó, Achlioptas và nhóm nghiên cứu do giáo sư Stanford Leonidas Guibas, đã huấn luyện hệ nhận dạng AI cho phép phản hồi chữ viết, qua đó cho phép máy tính tạo ra những phản hồi cảm xúc với nghệ thuật thị giác và chứng minh những cảm xúc đó trong ngôn ngữ.

Các nhà nghiên cứu đã chọn sử dụng nghệ thuật thể hiện cảm xúc một cách cụ thể và rành mạch, vì mục tiêu của một hoa sĩ là khơi gợi cảm xúc ở người xem. ArtEmis hướng đến mọi chủ đề, từ tranh tĩnh vật đến chân dung hay tranh trừu tượng.

Công trình này là một cách tiếp cận mới trong thị giác máy tính, Guibas lưu ý. Anh là một thanh viên của Phòng thí nghiệm AI và Viện nghiên cứu Trí tuệ nhân tạo lấy con người làm trung tâm ở Stanford. “Công việc thu thập thị giác máy tính cổ điển thường nắm bắt nội dung theo nghĩa đen”, Guibas nói. “Có ba con chó trong bức ảnh này hoặc ai đó đang uống cà phê từ một cái cốc. Nay thì thay cách đó, chúng tôi cần những miêu tả xác định nội dung cảm xúc”. 

Nắm bắt cảm xúc

Thuật toán này ghi nhận tác phẩm của các nghệ sĩ vào một trong tám hạng mục biểu cảm – phạm vi trải rộng từ kinh ngạc đến thích thú, sợ hãi hay buồn rầu – và sau đó giải thích bằng văn bản những gì trong bức ảnh thể hiện cảm xúc đó. (Hãy xem min họa. Tất cả các bức tranh đều được thuật toán này đánh giá).

“Chiếc máy tính này đang thực hiện điều đó”, Achlioptas nói. “Chúng tôi có thể chứng minh đây là một bức ảnh hoàn toàn mới và nó sẽ nói với chúng ta biết là một người có thể cảm nhận được gì nếu thấy bức ảnh đó”.

Các nhà nghiên cứu cho biết, thật đáng chú ý là những chú thích phản ánh một cách chính xác nội dung trừu tượng của bức ảnh theo những cách vượt quá khả năng cả những thị giác máy tính hiện tại, vốn được huấn luyện trên những bộ dữ liệu ảnh tài liệu như Coco. 

Hơn nữa, thuật toán mới này không chỉ đơn giản là nắm bắt được trải nghiệm cảm xúc của một bức ảnh hoàn thiện mà còn có thể hiểu được những biểu cảm khác trong một bức ảnh nhất định. Ví dụ trong bức tranh nổi tiếng về cảnh cái đầu bị chém của John the Baptist do danh họa Rembrandt vẽ, ArtEmis phân biệt không chỉ nỗi đau trên khuôn mặt của người đàn ông cầm cái đầu của John the Baptist mà còn cả “sự mãn nguyện” trên khuôn mặt của Salome, người phụ nữ đã cầu xin chặt đầu John the Baptist.

Achlioptas nêu, ngay cả khi ArtEmis chưa đủ độ phức tạp và tinh tế để đánh giá được ý đồ của từng tác giả có thể khác biệt trong bối cảnh của mỗi bức họa, công cụ này cũng vẫn có thể nhận biết được tính chủ quan và sự thay đổi trong phản hồi của con người. “Không phải mỗi người đều thấy và cảm nhận giống nhau khi ngắm một tác phẩm nghệ thuật”, anh nói. Ví dụ, “Tôi có thể cảm thấy hạnh phúc khi nhìn thấy bức ‘Mona Lisa’ nhưng giáo sư Guibas có thể cảm thấy buồn bã. ArtEmis có thể phân biệt được những điều khác biệt này”. 

Công cụ của một nghệ sĩ

Trong tương lai gần, các nhà nghiên cứu dự đoán là các nghệ sĩ có thể coi ArtEmis như một công cụ hữu ích để đánh giá tác phẩm của mình trong suốt quá trình sáng tạo để đảm bảo công trình của họ sẽ khơi gợi được cảm xúc và có tác động như mong muốn. “Nó có thể đem lại hướng dẫn và khơi nguồn cảm hứng để ‘lèo lái’ tác phẩm của họ theo hướng họ mong muốn”, Achlioptas nói. Ví dụ, một nghệ sĩ đồ họa sáng tác một lô gô mới có thể sử dụng ArtEmis để đảm bảo là có được hiệu ứng cảm xúc mong muốn.

Một khi nghiên cứu và tinh chỉnh thêm thì Achlioptas có thể thấy trước các thuật toán về cảm xúc này có thể giúp mang đếm cảm xúc với những ứng dụng trí tuệ nhân tạo ở chatbot và các tác nhân AI đàm thoại. “Tôi thấy là ArtEmis có thể đem những hiểu biết sâu sắc về tâm lý con người vào trí tuệ nhân tạo”, Achlioptas nói. “Tôi muốn làm cho AI mang tính cá nhân hơn và cải thiện hơn những trải nghiệm của con người với nó”. 

Tô Vân tổng hợp

Nguồnhttps://techxplore.com/news/2021-03-artist-intent-ai-emotions-visual.html

https://arxiv.org/abs/2101.07396

 

Tác giả