Robot sử dụng công cụ sáng tạo hơn nhờ mô hình ngôn ngữ lớn 

Các nhà nghiên cứu tại Đại học Carnegie Mellon và Google DeepMind gần đây đã phát triển RoboTool - một hệ thống có thể mở rộng khả năng của robot, từ đó giúp cho chúng sử dụng các công cụ theo những cách sáng tạo hơn. Hệ thống này, được giới thiệu trong một bài báo trên arXiv, có thể sớm mang đến một làn sóng đổi mới sáng tạo mới cho lĩnh vực robot.

“Việc sử dụng công cụ thường được coi là dấu hiệu của trí thông minh tiên tiến”, Mengdi Xu – nghiên cứu sinh tiến sĩ tại Đại học Carnegie Mellon và đồng tác giả đầu tiên của bài báo – chia sẻ với Tech Xplore.

“Chẳng hạn, trong các thí nghiệm của Wolfgang Koehler, loài vượn đã khéo léo xếp các thùng để lấy những quả chuối nằm ngoài tầm với của chúng trong khi khỉ đuôi dài sử dụng đá làm công cụ để đập vỡ các loại hạt và vỏ. Ngoài việc sử dụng các công cụ cho mục đích đã định và tuân theo các quy trình đã được thiết lập, chúng còn sử dụng các công cụ theo cách sáng tạo và độc đáo để đưa ra giải pháp linh hoạt hơn nhưng cũng đặt ra nhiều thách thức hơn đối với khả năng nhận thức”.

Robot thường hoàn thành các nhiệm vụ thủ công theo cách tiêu chuẩn và lặp đi lặp lại mà không tìm ra các phương pháp thay thế. Tuy nhiên, nếu tìm ra cách làm sáng tạo hơn, chúng có thể giải quyết tốt hơn các tình huống phức tạp trong thế giới thực.

“Trong chế tạo robot, việc sử dụng công cụ sáng tạo cũng là một khả năng quan trọng nhưng đây là một khía cạnh rất thách thức vì nó đòi hỏi khả năng toàn diện để dự đoán kết quả của một hành động, lý giải nên sử dụng công cụ nào và lên kế hoạch sử dụng chúng”, Peide Huang – đồng tác giả đầu tiên và là nghiên cứu sinh tiến sỹ cho biết. Do đó, mục tiêu chính mà Xu, Huang và các đồng nghiệp đặt ra trong nghiên cứu mới chính là tạo ra một hệ thống cho phép robot sử dụng các công cụ một cách sáng tạo hơn. Một công cụ như vậy có thể giúp giải quyết nhiều vấn đề trong thế giới thực, chẳng hạn như cho phép robot điều chỉnh “chiến lược” nắm bắt các vật thể ngoài tầm với hoặc leo lên vị trí mục tiêu.

“Sự gia tăng của các mô hình ngôn ngữ lớn (LLM) đã nâng cao đáng kể các chức năng của chatbot, tự động hóa mã hóa và tạo nội dung trực quan”, Huang giải thích. “Ngoài các giao diện kỹ thuật số này, AI có thể đại diện cho biên giới tiếp theo về trí thông minh – một biên giới tương tác hữu hình với thế giới thực. Robot, đóng vai trò là phần mở rộng vật lý của LLM, là phương tiện lý tưởng để khám phá hoạt động này”.

Các nghiên cứu trước đây đã chứng minh tiềm năng của những mô hình này trong việc cải thiện các khả năng khác nhau của robot, bao gồm cả khả năng giao tiếp với người dùng cũng như khả năng lập luận, lập kế hoạch và thực hiện nhiệm vụ của chúng.

Trong nghiên cứu mới, hệ thống được đặt tên là RoboTool, chấp nhận các hướng dẫn ngôn ngữ tự nhiên bao gồm thông tin văn bản và số về môi trường, các phương án robot và mọi ràng buộc phải tuân theo. Sau đó, nó tạo ra mã áp dụng các kỹ năng cấp thấp được tham số hóa của robot để điều khiển cả robot mô phỏng và robot vật lý.

Công cụ mới do các nhà nghiên cứu tạo ra có bốn thành phần chính: máy phân tích, máy lập kế hoạch, máy tính và bộ mã hóa. Máy phân tích xử lý các gợi ý (prompt) do người dùng đưa ra bằng ngôn ngữ tự nhiên, xác định các yếu tố chính có thể ảnh hưởng đến tính khả thi của nhiệm vụ được yêu cầu. Thành phần lập kế hoạch của hệ thống nhận cả đầu vào ngôn ngữ gốc và các khái niệm chính đã được xác định, từ đó sử dụng chúng để xây dựng chiến lược toàn diện nhằm hoàn thành nhiệm vụ. Mặt khác, thành phần máy tính xác định các tham số, chẳng hạn như vị trí mục tiêu cần thiết cho từng kỹ năng được tham số hóa. Thành phần cuối cùng của RoboTool – bộ mã hóa, chuyển đổi kế hoạch toàn diện do máy lập kế hoạch tạo ra và các tham số do máy tính tạo ra thành mã thực thi. 

Nhờ đó, RoboTool giúp robot sử dụng các công cụ một cách sáng tạo, giải quyết nhiều nhiệm vụ phức tạp mà chúng chưa từng gặp phải trước đây. Chẳng hạn, nó có thể giúp tạo ra một đòn bẩy để nâng những chiếc hộp nặng hoặc nhấn một nút ngoài tầm với.□

Kim Dung lược dịch

Nguồn: https://techxplore.com/news/2023-11-robots-tools-creatively-leveraging-large.html

Tác giả