Tín hiệu vô tuyến đem lại thị giác vượt trội cho robot
Trong cuộc chạy đua phát triển các hệ thống tri giác cho robot, có một thách thức dai dẳng là làm thế nào để chúng có thể hoạt động ngay cả trong thời tiết khắc nghiệt và môi trường phức tạp. Do đó, các thiết bị cảm biến hình ảnh dựa trên ánh sáng như camera hay LiDAR khó xác định được hình ảnh khi ở trong môi trường có khói hoặc sương mù.
Tuy nhiên, tự nhiên cho chúng ta thấy nhiều cơ chế thực vật đã tiến hóa để nhận biết được môi trường mà không cần ánh sáng. Dơi điều hướng dựa trên tiếng vang của sóng âm còn cá mập săn mồi bằng cách cảm nhận điện trường của con mồi.
Sóng vô tuyến, với bước sóng dài hơn sóng ánh sáng nhiều lần, không chỉ xuyên qua được khói và sương mù mà còn xuyên qua được một số vật liệu. Chúng hé mở khả năng mới áp dụng cho các robot, vốn vẫn đang dựa vào camera và công nghệ LiDar để cung cấp hình ảnh sắc nét nhưng bị hạn chế bởi thời tiết, hoặc sử dụng công nghệ radar truyền thống có thể nhìn xuyên qua vật cản nhưng chỉ thu được những hình ảnh thô sơ, với độ phân giải thấp.
Một nhóm các nhà khoa học tại trường Đại học Kỹ thuật và Khoa học Ứng dụng Pennsylvania hiện nay đang phát triển PanoRadar, một công cụ chuyển đổi các sóng vô tuyến đơn giản thành các hình ảnh 3D về không gian xung quanh. “Câu hỏi đầu tiên của chúng tôi là liệu có thể kết hợp được khả năng xuyên qua sương mù của sóng vô tuyến và độ phân giải cao của cảm biến hình ảnh trên một thiết bị hay không” Mingmin Zhao, phó giáo sư ngành Khoa học Thông tin và Máy tính, cho biết.
Hoạt động giống như hải đăng, PanoRadar lia chùm tia theo hình tròn để quét toàn bộ môi trường xung quanh. Hệ thống bao gồm một dãy các ăng ten dọc, phát ra sóng vô tuyến và chờ tín hiệu phản xạ từ môi trường, giống như các chùm sáng từ ngọn hải đăng giúp phát hiện các con tàu trên biển và địa hình ven biển. Nhờ có AI, PanoRadar có thể kết hợp các phép đo từ mọi góc quay để nâng cao độ phân giải hình ảnh của nó.
Mặc dù chi phí cho cảm biến radar chỉ bằng khoảng 1/10 chi phí cho hệ thống LiDAR thông thường nhưng PanoRadar cũng đạt được độ phân giải không kém gì LiDAR nhờ các điểm đo dày đặc. Zhao giải thích, vấn đề nằm ở cách họ xử lý các phép đo vô tuyến. Các thuật toán xử lý tín hiệu và học máy của họ có thể trích xuất thông tin 3D phong phú từ môi trường.
Một trong những thách thức lớn mà nhóm của Zhao phải đối mặt là duy trì độ phân giải hình ảnh tốt trong khi robot di chuyển. “Để tín hiệu vô tuyến đạt được độ phân giải tương đương với LiDAR, chúng tôi cần kết hợp các phép đo ở nhiều vị trí khác nhau với độ chính xác dưới milimet. Điều này trở nên đặc biệt khó khăn khi robot di chuyển, vì một sai số chuyển động nhỏ cũng ảnh hưởng đáng kể đến chất lượng hình ảnh”, trợ lý nghiên cứu Yifei Liu, cho biết.
Một thách thức khác là dạy robot hiểu được những gì nó nhìn thấy. “Các môi trường trong nhà có những mô hình và hình học nhất quán”, đồng tác giả Gaoxiang Luo nói. “Chúng tôi đã tận dụng các mô hình đó để hệ AI diễn giải các tín hiệu radar, tương tự cách con người học hỏi ý nghĩa của những gì họ thấy”.
Quá trình học của máy được đối chiếu với dữ liệu LiDAR để kiểm tra kết quả, từ đó có thể tiếp tục cải thiện bản thân.
Thử nghiệm thực tế tại các tòa nhà khác nhau cho thấy cảm biến vô tuyến có thể vượt trội hơn cảm biến LiDAR ở những nơi có điều kiện khó như khói và môi trường có nhiều vật liệu trong suốt.
Trong tương lai, nhóm nghiên cứu dự định kiểm nghiệm khả năng phối hợp của PanoRadar với các công nghệ cảm biến khác như máy ảnh và LiDAR nhằm tạo ra hệ thống cảm biến đa phương thức. Zhao nói: “Đối với một số nhiệm vụ đặc thù, việc có nhiều phương thức cảm biến môi trường là rất quan trọng. Mỗi cảm biến đều có điểm mạnh và điểm yếu. Bằng cách kết hợp chúng một cách hợp lý, chúng ta có thể tạo ra những robot được trang bị tốt hơn để xử lý các thách thức từ thực tế.”□
Diễm Quỳnh lược dịch
Nguồn: https://ai.seas.upenn.edu/news/giving-robots-superhuman-vision-using-radio-signals/
Bài đăng Tia Sáng số 22/2024