Thúc đẩy hiệu quả của thị giác máy tính dựa trên nghiên cứu về mắt người
Để hỗ trợ con người tốt nhất trong thực tế, robot cần có khả năng liên tục tiếp thu các kỹ năng mới hữu ích trong môi trường năng động và thay đổi nhanh chóng. Tuy nhiên, hiện tại, hầu hết robot chỉ có thể thực hiện các nhiệm vụ đã được huấn luyện từ trước, chúng chỉ có các khả năng mới sau khi được huấn luyện thêm.
Giống như hệ thống thị giác của chúng ta, thiết bị này được thiết kế để cảm nhận sự thay đổi, về nguyên tắc làm cho nó hiệu quả hơn so với các hệ thống máy ảnh kỹ thuật số đòi hỏi tính toán cao được sử dụng trong các ứng dụng như ô tô tự lái và robot tự động.
“Các hệ thống thị giác máy tính sử dụng một lượng năng lượng khổng lồ, điều này gây khó khăn trong việc sử dụng chúng rộng rãi. Mục tiêu dài hạn của chúng tôi là sử dụng mô phỏng sinh học để giải quyết các thách thức về hình ảnh động trong khi chỉ cần xử lý ít dữ liệu hơn”, Jianguo Mei – giáo sư Hóa học tại Đại học Khoa học Purdue cho biết. “Bằng cách bắt chước võng mạc của con người trong việc nhận biết ánh sáng, hệ thống của chúng ta có thể sử dụng ít dữ liệu hơn nhiều, mặc dù vẫn còn một chặng đường dài phía trước để tích hợp phần cứng với phần mềm và biến ý tưởng này trở thành hiện thực”.
Mei và nhóm của mình đã lấy cảm hứng từ khả năng nhận biết ánh sáng trong tế bào võng mạc. Giống như trong tự nhiên, ánh sáng gây ra phản ứng điện hóa trong thiết bị nguyên mẫu mà họ đã chế tạo. Phản ứng tăng cường đều đặn, tăng dần khi tiếp xúc nhiều lần với ánh sáng và giảm dần khi ánh sáng rút đi, tạo ra bộ nhớ hiệu quả về thông tin ánh sáng mà thiết bị nhận được.
Bộ nhớ này có tiềm năng được sử dụng để giảm lượng dữ liệu cần được xử lý để hiểu được một cảnh chuyển động – một cách tiếp cận hiệu quả về mặt tính toán và có khả năng chịu lỗi cao hơn so với thị giác máy tính thông thường.
Nhóm nghiên cứu gọi thiết bị của họ là khớp thần kinh quang tử điện hóa hữu cơ. Thiết bị này mô phỏng gần giống cách thức hoạt động của hệ thống thị giác của con người và có tiềm năng lớn làm nền tảng của một thiết bị cho giao diện người-máy. Ke Chen – sinh viên sau đại học làm việc cho phòng thí nghiệm của Mei và là tác giả chính của bài báo trên Nature Photonics, cho biết thiết kế này cũng có thể hữu ích cho các ứng dụng điện toán hình thái thần kinh hoạt động dựa trên các nguyên tắc tương tự như kiến trúc của bộ não con người.
“Trong một hệ thống thị giác máy tính thông thường, bạn tạo ra một tín hiệu, sau đó bạn phải chuyển dữ liệu từ bộ nhớ sang quá trình xử lý và quay lại bộ nhớ; do đó phải mất rất nhiều thời gian và năng lượng để làm điều đó”, Chen nói. “Thiết bị của chúng tôi có các chức năng tích hợp nhận biết ánh sáng, chuyển đổi tín hiệu ánh sáng thành điện cũng như xử lý dữ liệu và bộ nhớ tại chỗ.”
Hiện tại, các thiết bị robot hoặc tự động dựa vào máy ảnh kỹ thuật số quen thuộc làm nền tảng cho thị giác máy tính. Bên trong máy ảnh, các vùng nhạy sáng của silicon tinh thể, được gọi là photosite, hấp thụ photon và giải phóng electron, chuyển đổi ánh sáng thành tín hiệu điện có thể được xử lý bằng các chương trình nhận dạng hình ảnh máy tính ngày càng phức tạp. Một máy ảnh điện thoại thông minh thông thường sử dụng tới 10 triệu photosite, mỗi photosite chỉ có vài micron (một phần triệu mét), chụp ảnh với độ phân giải cao hơn nhiều so với mắt chúng ta có thể làm được.
Ngược lại, giải pháp của Mei, giống như thị giác của con người, có độ phân giải tương đối thấp nhưng rất phù hợp để cảm nhận chuyển động. Mắt người có độ phân giải trong khoảng 15 micron. Thiết bị nguyên mẫu – chứa 18.000 transistor (một loại linh kiệnbán dẫn) trên một con chip vuông 10 cm – có độ phân giải vài trăm micron. Mei cho biết công nghệ này có thể được cải thiện bằng cách giảm độ phân giải xuống khoảng 10 micron.
“Mắt và não của con người không có độ phân giải cao như điện toán silicon, nhưng cách chúng ta xử lý dữ liệu khiến mắt của chúng ta hoạt động tốt hơn hầu hết các hệ thống hình ảnh mà chúng ta có hiện nay khi xử lý dữ liệu”, Mei cho biết. □
Kim Dung lược dịch
Nguồn: https://techxplore.com/news/2023-11-human-eye-boost-vision-efficiency.html