Thuật toán AI mới chụp được các photon chuyển động
Hãy nhắm mắt lại và hình dung ra cảnh lát cắt thời gian (bullet time) mang tính biểu tượng trong phim “The Matrix” (Ma trận) – nhân vật Neo do Keanu Reeves đóng vai, né những những viên đạn trong chuyển động chầm chậm. Giờ hãy tưởng tượng bạn có khả năng chứng kiến hiệu ứng tương tự nhưng thay vì những viên đạn đã bắn ra khỏi nòng súng, bạn đang thấy một thứ khác đang chuyển động nhanh hơn một triệu lần: ánh sáng.
Các nhà khoa học máy tính ở trường đại học Toronto đã thiết kế và lắp đặt một camera tiên tiến có có thể hình dung ánh sáng đang trong chuyển động từ một góc độ, mở ra những con đường tiến xa hơn trong nghiên cứu về các kỹ thuật cảm biến 3D mới.
Các nhà nghiên cứu phát triển một thuật toán AI phức tạp có thể mô phỏng một cảnh tượng siêu nhanh – một xung của tốc độ ánh sáng thông qua một chai nước ngọt hoặc bị bật khỏi gương – có thể giống như từ một điểm thuận lợi cho quan sát.
Công trình đã được xuất bản dưới dạng tiền ấn phẩm trên arXiv.
David Lindell, một trợ lý giáo sư Khoa học máy tính ở Khoa Nghệ thuật và khoa học, cho rằng kỳ tích này đòi hỏi năng lực tạo ra các video nơi camera xuất hiện để “bay” dọc rất nhiều photon ánh sáng khi chúng di chuyển.
“Công nghệ của chúng tôi có thể nắm bắt và hiển thị sự lan truyền thực tế của ánh sáng với chi tiết kịch tính, chậm dần”, Lindell nói. “Chúng tôi có một cái nhìn thoáng qua thế giới tại thang đo tốc độ ánh sáng mà không thể thấy theo cách thông thường”.
Các nhà nghiên cứu tin tưởng cách tiếp cận này, mới được họ trình bày tại hội nghị thị giác máy tính châu Âu 2024, có thể mở ra những năng lực mới trong nhiều khu vực nghiên cứu, bao gồm: các năng lực cảm biến tiên tiến như hình ảnh không tầm nhìn, một phương pháp cho phép những người xem ‘thấy’ những góc xung quanh hoặc những vật cản phía sau bằng những cái nảy lại của ánh sáng; hình ảnh thông qua môi trường tán xạ như khói, sương mù, các mô sinh học hoặc nước đục; tái cấu trúc 3D, nơi hiểu biết về hành xử của ánh sáng tán xạ trong nhiều mốc thời gian là điều tối cần thiết.
Bên cạnh Lindell, nhóm nghiên cứu bao gồm nghiên cứu sinh khoa học máy tính Anagh Malik, sinh viên năm thứ tư Noah Juravsky, giáo sư Kyros Kutulakos và phó giáo sư ĐH Stanford Gordon Wetzstein và nghiên cứu sinh Ryan Po.
Đổi mới sáng tạo chính của các nhà nghiên cứu nằm ở thuật toán AI mà họ phát triển để hiển thị các video siêu nhanh từ bất cứ điểm nhìn nào – một thách thức được biết đến trong thị giác máy tính như “tổng hợp cái nhìn mới”.
Về truyền thống, các phương pháp tổng hợp cái nhìn mới được thiết kế cho các hình ảnh hoặc video được các camera đều đặn nắm bắt. Tuy nhiên, các nhà nghiên cứu mở rộng khái niệm này để sử dụng dữ liệu thu được bằng việc vận hành camera siêu nhanh tại tốc độ có thể so với tốc độ ánh sáng, vốn là những thách thức độc nhất vô nhị – bao gồm sự cần thiết để thuật toán tính được tốc độ ánh sáng và mô hình hóa cách nó lan truyền thông qua một cảnh phim.
Thông qua công trình của mình, các nhà nghiên cứu quan sát sự hiển thị hóa camera chuyển động của ánh sáng đang chuyển động, bao gồm khúc xạ qua ánh sáng, nảy khỏi một tấm gương hoặc tán xạ khỏi một bề mặt. Họ cũng trình diễn cách hiển thị hiện tượng chỉ xuất hiện tại một phần đáng kể của vận tốc ánh sáng, như Albert Einstein đã dự đoán.
Ví dụ, họ hiển thị “hiệu ứng đèn pha”, một hiện tượng hấp dẫn xuất hiện khi ánh sáng của một vật thể chuyển động tập trung vào hướng phía trước, khiến các vật thể sáng hơn khi chuyển động tới người quan sát, và “co ngót độ dài”, khi các vật thể chuyển động nhanh trông ngắn hơn theo hướng chúng đang chuyển động. Các nhà nghiên cứu đã có thể tạo ra một cách để xem các vật thể có thể xuất hiện để co rút về độ dài khi chuyển động tại các mức vận tốc cao.
Trong khi các thuật toán hiện tại để xử lý các video siêu nhanh tập trung cụ thể vào phân tích một video từ một điểm nhìn, các nhà nghiên cứu cho biết công trình của họ là công trình đầu tiên mở rộng phân tích này đến các video nhiều điểm nhìn ánh sáng trong khi chuyển động, cho phép nghiên cứu được cách ánh sáng lan truyền từ đa góc nhìn.
“Các video nhiều điểm nhìn ánh sáng trong khi chuyển động của chúng tôi đóng vai trò nhu một công cụ giáo dục hiệu quả, qua đó đưa ra một cách độc đáo để dạy vật lý của vận chuyển ánh sáng”, Malik nói. “Bằng việc nắm bắt cách ánh sánh hành xử theo thời gian thự – dù khúc xạ thông qua một vật liệu hay phản xạ khỏi một bề mặt – chúng ta có thể có được một hiểu biết mang tính trực giác nhiều hơn về chuyển động của ánh sáng thông qua một cảnh quay”.
“Thêm vào đó, công nghệ của chúng tôi có thể truyền cảm hứng cho những ứng dụng sáng tạo trong nghệ thuật, như làm phim hoặc sắp đặt liên tương tác, nơi vẻ đẹp của vận chuyển ánh sáng có thể hữu dụng để tạo ra các dạng mới của hiệu ứng hiển thị hoặc các trải nghiệm cuốn hút người xem”.
Nghiên cứu này cũng có tiềm năng đáng kể trong cải thiện công nghệ cảm biến LIDAR vẫn sử dụng trong các xe tự lái. Cụ thể, các cảm biến này xử lý dữ liệu ngay lập tức tạo ra các hình ảnh 3D đúng cách. Nhưng công trình của các nhà nghiên cứu này còn cho thấy tiềm năng lưu trữ dữ liệu thô, bao gồm các mô hình ánh sáng chi tiết, giúp tạo ra các hệ có thể tốt hơn các loại LIDAR thông thường trong việc ‘nhìn’ thấy nhiều chi tiết hơn, xuyên qua các vật cản và hiểu vật liệu tốt hơn.
Khi dự án của các nhà nghiên cứu tập trung vào hiển thị cách ánh sáng di chuyển thông qua một cảnh phim từ bất kỳ hướng nào, họ lưu ý nó mang “những thông tin ẩn” về hình dạng và xuất hiện mọi thứ nó chạm tới. Khi các nhà nghiên cứu nhìn vào những bước tiếp theo của mình, họ muốn mở khóa thông tin bằng việc phát triển một phương pháp sử dụng các video nhiều điểm nhìn ánh sáng trong khi chuyển động để tái cấu trúc hình học 3D và xuất hiện toàn bộ cảnh phim.
“Điều này có nghĩa chúng tôi có thể có tiềm năng tạo ra những mô hình vật thể và môi trường ba chiều chi tiết một cách đáng kinh ngạc – chỉ bằng việc xem cách ánh sáng lan truyền xuyên qua chúng”, Lindell nói.
Thanh Phương dịch từ ĐH Toronto
Nguồn: https://www.artsci.utoronto.ca/news/light-bottle-u-t-researchers-use-ai-capture-photons-motion