Tác tử AI có thể hiểu quan hệ nhân – quả của nhiệm vụ điều hướng
Các nhà nghiên cứu đã phát hiện ra một loại mạng thần kinh có khả năng hiểu được mối quan hệ nhân – quả trong các nhiệm vụ mà chúng thực hiện. Trong tương lai, điều này có thể góp phần cải thiện độ tin cậy của AI ứng dụng trong các nhiệm vụ phức tạp như lái xe tự hành trên đường cao tốc đông đúc.
Mạng thần kinh là một phương pháp để triển khai học máy, trong đó máy tính học cách hoàn thành tác vụ thông qua việc thử – sai bằng cách phân tích các mẫu đào tạo. Mạng thần kinh có thể học cách giải quyết nhiều vấn đề, từ nhận dạng mèo trong ảnh đến điều khiển xe tự lái. Nhưng người ta vẫn chưa biết liệu các thuật toán nhận dạng mẫu này có thực sự hiểu được các nhiệm vụ mà chúng đang thực hiện hay không.
Giờ đây, các nhà nghiên cứu tại MIT đã chỉ ra một loại mạng thần kinh có thể hiểu cấu trúc nhân – quả của nhiệm vụ. Do hiểu được nhiệm vụ trực tiếp từ dữ liệu hình ảnh nên chúng sẽ hiệu quả hơn các mạng thần kinh khác khi thực hiện các nhiệm vụ định hướng trong môi trường phức tạp như có cây cối rậm rạp hoặc điều kiện thời tiết thay đổi thất thường.
Kết quả này sẽ được trình bày tại Hội thảo trực tuyến về hệ thống xử lý thông tin thần kinh (NeurIPS) vào tháng 12/2021.
Ramin Hasani, nghiên cứu sinh sau tiến sĩ tại Phòng thí nghiệm Khoa học máy tính và Trí tuệ nhân tạo (CSAIL) của MIT và là đồng tác giả nghiên cứu cho biết: “Bởi vì các hệ thống máy học lấy cảm hứng từ não bộ này có thể thực hiện suy luận theo nhân quả, chúng ta có thể chỉ ra cách chúng hoạt động và đưa ra quyết định. Điều này rất cần thiết cho các ứng dụng cần độ an toàn cao”.
Nghiên cứu này dựa trên một công trình trước đó của Hasani và cộng sự về một hệ thống học sâu lấy cảm hứng từ não bộ gọi là Neural Circuit Policy (NCP – Phương pháp vi mạch thần kinh) tạo ra từ các tế bào thần kinh “lỏng” (mạng thần kinh có thể thay đổi các phương trình cơ bản của chúng để liên tục thích ứng với các dữ liệu đầu vào mới). Hệ thống này đã điều khiển một chiếc xe tự lái bằng mạng lưới chỉ có 19 tế bào thần kinh điều khiển.
Họ nhận thấy các NCP thực hiện nhiệm vụ giữ xe đi đúng làn luôn chú ý đến đường chân trời và vạch biên khi ra quyết định – giống như cách con người lái xe. Các mạng thần kinh khác mà họ nghiên cứu không phải lúc nào cũng tập trung vào con đường.
Nhóm nghiên cứu phát hiện ra rằng khi đào tạo một NCP để thực hiện nhiệm vụ, nó sẽ học cách tương tác với môi trường và tính đến các biện pháp can thiệp. Về bản chất, mạng thần kinh nhận biết kết quả đầu ra có bị thay đổi do sự can thiệp nào đó hay không, sau đó liên hệ nguyên nhân và kết quả với nhau.
Trong quá trình đào tạo, mạng thần kinh chạy tiến để tạo ra kết quả đầu ra, sau đó quay ngược lại để sửa lỗi. Hasani và các đồng nghiệp không cần thực hiện bất kỳ thiết lập đặc biệt nào cho NCP để tìm mối quan hệ nhân quả – nó tự động xuất hiện trong quá trình đào tạo.
Họ đã thử nghiệm các mạng NCP thông qua một loạt mô phỏng, trong đó các máy bay không người lái (drones) tự thực hiện các nhiệm vụ điều hướng. Các nhà nghiên cứu nhận thấy rằng, các NCP này thực hiện tốt các nhiệm vụ đơn giản giống các các mạng lưới khác trong thời tiết thuận lợi. Tuy nhiên, chúng vượt trội hơn hẳn trong các nhiệm vụ khó khăn như đuổi theo vật thể di động lúc trời mưa.
“Khi hệ thống học được những gì thực sự cần làm, nó có thể hoạt động tốt trong các tình huống mới và điều kiện môi trường mà nó chưa từng trải qua. Đây là một thách thức lớn đối với các hệ thống học máy hiện tại không theo nhân – quả. Phát hiện này rất thú vị vì chúng cho thấy mối quan hệ nhân quả có thể xuất hiện như thế nào từ sự lựa chọn của mạng thần kinh”, anh nói.
Trong tương lai, các nhà nghiên cứu muốn xem xét sử dụng NCP để xây dựng các hệ thống lớn hơn. Việc kết hợp hàng nghìn hoặc hàng triệu mạng NCP với nhau có thể cho phép giải quyết các nhiệm vụ phức tạp hơn.
Trang Linh dịch
Nguồn: https://news.mit.edu/2021/cause-effect-neural-networks-1014