Chiến lược AI bắt chước cách não học về mùi hương

Cảm nhận về mùi vị của não người có thể giúp các nhà khoa học khắc phục được giới hạn của những kỹ thuật học máy, vốn chủ yếu dựa trên hệ thị giác để xử lý thông tin.

Nguồn: Quantamagazine

Những hệ AI hiện tại, trong đó có các mạng thần kinh nhân tạo được xây dựng theo các neuron và những kết nối của hệ thần kinh, thực hiện một cách tuyệt vời các nhiệm vụ với những ràng buộc đã biết. Chúng có xu hướng đòi hỏi rất nhiều nguồn lực máy tính và những lượng dữ liệu khổng lồ được huấn luyện. Tất cả những điều đó tập hợp lại mới khiến chúng trở nên xuất chúng trong chơi cờ vua hoặc cờ vây, trong việc dò ra một chiếc ô tô trong một bức ảnh, thấy sự khác biệt giữa những miêu tả các con chó và các con mèo. “Nhưng chúng lại rất thảm hại trong sáng tác âm nhạc hay viết truyện ngắn”, Konrad Kording, một nhà khoa học thần kinh tính toán tại trường Đại học Pennsylvania, nhận xét.

Để vượt qua các giới hạn đó, một số nhóm nghiên cứu đang trở lại tìm hiểu bộ não với những ý tưởng mới. Nhưng chỉ số ít trong số này lựa chọn những thứ có vẻ như không chắc chắn làm điểm bắt đầu: cảm nhận về mùi hương, hay khứu giác. Các nhà khoa học đang cố gắng có được những hiểu biết sâu sắc hơn về cách các sinh vật xử lý thông tin hóa học, qua đó phát hiện ra các chiến lược mã hóa thông tin có vẻ như liên quan đến các vấn đề của AI. Hơn nữa, các mạch khứu khác lại mang những điểm tương đồng đáng kinh ngạc với những vùng não phức tạp hơn.

May mắn và các cuộc cách mạng

Các kỹ thuật học máy tiên tiến nhất thường bắt chước cấu trúc của hệ thống thị giác dựa trên việc trích xuất thông tin theo thứ bậc. Khi vỏ não thị giác nhận dữ liệu ánh sáng, đầu tiên nó chọn ra các đặc điểm nhỏ được xác định rõ ràng: các cạnh, kết cấu, màu sắc được phân bố trong không gian. Vào những năm 1950 và 1960, các nhà thần kinh học David Hubel và Torsten Wiesel đã phát hiện ra rằng các tế bào thần kinh cụ thể trong hệ thống thị giác tương ứng với các vị trí điểm ảnh cụ thể trong võng mạc, phát hiện giúp họ giành được giải Nobel. Khi thông tin hình ảnh được truyền qua các lớp tế bào thần kinh vỏ não, các chi tiết về các cạnh, kết cấu và màu sắc kết hợp với nhau để tạo thành các biểu diễn thông tin đầu vào ngày càng trừu tượng hơn, ví dụ khuôn mặt người và danh tính của khuôn mặt đó là Jane chẳng hạn. Các biểu diễn này lại là đầu vào của lớp sau. Mỗi lớp trong mạng lưới giúp sinh vật đạt được các mục tiêu khác nhau.

Các nhà khoa học đang cố gắng có được những hiểu biết sâu sắc hơn về cách các sinh vật xử lý thông tin hóa học, qua đó phát hiện ra các chiến lược mã hóa thông tin có vẻ như liên quan đến các vấn đề của AI.

Các mạng lưới thần kinh sâu được xây dựng để hoạt động theo một cách thứ bậc tương tự, dẫn đến một cuộc cách mạng trong nghiên cứu học máy và AI. Để dạy cho chúng ghi nhận được các vật thể như các gương mặt chẳng hạn, chúng được “nuôi” bằng hàng ngàn bức ảnh. Hệ thống này có thể làm mạnh lên hoặc yếu đi các kết nối giữa những mạng thần kinh để nhận định được một cách chính xác một bộ điểm ảnh cho trước hình thành mẫu hình mơ hồ của khuôn mặt. Nếu đủ các ví dụ trong dữ liệu, nó sẽ có thể ghi nhận những khuôn mặt trong những hình ảnh mới và bối cảnh mới mà nó chưa từng thấy trước đây.

Các nhà khoa học đã có được thành công lớn với các mạng này, không chỉ ở việc phân loại hình ảnh mà còn ở ghi nhận giọng nói, dịch thuật và các ứng dụng học máy khác. Tuy nhiên Adam Marblestone, một nhà sinh lý học tại Viện Công nghệ Massachusetts, cho rằng việc thị giác là một nguồn thông tin chi phối trong AI là “một sự tình cờ lịch sử”. Vì đó là hệ thống mà các nhà khoa học hiểu rõ nhất và các ứng dụng hình ảnh cũng rõ ràng nhất.

Saket Navlakha, một nhà khoa học máy tính tại Viện Nghiên cứu Sinh học Salk ở California, chỉ ra rằng các mạng khứu giác của côn trùng có thể nắm giữ một số nguyên lý mới. Một số nhà khoa học thì lập luận là với các bài toán tính toán chung thì nghiên cứu theo hướng khứu giác còn dễ xây dựng hơn là thị giác. Charles Delahunt, một nhà nghiên cứu tại Trung tâm Khoa học thần kinh tính toán tại ĐH Washington, nói: “Chúng tôi nghiên cứu về khứu giác vì đó là một hệ thống hữu hạn mà bạn có thể mô tả tương đối đầy đủ”.

Delahunt và đồng nghiệp tại Đại học Washington, J. Nathan Kutz, đã tiến thêm một bước bằng cách tạo ra cái mà họ gọi là “người máy côn trùng”. Nguồn: Quantamagazine

Mạng thưa và mạng ngẫu nhiên

Trên thực tế, khứu giác khác với thị giác trên nhiều mặt. Mùi không có cấu trúc, cũng không có góc cạnh; chúng không phải là những vật thể có thể được nhóm lại trong không gian. Chúng là hỗn hợp của các thành phần và nồng độ khác nhau, và chúng rất khó phân loại là giống hay khác nhau. Do đó không phải lúc nào cũng có thể chỉ rõ đặc tính nào cần chú ý. Những mùi này được phân tích bởi một mạng neuron thần kinh ba lớp, nông, ít phức tạp hơn đáng kể so với vỏ đại não. Các tế bào thần kinh khứu giác lấy mẫu ngẫu nhiên toàn bộ không gian thụ thể chứ không tập trung vào các vùng theo thứ tự nào. Họ sử dụng thứ mà Charles Stevens, một nhà thần kinh học tại Viện Salk, gọi là “antimap”. Trong một hệ thống được lập bản đồ như vỏ đại não, vị trí của một tế bào thần kinh tiết lộ điều gì đó về loại thông tin mà nó mang theo. Nhưng trong “antimap” của vỏ đại não thì không. Thay vào đó, thông tin được phân phối trên toàn hệ thống và việc đọc dữ liệu đó liên quan đến việc lấy mẫu từ một số lượng tế bào thần kinh tối thiểu. Một “antimap” được xây dựng qua một biểu diễn thưa của thông tin trong một không gian nhiều chiều.

Lấy ví dụ mạng khứu giác của ruồi giấm: 50 tế bào thần kinh gán hình nhận thông tin đầu vào từ các thụ thể nhạy cảm với các phân tử khác nhau. Một mùi duy nhất sẽ kích thích nhiều tế bào thần kinh khác nhau và mỗi tế bào thần kinh đại diện cho nhiều loại mùi khác nhau. Đó là một mớ hỗn độn thông tin và các biểu diễn chồng chéo trong không gian 50 chiều. Thông tin sau đó được chiếu ngẫu nhiên tới 2.000 tế bào Kenyon mã hóa các mùi hương cụ thể. (Ở động vật có vú, các tế bào trong nhân khứu giác trước xử lý việc này.) Điều đó giúp mở rộng gấp 40 lần về số chiều không gian, giúp dễ dàng phân biệt mùi bằng các mẫu phản ứng thần kinh. Mạng khứu giác của ruồi đã xác định các mùi riêng biệt bởi các neuron thần kinh cách xa nhau. Chúng “phân tán” dữ liệu ra. Ví dụ chỉ khoảng 100 trong số 2.000 tế bào Kenyon – 5% – bị kích thích để phản ứng với mỗi mùi (các tế bào khác sẽ bị tê liệt), từ đó nhận biết ra mùi xác định. Trong khi các mạng học sâu truyền thống (từ hệ thống thị giác) liên tục thay đổi độ mạnh của các kết nối khi chúng “học”, thì hệ thống khứu giác nhìn chung dường như không tự huấn luyện bằng cách điều chỉnh các kết nối giữa các neuron nhận mùi của nó và các tế bào Kenyon.

Hệ thống tự nhiên và con người xử lý thông tin bằng cách sử dụng phương pháp tổ chức ngẫu nhiên và mở rộng chiều để biểu diễn dữ liệu phức tạp, về mặt hình thức là tương đương nhau. Trí tuệ nhân tạo và sự tiến hóa đã hội tụ một cách độc lập trên cùng một giải pháp.

Đầu những năm 2000, các nhà nghiên cứu nghiên cứu về khứu giác đã phát triển các thuật toán để xác định cách nhúng ngẫu nhiên và thưa thớt trong nhiều chiều để giúp tăng hiệu quả tính toán. Hai nhà khoa học Thomas Nowotny của Đại học Sussex ở Anh và Ramón Huerta của Đại học California, San Diego, đã chỉ ra sự tương đồng với một mô hình học máy khác là “support vector machine”. Họ lập luận rằng cách cả hệ thống tự nhiên và con người xử lý thông tin bằng cách sử dụng phương pháp tổ chức ngẫu nhiên và mở rộng chiều để biểu diễn dữ liệu phức tạp, về mặt hình thức là tương đương nhau. Trí tuệ nhân tạo và sự tiến hóa đã hội tụ một cách độc lập trên cùng một giải pháp.

Bị hấp dẫn bởi mối liên hệ đó, Nowotny và các đồng nghiệp của mình tiếp tục khám phá giao điểm giữa khứu giác và học máy, tìm kiếm mối liên hệ sâu sắc hơn giữa hai điều này. Vào năm 2009, họ đã chỉ ra rằng một mô hình khứu giác dựa trên côn trùng, ban đầu được tạo ra để nhận biết mùi, cũng có thể nhận ra các chữ số viết tay. Hơn nữa, việc loại bỏ phần lớn các neuron của mô hình để bắt chước cách các tế bào não đã chết đi và không được thay thế — không ảnh hưởng quá nhiều đến hiệu suất của mô hình. Nowotny nói: “Các bộ phận có thể ngừng hoạt động nhưng toàn bộ hệ thống sẽ tiếp tục hoạt động”. Tuy nhiên, phải đến rất gần đây, một số nhà khoa học mới xem xét lại cấu trúc sinh học của khứu giác để hiểu rõ hơn về cách cải thiện các vấn đề học máy cụ thể.

Kiến thức định sẵn và cách học nhanh

Delahunt và các đồng nghiệp lặp lại thí nghiệm của Nowotny, sử dụng hệ thống khứu giác của bướm đêm và so sánh nó với các mô hình học máy truyền thống. Ông nhận ra “nếu có rất nhiều dữ liệu, các phương pháp học máy tốt hơn nhưng chỉ với dưới 20 mẫu thì mô hình côn trùng sẽ rất giỏi trong việc thực hiện phân loại sơ bộ nhanh chóng”. Với khứu giác, “học” không còn là việc tìm kiếm các tính năng và biểu diễn tối ưu cho nhiệm vụ cụ thể trước mắt. Thay vào đó nó chuyển thành nhận ra tính năng nào trong số hàng loạt tính năng ngẫu nhiên hữu ích và tính năng nào không. Cách tiếp cận qua khứu giác gần giống như đưa một số khái niệm cơ bản, nguyên thủy vào mô hình, giống như sự hiểu biết chung về thế giới dường như được gắn chặt vào bộ não của chúng ta. Sau đó, bản thân cấu trúc có khả năng thực hiện một số nhiệm vụ đơn giản, bẩm sinh mà không cần hướng dẫn.

Một trong những lĩnh vực ứng dụng trong tương lai của hệ AI nhận biết mùi là ngành công nghiệp thực phẩm. Nguồn: insights.figlobal.com

Cùng với Stevens và Sanjoy Dasgupta, nhà khoa học máy tính tại Đại học California, San Diego, Navlakha lấy cảm hứng từ khứu giác để thực hiện tìm kiếm trên cơ sở sự giống nhau. Họ nhận thấy các sinh vật phải có khả năng so sánh nhanh chóng, chính xác khi xác định mùi. Một con ruồi có thể sớm biết rằng nó nên tiếp cận mùi chuối chín và tránh mùi giấm, nhưng trong một môi trường rất phức tạp và đầy tiếng ồn thì nó sẽ không bao giờ ngửi đúng mùi đó. Do vậy khi phát hiện ra một mùi mới, ruồi sẽ tìm ra mùi nào mà nó đã trải qua trong quá khứ giống nhất với mùi mới đó, và nhớ lại hành vi thích hợp để áp dụng. Navlakha áp dụng thuật toán này lại cho các bộ dữ liệu hình ảnh. Ông và nhóm nhận thấy rằng thuật toán của họ hoạt động tốt hơn, đôi khi gấp hai đến ba lần, các phương pháp phi sinh học truyền thống chỉ liên quan đến việc giảm chiều (Trong các kỹ thuật giảm chiều này các đối tượng được so sánh dựa trên một số nhỏ chiều quan trọng nhất). Phương pháp tiếp cận dựa trên ruồi cũng “sử dụng ít phép tính hơn để có được mức độ chính xác tương tự,” Navlakha nói. Vì vậy, nó đã thắng về chi phí hoặc về hiệu suất.

Nhóm Nowotny cũng nghiên cứu cách hệ thống khứu giác xử lý các hỗn hợp. Ông đã phát hiện ra, các mùi có thể tách rời không được cảm nhận cùng một lúc; thay vào đó, mùi cà phê và bánh sừng bò được xử lý độc lập, xen kẽ và rất nhanh. Cách nhìn sâu sắc đó có thể hữu ích cho trí tuệ nhân tạo, ví dụ bài toán tách nhiều cuộc hội thoại trong một khung cảnh ồn ào. Với một số loa trong phòng, AI có thể giải quyết vấn đề này bằng cách cắt tín hiệu âm thanh thành các cửa sổ thời gian rất nhỏ. Nếu hệ thống nhận ra âm thanh phát ra từ một loa, hệ thống có thể cố gắng triệt tiêu đầu vào từ các loa khác. Bằng cách xen kẽ như vậy, mạng neuron có thể tách rời các cuộc hội thoại.

Thế giới côn trùng máy

Trong một bài báo trên arxiv.org, Delahunt và đồng nghiệp tại Đại học Washington, J. Nathan Kutz, đã tiến thêm một bước bằng cách tạo ra cái mà họ gọi là “người máy côn trùng”. Họ đã sử dụng kết quả đầu ra của mô hình dựa trên bướm đêm làm đầu vào của thuật toán máy học và nhận thấy những cải tiến về khả năng phân loại hình ảnh của hệ thống. Delahunt cho biết: “Nó cung cấp cho thuật toán máy học nhiều công cụ mạnh mẽ hơn. “Một số loại mô hình khác đang được tìm ra từ phân tích bộ não bướm đêm sẽ giúp ích cho máy học”.

Cách tiếp cận qua khứu giác gần giống như đưa một số khái niệm cơ bản, nguyên thủy vào mô hình, giống như sự hiểu biết chung về thế giới dường như được gắn chặt vào bộ não của chúng ta.

Trong một bài báo xuất bản trên Science Advances, nhóm nghiên cứu do Tatyana Sharpee của Viện Salk dẫn dắt đã tìm cách mô tả mùi. Các hình ảnh ít nhiều giống nhau tùy thuộc vào khoảng cách giữa các pixel của chúng trong một loại “không gian trực quan”. Nhưng loại khoảng cách đó không áp dụng cho khứu giác. Các mối tương quan về cấu trúc cũng không thể đem lại một phương hướng đáng tin cậy: Các mùi có cấu trúc hóa học tương tự nhau có thể được coi là rất khác nhau và các mùi có cấu trúc hóa học rất khác nhau có thể được coi là tương tự nhau. Thay vào đó, Sharpee và đồng nghiệp đã xác định các phân tử mùi theo tần suất chúng được tìm thấy cùng nhau trong tự nhiên, sau đó tạo ra một bản đồ bằng cách đặt các phân tử mùi gần nhau hơn nếu chúng có xu hướng cùng xuất hiện và xa hơn nếu chúng hiếm khi như vậy. Họ phát hiện ra, giống như các thành phố ánh xạ lên một hình cầu (Trái đất), các phân tử mùi ánh xạ lên một không gian hyperbol, một hình cầu có độ cong âm trông giống như một chiếc yên ngựa. Sharpee suy đoán, việc cung cấp đầu vào có cấu trúc hyperbol vào các thuật toán máy học có thể giúp phân loại các đối tượng ít cấu trúc hơn. Có lẽ một cấu trúc như vậy có thể tối ưu hóa hơn nữa các hệ thống học sâu.

Mẫu số chung

Điều khiến các nhà nghiên cứu hy vọng là sự tương đồng đáng kinh ngạc trong cấu trúc của hệ thống khứu giác với các vùng khác của não ở nhiều loài, đặc biệt là vùng hồi hải mã, liên quan đến trí nhớ và điều hướng, và tiểu não chịu trách nhiệm kiểm soát vận động. Khứu giác là một hệ thống cổ xưa có từ quá trình hóa cảm ở vi khuẩn và được tất cả các sinh vật sử dụng dưới một hình thức nào đó để khám phá môi trường của chúng.

Marblestone cho biết: “Có vẻ như nó gần với nguồn gốc tiến hóa của tất cả những thứ mà chúng ta gọi là vỏ não nói chung. Khứu giác có thể cung cấp một mẫu số chung cho việc học. Ashok Litwin-Kumar, một nhà thần kinh học tại Columbia cho biết: “Hệ thống này cung cấp cho chúng tôi một kiến trúc thực sự được bảo tồn, một kiến trúc được sử dụng cho nhiều thứ khác nhau trên nhiều loại sinh vật. “Có một cái gì đó cơ bản rất đáng khám phá”.

Mạng khứu giác có thể là cánh cổng để hiểu rõ hơn các tính toán và quá trình học tập phức tạp của vùng hồi hải mã và tiểu não — và để tìm ra cách áp dụng những hiểu biết đó vào AI. Các nhà nghiên cứu đã bắt đầu chuyển sang các quá trình nhận thức như sự chú ý và ghi nhớ với hy vọng có thể tìm được cách cải thiện cơ chế và kiến trúc máy học hiện tại. Khứu giác có thể đưa ra một cách đơn giản hơn để bắt đầu tạo ra những kết nối đó. “Đó là một điểm kết nối thú vị,” Marblestone nói. “Một điểm khởi đầu để suy nghĩ về mạng lưới thần kinh thế hệ tiếp theo”.□

Nguyễn Quang dịch

Nguồn: https://www.quantamagazine.org/new-ai-strategy-mimics-how-brains-learn-to-smell-20180918/

Tác giả

(Visited 8 times, 1 visits today)