Không thể hiểu được AI
Trong suốt chiều dài lịch sử phát triển của mạng nơ-ron - cốt lõi của công nghệ AI tân tiến nhất hiện nay, không một ai, kể cả cha đẻ của nó có thể hiểu được hệ thống này một cách đầy đủ.
Ngoài 20 tuổi, nhà toán học kiêm sinh học lý thuyết Jack D. Cowan đến thăm Wilfred Taylor và thấy một “cỗ máy biết học” kì lạ. Anh bị choáng ngợp bởi “đống thiết bị khổng lồ” này. Cowan chỉ biết đứng trân trân quan sát – cỗ máy đang làm một “sơ đồ bộ nhớ liên kết” – có vẻ là nó có thể học để tìm ra các mối liên kết và trích xuất từ dữ liệu.
Trông nó có thể giống như nhiều khối mạch điện cồng kềnh được ráp nối thủ công bằng những búi dây điện và hộp, nhưng những gì Cowan chứng kiến chính là một dạng analog của mạng nơ-ron – tiền thân của những mô hình trí tuệ nhân tạo tiên tiến nhất hiện nay, bao gồm cả ứng dụng ChatGPT đang được nói đến khắp nơi bởi khả năng trả lời mọi câu hỏi đối thoại. Bên trong công nghệ ChatGPT chính là một mạng neuron.
Thuật ngữ mạng nơ-ron bao gồm nhiều hệ thống đa dạng nhưng tựu trung lại, theo IBM, các “mạng nơ-ron – hay còn được gọi là mạng nơ-ron nhân tạo (“artificial neural networks” – ANN) hoặc mạng nơ-ron mô phỏng (“simulated neural networks” – SNN) – là một khía cạnh của học máy và cốt lõi của các thuật toán học sâu”. Điều quan trọng là “từ tên gọi cho đến cấu trúc của mạng nơ-ron đã được lấy cảm hứng từ bộ não con người, bắt chước cách các tế bào thần kinh sinh học truyền tín hiệu cho nhau”.
Ở thời kì đầu, người ta đã nghi ngờ về giá trị của các mạng nơ-ron này, nhưng theo thời gian, trào lưu AI đã mạnh mẽ đón nhận nó. Mạng nơ-ron giờ được hiểu là tương lai của AI. Chúng sẽ đem đến những tác động to lớn đến con người và ý nghĩa của việc làm người. Gần đây ta có thể thấy rộ lên những mối lo ngại như vậy cùng lời kêu gọi tạm dừng các phát triển AI mới trong khoảng thời gian sáu tháng để rà soát lại những tác động của chúng.
Có gì đó khác biệt nằm sâu trong bản thân mục đích và thiết kế của các mạng nơ-ron. Từ xưa đến nay, chúng luôn theo đuổi những gì không thể giải thích được. Hệ thống càng trừu tượng thì người ta càng nghĩ nó độc đáo và tiên tiến.
Chắc chắn sẽ là một sai lầm nếu coi mạng nơ-ron chỉ là thứ đồ công nghệ bóng bẩy và bắt mắt. Thực chất thì chúng đã bắt rễ vào đời sống của chúng ta. Từ năm 1989, một nhóm nghiên cứu do Yann LeCun dẫn đầu tại Phòng thí nghiệm AT&T Bell đã sử dụng các kỹ thuật lan truyền ngược để đào tạo một hệ thống nhận diện chữ viết tay mã bưu điện. Microsoft gần đây thông báo rằng các tìm kiếm trên Bing sẽ được AI hỗ trợ, như là người đồng hành lướt web của bạn. Nó sẽ cho ta thấy những gì ta phát kiến và hiểu ra chẳng qua chỉ là sản phẩm của máy móc.
Các mô hình AI được huấn luyện để tìm hình mẫu trên dữ liệu khổng lồ có thể làm các công việc như nhận dạng hình ảnh nhanh chóng – khiến chúng được ứng dụng để nhận dạng khuôn mặt, chẳng hạn. Mạng nơ-ron cũng đang thay đổi cách chúng ta dịch thuật và giao tiếp. Ví dụ sản phẩm “Google Translate” phát triển bởi nhóm có tên thú vị là “Google Brain” là một ứng dụng nổi bật khác của mạng nơ-ron.
Bạn chắc cũng không muốn đấu cờ Vua hay cờ vây với mạng nơ-ron. Khả năng thuộc các quy tắc và tổng hợp chiến thuật cũng như ghi nhớ từng đường đi nước bước khiến chúng đặc biệt xuất sắc trong những trò chơi. Cũng chính những hệ thống dựa trên mạng nơ-ron đã hạ gục những kì thủ cờ vây và cờ vua ngoài đời thực.
Nhưng mạng nơ-ron còn có thể ảnh hưởng vượt xa những ví dụ trên. Nếu tìm kiếm các bằng sáng chế bởi từ khóa “mạng nơ-ron” sẽ cho ra 135.828 kết quả. Với tốc độ bành trướng nhanh chóng và liên tục thì chúng ta hầu như không còn cơ hội nào để hiểu được ảnh hưởng của AI nữa.
Những lớp bí ẩn của sự “không thể giải thích”
Nhìn lại lịch sử của mạng nơ-ron sẽ cho chúng ta thấy vài điều quan trọng trong những quyết định tự động hóa đang định hình hiện tại của chúng ta và có thể sẽ còn ảnh hưởng sâu sắc hơn trong tương lai của loài người. Càng ngày, chúng ta sẽ càng khó nắm bắt những quyết định và ảnh hưởng của AI. Mạng nơ-ron không chỉ là những hộp đen, cũng không chỉ là những phần tử ẩn giấu của một hệ thống lớn hơn mà ta không thể thấy hoặc hiểu được.
Có gì đó khác biệt nằm sâu trong bản thân mục đích và thiết kế của các mạng nơ-ron. Từ xưa đến nay, chúng luôn theo đuổi những gì không thể giải thích được. Hệ thống càng trừu tượng thì người ta càng nghĩ nó độc đáo và tiên tiến. Lí do không phải chỉ vì những hệ thống đó ngày càng phức tạp hay vì quyền sở hữu trí tuệ hạn chế người ngoài tiếp cận. Thay vào đó, động cơ thúc đẩy sự phát triển của các mạng thần kinh này ẩn chứa mối quan tâm đặc biệt và sâu sắc tới “sự bất khả tri”. Sự bí ẩn này thậm chí được mã hóa trong mọi hình thức và diễn ngôn về mạng nơ-ron. Sâu bên trong các mạng nơ-ron gồm chồng chất nhiều lớp – từ đó mà có cụm từ học sâu – và giữa các lớp đó là những “lớp ẩn” thậm chí còn khó giải thích hơn.
Trí tuệ nhân tạo càng ảnh hưởng tới cuộc sống của chúng ta, chúng ta càng khó hiểu tại sao và thế nào lại như vậy. Ngày nay người ta càng vận động cho những hệ thống AI có thể được giải thích rõ ràng. EU rất lo ngại về các ứng dụng chứa đựng những “rủi ro không thể chấp nhận” và thậm chí là “nguy hiểm”. Họ đang thúc đẩy Đạo luật AI mới nhằm thiết lập một “tiêu chuẩn toàn cầu” cho việc phát triển hệ thống trí tuệ nhân tạo an toàn, tin cậy và hợp đạo đức”.
Những luật mới dựa trên nhu cầu được biết rõ, đòi hỏi “đối với các hệ thống AI có rủi ro cao thì việc chứng minh được dữ liệu huấn luyện có chất lượng tốt, được ghi chép đầy đủ và có khả năng truy xuất nguồn gốc, có tính minh bạch, có sự tham gia giám sát của con người, có độ chính xác và tính ổn định cao, là điều kiện nghiêm ngặt để giảm thiểu những rủi ro tới quyền và an toàn cơ bản của con người do AI gây ra.”. Nó không chỉ là câu chuyện giống ô tô tự lái (cũng là một dạng AI được EU xếp hạng rủi ro cao), mà còn có nỗi lo lắng rằng những hệ thống này sẽ phát triển quá nhanh và xâm phạm đến nhân quyền.
Luật này là một phần của phong trào lớn hơn vận động cho sự minh bạch của AI, cho phép hoạt động của nó có thể kiểm tra, kiểm toán và đánh giá được. Một ví dụ khác là bản chính sách của Hiệp hội Hoàng gia Anh về một hệ thống AI rõ ràng, trong đó họ chỉ ra “các tranh luận chính sách khắp thế giới ngày càng vận động cho các hình thức hệ thống AI có thể giải thích được, một phần của nỗ lực đưa các nguyên tắc đạo đức vào việc thiết kế và vận hành các hệ thống sử dụng AI”.
Thế nhưng câu chuyện về mạng nơ-ron lại cho chúng ta thấy khả năng cao là trong tương lai, chúng ta đang dần đi xa khỏi các mục tiêu đó.
Lấy cảm hứng từ bộ não con người
Mạng nơ-ron có thể là một hệ thống phức tạp nhưng có thể tựu trung lại các nguyên tắc cốt lõi. Lấy cảm hứng từ bộ não con người, chúng hướng đến việc sao chép hoặc mô phỏng các dạng suy nghĩ sinh học và tư duy của con người. Về cấu trúc và thiết kế, như IBM giải thích, chúng bao gồm “các lớp nút mạng (node): gồm một lớp đầu vào, một hoặc nhiều lớp ẩn và một lớp đầu ra”. Trong đó, “mỗi node, hay còn gọi là một nơ-ron nhân tạo, sẽ kết nối với các node khác”. Các node này đòi hỏi yêu cầu đầu vào và thông tin để có thể tạo ra các dự báo ở đầu ra, vì vậy, “dựa vào các dữ liệu huấn luyện để học và tăng cường độ chính xác qua thời gian”.
Trong một cuộc phỏng vấn năm 1993, nhà khoa học mạng nơ-ron Teuvo Kohonen đã kết luận, ông mong muốn có một hệ thống có thể “tự tổ chức”, hoạt động giống như “hệ thần kinh của con người làm việc một cách bản năng”. Để lấy một ví dụ, Kohonen hình dung ra một hệ thống “tự tổ chức” – một hệ thống tự quản lý và giám sát, “có thể sử dụng để điều khiển bất cứ máy móc nào, kể cả máy bay, máy bay phản lực, hay tất cả các nhà máy điện ạt nhân hoặc tất cả mọi loại xe ô tô”.
Tham vọng lớn là có một hệ thống có khả năng thích nghi với môi trường xung quanh. Nó sẽ tự chủ, phản ứng tức thời giống như hệ thần kinh. Đó là giấc mơ về những hệ thống có thể tự hành mà hầu như không cần sự can thiệp của con người. Sự phức tạp và bí ẩn của bộ não, của hệ thần kinh con người và thế giới thực sẽ sớm cho ta biết sự phát triển và cách thức thiết kế của mạng nơ-ron máy tính.
`Có gì đó đáng ngờ về nó’
Quay trở lại năm 1956 và cỗ máy tự học kỳ lạ đó, chính cách tiếp cận “học qua hành” của Taylor khi xây dựng chiếc máy đã ngay lập tức thu hút sự chú ý của Cowan. Cowan nhận thấy Taylor, qua cuộc phỏng vấn về hệ thống của mình, “không hề chế tạo cỗ máy dựa trên lý thuyết nào, cũng chẳng mô phỏng gì trên máy tính”. Thay vào đó, với các công cụ trong tay, Taylor “thực sự tạo ra thiết bị đó hoàn toàn thủ công”. Đó chỉ là một khối vật chất, tạo ra bằng sự kết hợp hay thậm chí là đối chọi giữa các linh kiện với nhau. Và nó “được hoàn thiện ra bởi các mạch điện analog”, tiêu tốn của Taylor “nhiều năm để xây và nghịch nó”. Đó là một dạng thử và sai.
Cũng dễ hiểu là Cowan rất muốn nắm bắt được thứ mà anh đang nhìn thấy. Anh cố nài Taylor giải thích chiếc máy biết học này cho mình. Nhưng chẳng có gì là rõ ràng. Cowan không tài nào khiến Taylor mô tả chiếc máy này thực sự hoạt động thế nào. Những nơ-ron analog này vẫn cứ là một bí ẩn. Vấn đề đáng ngạc nhiên hơn, Cowan nghĩ, là chính Taylor “cũng không thực sự hiểu điều gì đang diễn ra”. Nó không chỉ là một khoảng lặng trong giao tiếp giữa hai nhà khoa học ở hai lĩnh vực khác nhau, mà còn hơn thế.
Khi nghĩ lại về cỗ máy của Taylor nhiều chục năm sau, Cowan đã tiết lộ rằng “thậm chí đến bây giờ với vô vàn công bố về mạng nơ-ron, người ta vẫn chưa thể hiểu rõ về cách thức hoạt động của nó”. Kết luận này cho thấy sự “bất khả tri” ẩn sâu trong các mạng nơ-ron như thế nào. Tính không thể giải thích được của các mạng nơ-ron này đã xuất hiện ngay từ giai đoạn đầu và đã tồn tại suốt gần bảy thập kỷ.
Điều bí ẩn này vẫn còn cho đến ngày nay và tồn tại ở cả những mô hình AI tiên tiến nhất. Sự “không thể hiểu được cách hoạt động” của các phiên bản khác của cỗ máy Taylor khiến Cowan tự hỏi liệu có “điều gì đó đáng ngờ về mạng nơ-ron”.
Lần ra manh mối
Cowan nhớ lại vào những năm 1960, người ta có vẻ “chậm nhận ra mục đích của mạng nơ-ron analog”. Chuyên gia về mạng nơ-ron từng đoạt giải Nobel Leon N. Cooper cho rằng những nghiên cứu về những ứng dụng xung quanh mô hình não bộ vào những năm 1960 được cho là một trong những “bí ẩn không thể giải thích được”. Sự bất định này đã khiến người ta hoài nghi về khả năng mạng nơ-ron có thể làm được gì. Nhưng mọi thứ bắt đầu dần thay đổi.
Khoảng 30 năm trước, nhà thần kinh học Walter J. Freeman đã rất ngạc nhiên trước mức độ ứng dụng đáng kinh ngạc mà người ta phát hiện ra của mạng nơ-ron, cho rằng thực chất thì ông không coi chúng là “một loại máy móc với nguyên lý mới”. Thật vậy, để tìm ra gốc rễ của công nghệ mạng nơ-ron chúng ta cần phải quay ngược lại xa hơn chuyến thăm của Cowan tới cỗ máy bí ẩn của Taylor.
Nhà khoa học mạng nơ-ron James Anderson và nhà báo khoa học Edward Rosenfeld cho rằng nền tảng của mạng nơ-ron có từ những năm 1940 khi người ta cố gắng “hiểu hệ thống thần kinh của con người và xây dựng hệ thống nhân tạo bắt chước được, ít nhất là một phần giống thế”. Và vì vậy, vào những năm 1940, những bí ẩn của hệ thần kinh của con người cũng chính là bí ẩn của tư duy máy tính và trí tuệ nhân tạo.
Để tóm lại câu chuyện dài này, người chuyên viết về khoa học máy tính Larry Hardesty đã cho rằng công nghệ học sâu dưới hình thức mạng nơ-ron thực chất “đã liên tục nóng lên rồi nguội đi trong suốt 70 năm qua”. Cụ thể hơn, ông nói rằng “những mạng nơ-ron lần đầu được đề xuất vào năm 1944 bởi Warren McCulloch và Walter Pitts. Hai nhà nghiên cứu này đến từ Đại học Chicago, sau đã chuyển đến MIT vào năm 1952 và là các thành viên sáng lập của khoa Khoa học nhận thức đầu tiên ở Mỹ”.
Từ những năm 1960 đến cuối những năm 1970, chúng ta có thêm những câu chuyện về những đặc tính chưa biết của những hệ thống này. Sau ba thập kỷ thì mạng nơ-ron nhân tạo vẫn chưa tìm thấy khả năng ứng dụng nào. David Rumelhart, nhà tâm lý học và đồng tác giả của một loạt sách xuất bản năm 1986 đã thu hút sự chú ý trở lại về mạng nơ-ron, đã cộng tác với đồng nghiệp Jay McClelland để phát triển những mạng nơ-ron.
Sau bài nói chuyện của Rumelhart ở một hội nghị tại Minesota, McClelland đã trở về với ý tưởng phát triển một mạng nơ-ron kết hợp nhiều mô hình để có khả năng tương tác. Và cách Rumelhart làm là “hàng giờ, hàng giờ mày mò với phần cứng máy tính”. Giống như Taylor, Rumelhart cũng “thử và sai”. Họ đã tạo ra những mạng nơ-ron có thể hoạt động nhưng quan trọng là họ cũng không hiểu cách thức, nguyên nhân tại sao nó hoạt động theo cách đó, tức là học hỏi từ dữ liệu và tìm kiếm các mối liên hệ.
Bắt chước bộ não – hết lớp này đến lớp khác
Bộ não con người – cho đến nay vẫn là một trong những bí ẩn khoa học chưa có lời giải thấu đáo – chính là khung thiết kế của các hệ thống sử dụng mạng nơ-ron.
Năm 1998, James Anderson, người đã từng làm việc một thời gian trên mạng lưới thần kinh nói rằng khi nghiên cứu về bộ não thì “khám phá chính của chúng tôi là chúng tôi thực sự không hiểu chuyện gì đang xảy ra trong bộ não”.
Trong một bài tường thuật chi tiết trên Financial Times năm 2018, nhà báo công nghệ Richard Waters viết các mạng nơ-ron “được mô hình hóa dựa trên một lý thuyết về cách thức hoạt động của bộ não con người, truyền dữ liệu qua các lớp tế bào thần kinh nhân tạo cho đến khi nó nhận ra một hình mẫu nào đó”. Điều này tạo ra một suy nghĩ thú vị, Waters cho biết, vì “không giống như các mạch logic được sử dụng trong chương trình phần mềm truyền thống, không có cách nào theo dõi quá trình này để xác định chính xác lý do tại sao máy tính đưa ra một câu trả lời cụ thể”. Walter kết luận, không thể truy nguyên những kết quả mà mạng nơ-ron trả về. Việc áp dụng loại mô hình dựa trên bộ não lấy dữ liệu qua nhiều lớp, có nghĩa là câu trả lời của lớp cuối cùng không thể dễ dàng truy ngược lại các lớp trước. Cấu trúc nhiều lớp chính là nguyên nhân của vấn đề này.
Hardesty nhận thấy các hệ thống này mới chỉ “mô phỏng một cách lỏng lẻo bộ não con người”. Có nghĩa là còn có thể xây dựng những hệ thống xử lý phức tạp gần giống hơn với bộ não. Và kết quả là ngày nay người ta đã xây dựng các mạng nơ-ron “có hàng nghìn hoặc thậm chí hàng triệu node xử lý các tác vụ đơn giản kết nối với nhau dày đặc”. Dữ liệu di chuyển qua các node này chỉ theo một hướng. Hardesty quan sát thấy rằng “một node riêng lẻ có thể được kết nối và nhận dữ liệu từ rất nhiều node ở trước nó, rồi gửi dữ liệu tới một số mode ở lớp sau nó”.
Lớp ẩn
Khi các lớp dày lên, học sâu sẽ tạo ra những độ sâu mới. Hardesty giải thích rằng người ta huấn luyện mạng nơ-ron bằng dữ liệu “truyền dữ liệu ở lớp đáy – lớp đầu vào – và sau đó đi qua các lớp sau, rồi được nhân lên, cộng lại theo những cách phức tạp, cho đến khi nó đi tới lớp cuối cùng. Dữ liệu đã được biến đổi hoàn toàn ở lớp đầu ra này”. Càng nhiều lớp, sự biến đổi càng lớn và sự khác biệt giữa đầu vào và đầu ra càng lớn. Sự phát triển của Bộ xử lý đồ họa (GPU), Hardesty nói thêm, “đã đưa mạng nơ-ron một lớp của những năm 1960 và mạng nơ-ron hai đến ba lớp của những năm 1980 bùng nổ thành mạng 10, 15 và thậm chí 50 lớp ngày hôm nay”.
Mạng nơ-ron ngày càng sâu hơn. Thật vậy, theo Hardesty, chính việc thêm các lớp này là “sự “sâu” mà “học sâu” nói đến”. Đây là điều đáng kể, ông đề xuất, bởi vì “hiện tại học sâu đang là nền tảng của các hệ thống máy tính AI tốt nhất trong hầu hết mọi lĩnh vực nghiên cứu trí tuệ nhân tạo”.
Nhưng bí ẩn cũng sâu hơn. Khi các lớp của mạng thần kinh ngày càng chồng chất thì độ phức tạp của chúng cũng tăng lên. Nó cũng dẫn đến sự phát triển của cái được gọi là “các lớp ẩn” giữa những độ sâu này. Cuộc thảo luận về số lớp ẩn tối ưu trong mạng thần kinh đang diễn ra. Nhà lý thuyết truyền thông Beatrice Fazi đã viết rằng “vì một mạng nơ-ron hoạt động dựa trên những lớp nơ-ron ẩn kẹp giữa lớp nơ-ron đầu tiên (lớp đầu vào) và lớp cuối cùng (lớp đầu ra), kĩ thuật học sâu thường trừu tượng và mơ hồ kể cả với những lập trình viên đầu tiên xây dựng nó”.
Nhà tư tưởng truyền thông mới liên ngành mới nổi Katherine Hayles đưa ra quan điểm tương tự: đang có những giới hạn về “mức độ chúng ta có thể biết về hệ thống, một hệ quả do các ‘lớp ẩn’ trong mạng lưới thần kinh và các thuật toán học sâu”.
Theo đuổi điều bất khả tri
Tóm lại, quá trình phát triển lâu dài của mạng noron là một phần của cái mà nhà xã hội học công nghệ Taina Bucher gọi là “sự nhức nhối của sự bất khả tri”. Harry Collins – nhà xã hội học người Anh, tác giả cuốn sách: Trí tuệ nhân tạo: Con người không thể đầu hàng máy móc, đã chỉ ra rằng mục tiêu của mạng nơ-ron là dù chúng có thể cần con người khởi tạo ban đầu, nhưng “một khi chương trình được viết ra, nó sẽ sống cuộc sống của chính nó, tự chủ; nhưng nếu không có một nỗ lực tìm hiểu khủng khiếp, cách mạng noron hoạt động chính xác như thế nào sẽ vẫn mãi là một bí ẩn”.
Dĩ nhiên điều đó sẽ có nhiều người cảm thấy không thoải mái. Chúng ta muốn biết AI hoạt động như thế nào, do đâu mà nó đưa ra những quyết định và những kết quả ảnh hưởng đến chúng ta như vậy. Khi sự phát triển của AI tiếp tục định hình kiến thức và hiểu biết của chúng ta về thế giới, định hình những phát hiện của chúng ta, cách chúng ta bị đối xử, cách chúng ta học hỏi, tiêu thụ và tương tác với nhau, thì chúng ta càng khao khát muốn biết điều gì đằng sau hệ thống đó. Tuy nhiên, khi nói về việc tạo ra một hệ thống AI rõ ràng và minh bạch, câu chuyện lịch sử về mạng nơ-ron cho chúng ta thấy rằng, loài người sẽ càng rời xa mục tiêu đó trong tương lai hơn là tiến gần hơn đến nó.□
Nguyễn Quang lược dịch
Nguồn: https://theconversation.com/ai-will-soon-become-impossible-for-humans-to-comprehend-the-story-of-neural-networks-tells-us-why-199456