TiaSang
Thứ 4, Ngày 18 tháng 9 năm 2019
Đổi mới sáng tạo

Sự hội ngộ của máy học và vật lý lượng tử

24/05/2019 07:30 -

Cuộc giao duyên giữa máy học và vật lý lượng tử có thể tạo ra một hướng nghiên cứu mới làm thay đổi cả hai lĩnh vực khoa học này.


Máy học sẽ góp phần giải quyết một số vấn đề của vật lý lượng tử. Nguồn: Symmetrymagazine

Máy học (machine learning) là một lĩnh vực của khoa học máy tính nhằm tìm cách làm cho các máy tính có khả năng học để khai thác thông tin có ý nghĩa và đưa ra dự đoán về dữ liệu. Nó là cốt lõi của trí tuệ nhân tạo dẫn đến thành công trên nhiều bình diện của công nghệ hiện đại, từ nhận diện khuôn mặt và xử lý ngôn ngữ tự nhiên đến xe tự lái.

Lĩnh vực này đang phát triển nhanh và các ứng dụng của nó đã trở nên phổ biến. Trình dịch trực tuyến trên mạng (Google Translate’s online service) sử dụng kỹ thuật máy học để chuyển các ký tự tiếng Trung thành văn bản tiếng Anh mà không cần sự can thiệp của con người. Gần đây, các kỹ thuật máy học đã được vận dụng để xây dựng AlphaGo, một robot đã thắng những người chơi giỏi nhất thế giới về cờ vây, một trò chơi cổ xưa. Việc làm chủ trò chơi này được coi là thành tựu cao nhất của trí tuệ nhân tạo. Trước khi AlphaGo chứng tỏ sức mạnh của mình, cờ vây được cho là quá phức tạp để máy có thể thắng người vì số lượng các bước đi khả dĩ là cực kỳ lớn.

Một trong những vấn đề lớn nhất đối với máy học là thứ nguyên - nói chung, số lượng tập dữ liệu cần thiết để huấn luyện cho máy học cách tìm hiểu thông tin mong muốn tăng như hàm mũ theo thứ nguyên d. Nếu một tập dữ liệu có thứ nguyên d > 1, nó sẽ nhanh chóng trở nên không thể quản lý được. Sự phức tạp đó giống như trong cơ học lượng tử, khi việc mô tả đầy đủ trạng thái lượng tử của một hệ nhiều hạt cũng đòi hỏi một lượng thông tin tăng theo hàm mũ đối với số hạt.

Mặc dù rất phức tạp, lý thuyết lượng tử được cho là lý thuyết định lượng thành công nhất của tự nhiên. Nó không chỉ cung cấp cơ sở để hiểu vật lý ở mọi quy mô về độ dài, từ các hạt cơ bản nhỏ bé như điện tử và quark đến các vật thể khổng lồ như sao và thiên hà, mà còn tạo nên nền tảng cho các công nghệ hiện đại, từ laser và bóng bán dẫn đến cộng hưởng từ hạt nhân và thậm chí cả máy tính lượng tử. Với những thành công to lớn trong cả hai lĩnh vực, máy học và vật lý lượng tử, người ta có thể hỏi: Liệu hai lĩnh vực có vẻ như rất khác nhau nhưng lại có mối liên quan mật thiết với nhau như này có thể đồng hiệp một cách liền mạch được không?

Nghe có vẻ giống như khoa học viễn tưởng, nhưng sự đồng hiệp đó đang xảy ra ngay lúc này và có thể dẫn đến những đột phá không thể tưởng tượng được trong cả hai lĩnh vực. Máy học đã tiến bộ đáng kể trong hai thập niên qua, và nhiều vấn đề cực kỳ thách thức hoặc thậm chí không thể tiếp cận với máy học tự động giờ đã được giải quyết. Những thành công đó tạo ra những khả năng mới cho máy học nhằm giải quyết các vấn đề mở trong vật lý lượng tử.

Hiện nay ý tưởng xử lý thông tin lượng tử đã cách mạng hóa lý thuyết và cách thức tính toán. Các thuật toán lượng tử mới có thể mang lại triển vọng lớn để tăng cường khả năng của chính máy học. Không còn nghi ngờ gì nữa, sự tương tác giữa máy học và vật lý lượng tử sẽ mang lại lợi ích cho cả hai lĩnh vực.

Khám phá các pha của vật chất

Khi áp dụng máy học vào các vấn đề vật lý, một chiến lược đơn giản là sử dụng phương pháp học có giám sát. Một thuật toán huấn luyện với các dữ liệu đã được dán nhãn trước; Mục tiêu của thuật toán là lấy thông tin đó và thiết lập một quy tắc chung để gán nhãn cho những dữ liệu ngoài tập dữ liệu đã được dùng trong huấn luyện. Ví dụ, trong việc xác định hình ảnh của chó và mèo, thuật toán có giám sát sẽ lấy hàng ngàn hình ảnh đã được dán nhãn là “chó” hoặc “mèo” và xác định mối quan hệ giữa các giá trị pixel của hình ảnh và nhãn của chúng. Sau đó, máy sẽ gán nhãn thích hợp cho hình ảnh mà nó chưa từng thấy trước đây.

Kỹ thuật học có giám sát như vừa nói ở trên có thể được sử dụng để xác định các pha khác nhau của vật chất và sự chuyển pha giữa chúng, một trong những vấn đề trung tâm của vật lý các chất ngưng tụ. Juan Carrasquilla và Roger Melko là những người đầu tiên khám phá ý tưởng đó trong nghiên cứu của họ về mô hình sắt từ Ising, với các spin nguyên tử rời rạc được sắp xếp trên một mạng lưới. Các spin thể hiện pha thuận từ không có trật tự ở nhiệt độ cao và pha sắt từ có trật tự ở nhiệt độ thấp, và sự chuyển pha giữa hai pha đó xảy ra ở nhiệt độ tới hạn Tc nào đó. 

Thay vì phân loại chó và mèo, Carrasquilla và Melko đã sử dụng các cấu hình spin cân bằng được mẫu hóa bằng mô phỏng Monte Carlo để huấn luyện cho máy thuật toán nhận diện các trạng thái thuận từ và sắt từ. Họ đã cho thấy rằng sau khi huấn luyện với các mẫu đã được dán nhãn, thuật toán có thể gán nhãn chính xác cho các mẫu mới. Hơn thế, bằng cách quét một khoảng nhiệt độ, máy đã xác định được vị trí của  Tc và tìm được các số mũ tới hạn, những thông số rất quan trọng trong các nghiên cứu về sự chuyển pha.


Hình 1. Hai biểu diễn

Trạng thái lượng tử của một hệ N qubit có dạng tổng quát như sau:

=∑ΞΦ(Ξ)||Ξ=∑ΞΦ(Ξ)|Ξ trong đó |Ξ=(σ1,σ2,…,σN) biểu thị một cấu hình khả dĩ của N qubit còn Φ(Ξ) là một hàm phức xác định biên độ và pha của trạng thái. Có thể hiểu trạng thái lượng tử là một hộp đen tính toán mà với một |Ξ đã cho sẽ trả về một số phức Φ(Ξ), là hệ số của thành phần |Ξ của trạng thái. Biểu diễn mạng-tenxơ sử dụng các tenxơ để biểu diễn các trạng thái lượng tử. Hạng của tenxơ biểu thị thứ nguyên của nó (hoặc số chỉ số mà nó có), do đó, tenxơ hạng 1 là vectơ, tenxơ hạng 2 là ma trận, v.v. Để đơn giản, xét một hệ 1 chiều với N qubit, như hiển thị trên Hình 1a, được biết đến như biểu diễn trạng thái tích ma trận (Matrix Product State - MPS). Mỗi qubit ứng với một tenxơ Aijk, là tenxơ hạng 3. Các tenxơ tạo thành một mạng trong đó các kết nối biểu diễn các chỉ số của các tenxơ. Nếu hai tenxơ được kết nối, thì chỉ số chung của chúng bị rút lại bằng cách tính tổng tất cả các giá trị có thể có của chỉ số lặp. Trong trường hợp hệ 1 chiều, hai trong số các chỉ số của mỗi tenxơ được kết nối với các tenxơ lân cận và bị rút lại thành tenxơ hạng 1, biểu diễn bậc tự do vật lý. Trạng thái lượng tử do đó sẽ có dạng

                                    

Biểu diễn máy Boltzmann hạn chế (restricted Boltzmann machine) là một mạng nơron có hai lớp. Một lớp với N nơron khả kiến ứng với các qubit vật lý và một lớp có M nơron ẩn. Các nơron trong hai lớp khác nhau có thể được kết nối, nhưng các nơron trong cùng một lớp thì không (Xem Hình 1b). Trạng thái lượng tử được cho dưới dạng 

                                           

trong đó {h} chỉ các cấu hình khả dĩ của nơron ẩn h1,h2, …, hM, Wjk là độ mạnh của tương tác giữa nơron khả kiến và nơron ẩn, còn aj và bk  là tham số của nơron khả kiến và nơron ẩn.

Máy học có giám sát đòi hỏi người dùng phải biết trước cách phân loại dữ liệu. Còn máy học không có giám sát thì sử dụng dữ liệu không có nhãn và cho phép mạng tìm thấy các mẫu và cấu trúc có ý nghĩa trong đó. Một ví dụ phổ biến về máy học không có giám sát là phân cụm, trong đó dữ liệu dùng để học được chia thành nhiều nhóm dựa trên sự tương đồng đã được xác định và các nhóm đó được sử dụng để phân loại các dữ liệu mới, chưa từng thấy trước đây. Vào năm 2016, Lei Wang đã áp dụng cách phân cụm như thế cho mô hình Ising và xác định thành công các pha thuận từ và sắt từ cũng như quá trình chuyển pha giữa chúng, mặc dù không đưa ra các tiêu chí sắp xếp rõ ràng của thuật toán. Cũng vào thời gian đó, Evert van Nieuwenburg và đồng nghiệp đã đề xuất một sơ đồ kết hợp cả học có giám sát và không có giám sát. Họ đã thử phương pháp của họ trên một số mô hình, kể cả mô hình Ising, và chứng tỏ được rằng các pha khác nhau và sự chuyển pha có thể xác định được.

Biểu diễn mạng nơron

Song song với sự phát triển nhanh chóng của các thuật toán cho máy học nhằm xác định các pha của vật chất, việc sử dụng các mạng thần kinh nhân tạo, sau đây gọi là mạng nơron, để biểu diễn các trạng thái lượng tử và giải các bài toán nhiều hạt lượng tử liên quan cũng đã đạt được những tiến bộ khích lệ. 

Trong cơ học lượng tử, mô tả đầy đủ một trạng thái nhiều hạt bất kỳ đòi hỏi một lượng thông tin tăng theo hàm mũ. Xét một hệ có N qubit (là tên gọi tắt của bit lượng tử). Mỗi qubit có hai cấu hình độc lập, 0 hoặc 1; do đó tổng số cấu hình của cả hệ sẽ là 2N. Về mặt tính toán, điều đó có nghĩa là mô tả đầy đủ trạng thái lượng tử tương ứng cần có 2N  số phức.

Độ phức tạp tăng theo hàm mũ là một thách thức lớn cho các mô phỏng số đối với các hệ lượng tử nhiều hạt nếu thực hiện trên máy tính cổ điển – ngay cả việc mô phỏng chỉ vài qubit thôi cũng cần một bộ nhớ cực lớn. Ví dụ, mô phỏng một hệ lượng tử với 30 qubit đòi hỏi hàng chục gigabyte (vào cỡ bộ nhớ lớn nhất cho máy tính để bàn cá nhân); mô phỏng 50 qubit đòi hỏi hàng chục petabyte (nhiều hơn bộ nhớ cho siêu máy tính lớn nhất thế giới hiện nay); và mô phỏng 300 qubit đòi hỏi nhiều byte hơn số lượng nguyên tử trong vũ trụ quan sát được.

May mắn thay, hầu hết các trạng thái vật lý đáng quan tâm, như trạng thái cơ bản của Hamiltonian của hệ nhiều hạt chẳng hạn, thường chỉ chiếm một góc nhỏ của toàn bộ không gian Hilbert của trạng thái lượng tử và vì thế có thể được mô tả với một lượng thông tin rút gọn. Do đó, việc thiết kế các biểu diễn nhỏ gọn (compact) của các trạng thái đó sao cho chỉ giữ lại các đặc tính vật lý thiết yếu của chúng là cần thiết để giải các bài toán lượng tử nhiều hạt bằng các máy tính cổ điển.

Một cách mô phỏng nổi tiếng cho các trạng thái như vậy là biểu diễn mạng tenxơ, trong đó một tenxơ được gán cho mỗi qubit và các tenxơ đó mô tả trạng thái lượng tử nhiều hạt. Cách xây dựng như vậy có thể biểu diễn hầu hết các trạng thái vật lý một cách hiệu quả theo nghĩa là lượng thông tin cần thiết chỉ tăng theo hàm đa thức, thay vì theo hàm mũ, khi kích thước của hệ tăng.


Hình 2 
Biểu diễn máy Boltzmann hạn chế của trạng thái mã toric với thứ tự tôpô nội tại. Mỗi đỉnh 𝓋 hoặc mặt ℱ có bốn nơron khả kiến được kết nối với một nơron ẩn h𝓋 hoặc  hℱ. Việc biểu diễn là hiệu quả vì mỗi kết nối tương ứng với một tham số trong mạng nơron, do đó số lượng các tham số tăng một cách tuyến tính thay vì tăng theo hàm mũ khi kích thước của hệ tăng.

Các mạng nơron, là các mô hình trừu tượng đơn giản hóa bộ não con người, cũng có thể được sử dụng để xây dựng các biểu diễn nhỏ gọn của các trạng thái lượng tử. Giuseppe Carleo và Matthias Troyer lần đầu tiên khai thác ý tưởng để đưa ra một biểu diễn mới dựa trên máy Boltzmann hạn chế, một mạng nơron đặc biệt được sử dụng rộng rãi trong cộng đồng máy học. (Các biểu diễn mạng tenxơ và biểu diễn máy Boltzmann hạn chế được so sánh chi tiết hơn trên Hình 1.) Một biểu diễn máy Boltzmann hạn chế được sắp xếp thành hai lớp nơron, một lớp khả kiến và một lớp ẩn, như minh họa trên Hình 2. Các nơron khả kiến mô tả các qubit vật lý còn các nơron ẩn mô tả các bậc tự do bổ sung phụ trợ cuối cùng bị loại bỏ bởi một phép tính tổng để tạo ra đầu ra của mạng, là một số phức đóng vai trò là hệ số cho cấu hình qubit tương ứng.

Những loại trạng thái lượng tử nhiều hạt nào có thể được mô tả hiệu quả bằng máy Boltzmann hạn chế? Một số trạng thái kỳ lạ, chẳng hạn như trạng thái tôpô, được thể hiện tốt bởi các máy Boltzmann hạn chế. Hình 2 phác thảo biểu diễn máy Boltzmann hạn chế cho trạng thái cơ bản của Hamiltonian mã toric, là một trạng thái tôpô do Alexei Kitaev đưa ra để thực hiện các tính toán lượng tử tôpô. Để biểu thị trạng thái mã toric, mỗi nơron ẩn của máy Boltzmann hạn chế chỉ kết nối với bốn nơron khả kiến gần nhất với nó. Mỗi kết nối được mô tả bởi một tham số mạng, vì vậy tổng số tham số gần gấp bốn lần số lượng qubit, tức là tỷ lệ tuyến tính, thay vì theo hàm mũ, khi kích thước của hệ tăng. Biểu diễn cực kỳ nhỏ gọn như vậy của trạng thái mã toric cũng có thể mô phỏng các trạng thái kích thích.

Ngoài ra còn tồn tại các trạng thái lượng tử không mô phỏng được một cách hiệu quả bởi máy Boltzmann hạn chế. Tuy nhiên, khả năng ứng dụng của máy Boltzmann hạn chế sẽ tăng lên nếu nó bao gồm một lớp ẩn bổ sung. Khi đó mạng nơron, được gọi là máy Boltzmann sâu, có thể biểu diễn hầu hết tất cả các trạng thái lượng tử vật lý một cách hiệu quả, với số lượng tham số cần thiết tăng theo hàm đa thức với kích thước của hệ.

Rối giữa các trạng thái mạng nơron

Vậy điều gì hạn chế các mạng nơron trong việc biểu diễn trạng thái lượng tử của hệ nhiều hạt một cách hiệu quả? Đối với biểu diễn mạng tensor thông thường, rối lượng tử là chìa khóa. Liệu đó cũng là một yếu tố quan trọng cho biểu diễn mạng nơron?

Rối lượng tử (sau đây gọi tắt là rối) là một hiện tượng vật lý khi các phép đo trên một hạt sẽ ngay lập tức ảnh hưởng đến trạng thái của hạt khác, ngay cả khi các hạt cách xa nhau trong không gian bởi một khoảng cách lớn bất kỳ - một hiện tượng mà Einstein gọi là “tác động ma quỷ bất chấp khoảng cách.” Rối lượng tử cũng là tâm điểm của nghịch lý con mèo Schrödinger nổi tiếng. Cả Einstein và Schrödinger đều bị bất an sâu sắc bởi hiện tượng rối lượng tử.

Hãy tưởng tượng là một trạng thái thuần của một hệ nhiều hạt được chia thành hai hệ con, A và B, như trong Hình 3. Cũng giống như các hệ nhiều hạt cổ điển có thể được đặc trưng bởi các entropy của chúng, hệ nhiều hạt lượng tử có thể được đặc trưng bởi các entropy rối của chúng. Nhiều hệ lượng tử trong tự nhiên thỏa mãn định luật diện tích của rối, theo đó entropy rối của một hệ con cùng lắm là tỷ lệ với diện tích bề mặt hoặc ranh giới của hệ con chứ không phải là thể tích của nó. Đó chính là trường hợp đối với entropy Bekenstein-Hawking của một lỗ đen, entropy này tỷ lệ với diện tích của chân trời sự kiện của lỗ đen. Trên thực tế, nguồn gốc của entropy của lỗ đen được nhiều người tin là do hiện tượng rối giữa phần bên trong và phần bên ngoài của lỗ đen. Trong vật lý của hệ lượng tử nhiều hạt, các trạng thái cơ bản của nhiều Hamiltonian định xứ điển hình cũng thỏa mãn định luật diện tích của rối, mặc dù chứng minh chặt chẽ điều này là một thách thức lớn và vẫn còn chưa được biết.


Hình 3
Biểu diễn mạng nơron của một trạng thái lượng tử một chiều có rối lượng tử tuân theo định luật thể tích tối đa: Nếu hệ được chia thành hai hệ con, A và B, thì entropy của mỗi hệ con tỷ lệ với thể tích của nó. Mỗi nơron khả kiến kết nối tối đa với ba nơron ẩn, do đó, số lượng tham số cần thiết để mô tả hệ con tỷ lệ tuyến tính với kích thước của hệ chứ không phải theo hàm mũ như trong biểu diễn mạng tensơ thông thường.


Định luật diện tích rối rất quan trọng trong biểu diễn mạng tenxơ đối với các trạng thái lượng tử của hệ nhiều hạt và tạo thành “xương sống” của nhiều thuật toán dựa trên mạng tenxơ. Nói chung, số lượng tham số mà mạng tenxơ cần để mô phỏng một trạng thái lượng tử thỏa mãn định luật diện tích rối chỉ tăng như hàm đa thức của kích thước của hệ. Do đó, các trạng thái lượng tử như vậy thường được mô tả hiệu quả trong biểu diễn mạng tenxơ. Tuy nhiên, đối với các trạng thái lượng tử có sự rối lớn, như các trạng thái kích thích cao của các Hamiltonian lượng tử, khi entropy rối tỷ lệ với thể tích thì biểu diễn mạng tenxơ truyền thống không hiệu quả vì khi đó số lượng tham số cần thiết sẽ tăng theo hàm mũ với kích thước của hệ. 

Tất cả các trạng thái mạng nơron của máy Boltzmann hạn chế với kết nối tầm ngắn đều tuân theo định luật diện tích rối, không phụ thuộc vào số chiều và các chi tiết hình học của hệ con. Các trạng thái mã toric, trong đó mỗi nơron chỉ kết nối với bốn đỉnh gần nhất, phải tuân theo định luật diện tích: kết luận này cũng đã được xác nhận bằng các kỹ thuật toán học tinh vi khác.

Nếu không có điều kiện kết nối tầm ngắn, các trạng thái tổng quát của máy Boltzmann hạn chế sẽ tuân theo định luật thể tích rối. Trong thực tế, người ta có thể xây dựng một cách giải tích các họ trạng thái của máy Boltzmann hạn chế với sự rối tối đa. Một phác thảo cho sự xây dựng như vậy được thể hiện trong Hình 3, từ đó suy ra ngay một kết luận kinh ngạc như sau: Việc mô tả các trạng thái rối lớn dựa trên máy Boltzmann hạn chế là rất hiệu quả. Mỗi nơron khả kiến được kết nối tối đa với ba nơron ẩn, do đó, số lượng tham số chỉ tăng tuyến tính với kích thước của hệ; sự mở rộng đó chứng tỏ sức mạnh vô song của các mạng nơron trong việc mô tả các trạng thái lượng tử nhiều hạt với sự rối lớn. Điều nói trên trái ngược hoàn toàn với biểu diễn mạng tenxơ truyền thống, là biểu diễn đòi hỏi một số lượng lớn các tham số (tăng theo hàm mũ với kích thước của hệ) để có thể mô tả các trạng thái rối lớn. Rõ ràng, sự rối không phải là yếu tố giới hạn cho hiệu quả của biểu diễn mạng nơron. 
(Còn tiếp)

Nguyễn Bá Ân dịch
Nguồn: https://physicstoday.scitation.org/doi/10.1063/PT.3.4164