24 05 2019

Sự hội ngộ của máy học và vật lý lượng tử

Cuộc giao duyên giữa máy học và vật lý lượng tử có thể tạo ra một hướng nghiên cứu mới làm thay đổi cả hai lĩnh vực khoa học này.

Máy học sẽ góp phần giải quyết một số vấn đề của vật lý lượng tử. Nguồn: Symmetrymagazine

Máy học (machine learning) là một lĩnh vực của khoa học máy tính nhằm tìm cách làm cho các máy tính có khả năng học để khai thác thông tin có ý nghĩa và đưa ra dự đoán về dữ liệu. Nó là cốt lõi của trí tuệ nhân tạo dẫn đến thành công trên nhiều bình diện của công nghệ hiện đại, từ nhận diện khuôn mặt và xử lý ngôn ngữ tự nhiên đến xe tự lái.

Lĩnh vực này đang phát triển nhanh và các ứng dụng của nó đã trở nên phổ biến. Trình dịch trực tuyến trên mạng (Google Translate’s online service) sử dụng kỹ thuật máy học để chuyển các ký tự tiếng Trung thành văn bản tiếng Anh mà không cần sự can thiệp của con người. Gần đây, các kỹ thuật máy học đã được vận dụng để xây dựng AlphaGo, một robot đã thắng những người chơi giỏi nhất thế giới về cờ vây, một trò chơi cổ xưa. Việc làm chủ trò chơi này được coi là thành tựu cao nhất của trí tuệ nhân tạo. Trước khi AlphaGo chứng tỏ sức mạnh của mình, cờ vây được cho là quá phức tạp để máy có thể thắng người vì số lượng các bước đi khả dĩ là cực kỳ lớn.

Một trong những vấn đề lớn nhất đối với máy học là thứ nguyên – nói chung, số lượng tập dữ liệu cần thiết để huấn luyện cho máy học cách tìm hiểu thông tin mong muốn tăng như hàm mũ theo thứ nguyên d. Nếu một tập dữ liệu có thứ nguyên d > 1, nó sẽ nhanh chóng trở nên không thể quản lý được. Sự phức tạp đó giống như trong cơ học lượng tử, khi việc mô tả đầy đủ trạng thái lượng tử của một hệ nhiều hạt cũng đòi hỏi một lượng thông tin tăng theo hàm mũ đối với số hạt.

Mặc dù rất phức tạp, lý thuyết lượng tử được cho là lý thuyết định lượng thành công nhất của tự nhiên. Nó không chỉ cung cấp cơ sở để hiểu vật lý ở mọi quy mô về độ dài, từ các hạt cơ bản nhỏ bé như điện tử và quark đến các vật thể khổng lồ như sao và thiên hà, mà còn tạo nên nền tảng cho các công nghệ hiện đại, từ laser và bóng bán dẫn đến cộng hưởng từ hạt nhân và thậm chí cả máy tính lượng tử. Với những thành công to lớn trong cả hai lĩnh vực, máy học và vật lý lượng tử, người ta có thể hỏi: Liệu hai lĩnh vực có vẻ như rất khác nhau nhưng lại có mối liên quan mật thiết với nhau như này có thể đồng hiệp một cách liền mạch được không?

Nghe có vẻ giống như khoa học viễn tưởng, nhưng sự đồng hiệp đó đang xảy ra ngay lúc này và có thể dẫn đến những đột phá không thể tưởng tượng được trong cả hai lĩnh vực. Máy học đã tiến bộ đáng kể trong hai thập niên qua, và nhiều vấn đề cực kỳ thách thức hoặc thậm chí không thể tiếp cận với máy học tự động giờ đã được giải quyết. Những thành công đó tạo ra những khả năng mới cho máy học nhằm giải quyết các vấn đề mở trong vật lý lượng tử.

Hiện nay ý tưởng xử lý thông tin lượng tử đã cách mạng hóa lý thuyết và cách thức tính toán. Các thuật toán lượng tử mới có thể mang lại triển vọng lớn để tăng cường khả năng của chính máy học. Không còn nghi ngờ gì nữa, sự tương tác giữa máy học và vật lý lượng tử sẽ mang lại lợi ích cho cả hai lĩnh vực.

Khám phá các pha của vật chất

Khi áp dụng máy học vào các vấn đề vật lý, một chiến lược đơn giản là sử dụng phương pháp học có giám sát. Một thuật toán huấn luyện với các dữ liệu đã được dán nhãn trước; Mục tiêu của thuật toán là lấy thông tin đó và thiết lập một quy tắc chung để gán nhãn cho những dữ liệu ngoài tập dữ liệu đã được dùng trong huấn luyện. Ví dụ, trong việc xác định hình ảnh của chó và mèo, thuật toán có giám sát sẽ lấy hàng ngàn hình ảnh đã được dán nhãn là “chó” hoặc “mèo” và xác định mối quan hệ giữa các giá trị pixel của hình ảnh và nhãn của chúng. Sau đó, máy sẽ gán nhãn thích hợp cho hình ảnh mà nó chưa từng thấy trước đây.

Kỹ thuật học có giám sát như vừa nói ở trên có thể được sử dụng để xác định các pha khác nhau của vật chất và sự chuyển pha giữa chúng, một trong những vấn đề trung tâm của vật lý các chất ngưng tụ. Juan Carrasquilla và Roger Melko là những người đầu tiên khám phá ý tưởng đó trong nghiên cứu của họ về mô hình sắt từ Ising, với các spin nguyên tử rời rạc được sắp xếp trên một mạng lưới. Các spin thể hiện pha thuận từ không có trật tự ở nhiệt độ cao và pha sắt từ có trật tự ở nhiệt độ thấp, và sự chuyển pha giữa hai pha đó xảy ra ở nhiệt độ tới hạn Tc nào đó.

Thay vì phân loại chó và mèo, Carrasquilla và Melko đã sử dụng các cấu hình spin cân bằng được mẫu hóa bằng mô phỏng Monte Carlo để huấn luyện cho máy thuật toán nhận diện các trạng thái thuận từ và sắt từ. Họ đã cho thấy rằng sau khi huấn luyện với các mẫu đã được dán nhãn, thuật toán có thể gán nhãn chính xác cho các mẫu mới. Hơn thế, bằng cách quét một khoảng nhiệt độ, máy đã xác định được vị trí của Tc và tìm được các số mũ tới hạn, những thông số rất quan trọng trong các nghiên cứu về sự chuyển pha.

Hình 1. Hai biểu diễn

Trạng thái lượng tử của một hệ N qubit có dạng tổng quát như sau:

|Ψ〉 =∑ΞΦ(Ξ)||Ξ〉|Ψ〉=∑ΞΦ(Ξ)|Ξ〉 trong đó |Ξ〉=(σ1,σ2,…,σN) biểu thị một cấu hình khả dĩ của N qubit còn Φ(Ξ) là một hàm phức xác định biên độ và pha của trạng thái. Có thể hiểu trạng thái lượng tử là một hộp đen tính toán mà với một |Ξ〉 đã cho sẽ trả về một số phức Φ(Ξ), là hệ số của thành phần |Ξ〉 của trạng thái. Biểu diễn mạng-tenxơ sử dụng các tenxơ để biểu diễn các trạng thái lượng tử. Hạng của tenxơ biểu thị thứ nguyên của nó (hoặc số chỉ số mà nó có), do đó, tenxơ hạng 1 là vectơ, tenxơ hạng 2 là ma trận, v.v. Để đơn giản, xét một hệ 1 chiều với N qubit, như hiển thị trên Hình 1a, được biết đến như biểu diễn trạng thái tích ma trận (Matrix Product State – MPS). Mỗi qubit ứng với một tenxơ Aijk, là tenxơ hạng 3. Các tenxơ tạo thành một mạng trong đó các kết nối biểu diễn các chỉ số của các tenxơ. Nếu hai tenxơ được kết nối, thì chỉ số chung của chúng bị rút lại bằng cách tính tổng tất cả các giá trị có thể có của chỉ số lặp. Trong trường hợp hệ 1 chiều, hai trong số các chỉ số của mỗi tenxơ được kết nối với các tenxơ lân cận và bị rút lại thành tenxơ hạng 1, biểu diễn bậc tự do vật lý. Trạng thái lượng tử do đó sẽ có dạng

Biểu diễn máy Boltzmann hạn chế (restricted Boltzmann machine) là một mạng nơron có hai lớp. Một lớp với N nơron khả kiến ứng với các qubit vật lý và một lớp có M nơron ẩn. Các nơron trong hai lớp khác nhau có thể được kết nối, nhưng các nơron trong cùng một lớp thì không (Xem Hình 1b). Trạng thái lượng tử được cho dưới dạng

trong đó {h} chỉ các cấu hình khả dĩ của nơron ẩn h1,h2, …, hM, Wjk là độ mạnh của tương tác giữa nơron khả kiến và nơron ẩn, còn aj và bk là tham số của nơron khả kiến và nơron ẩn.

Máy học có giám sát đòi hỏi người dùng phải biết trước cách phân loại dữ liệu. Còn máy học không có giám sát thì sử dụng dữ liệu không có nhãn và cho phép mạng tìm thấy các mẫu và cấu trúc có ý nghĩa trong đó. Một ví dụ phổ biến về máy học không có giám sát là phân cụm, trong đó dữ liệu dùng để học được chia thành nhiều nhóm dựa trên sự tương đồng đã được xác định và các nhóm đó được sử dụng để phân loại các dữ liệu mới, chưa từng thấy trước đây. Vào năm 2016, Lei Wang đã áp dụng cách phân cụm như thế cho mô hình Ising và xác định thành công các pha thuận từ và sắt từ cũng như quá trình chuyển pha giữa chúng, mặc dù không đưa ra các tiêu chí sắp xếp rõ ràng của thuật toán. Cũng vào thời gian đó, Evert van Nieuwenburg và đồng nghiệp đã đề xuất một sơ đồ kết hợp cả học có giám sát và không có giám sát. Họ đã thử phương pháp của họ trên một số mô hình, kể cả mô hình Ising, và chứng tỏ được rằng các pha khác nhau và sự chuyển pha có thể xác định được.

Biểu diễn mạng nơron

Song song với sự phát triển nhanh chóng của các thuật toán cho máy học nhằm xác định các pha của vật chất, việc sử dụng các mạng thần kinh nhân tạo, sau đây gọi là mạng nơron, để biểu diễn các trạng thái lượng tử và giải các bài toán nhiều hạt lượng tử liên quan cũng đã đạt được những tiến bộ khích lệ.

Trong cơ học lượng tử, mô tả đầy đủ một trạng thái nhiều hạt bất kỳ đòi hỏi một lượng thông tin tăng theo hàm mũ. Xét một hệ có N qubit (là tên gọi tắt của bit lượng tử). Mỗi qubit có hai cấu hình độc lập, 0 hoặc 1; do đó tổng số cấu hình của cả hệ sẽ là 2^N. Về mặt tính toán, điều đó có nghĩa là mô tả đầy đủ trạng thái lượng tử tương ứng cần có 2^N số phức.

Độ phức tạp tăng theo hàm mũ là một thách thức lớn cho các mô phỏng số đối với các hệ lượng tử nhiều hạt nếu thực hiện trên máy tính cổ điển – ngay cả việc mô phỏng chỉ vài qubit thôi cũng cần một bộ nhớ cực lớn. Ví dụ, mô phỏng một hệ lượng tử với 30 qubit đòi hỏi hàng chục gigabyte (vào cỡ bộ nhớ lớn nhất cho máy tính để bàn cá nhân); mô phỏng 50 qubit đòi hỏi hàng chục petabyte (nhiều hơn bộ nhớ cho siêu máy tính lớn nhất thế giới hiện nay); và mô phỏng 300 qubit đòi hỏi nhiều byte hơn số lượng nguyên tử trong vũ trụ quan sát được.

May mắn thay, hầu hết các trạng thái vật lý đáng quan tâm, như trạng thái cơ bản của Hamiltonian của hệ nhiều hạt chẳng hạn, thường chỉ chiếm một góc nhỏ của toàn bộ không gian Hilbert của trạng thái lượng tử và vì thế có thể được mô tả với một lượng thông tin rút gọn. Do đó, việc thiết kế các biểu diễn nhỏ gọn (compact) của các trạng thái đó sao cho chỉ giữ lại các đặc tính vật lý thiết yếu của chúng là cần thiết để giải các bài toán lượng tử nhiều hạt bằng các máy tính cổ điển.

Một cách mô phỏng nổi tiếng cho các trạng thái như vậy là biểu diễn mạng tenxơ, trong đó một tenxơ được gán cho mỗi qubit và các tenxơ đó mô tả trạng thái lượng tử nhiều hạt. Cách xây dựng như vậy có thể biểu diễn hầu hết các trạng thái vật lý một cách hiệu quả theo nghĩa là lượng thông tin cần thiết chỉ tăng theo hàm đa thức, thay vì theo hàm mũ, khi kích thước của hệ tăng.

Hình 2
Biểu diễn máy Boltzmann hạn chế của trạng thái mã toric với thứ tự tôpô nội tại. Mỗi đỉnh ? hoặc mặt ℱ có bốn nơron khả kiến được kết nối với một nơron ẩn h? hoặc hℱ. Việc biểu diễn là hiệu quả vì mỗi kết nối tương ứng với một tham số trong mạng nơron, do đó số lượng các tham số tăng một cách tuyến tính thay vì tăng theo hàm mũ khi kích thước của hệ tăng.

Các mạng nơron, là các mô hình trừu tượng đơn giản hóa bộ não con người, cũng có thể được sử dụng để xây dựng các biểu diễn nhỏ gọn của các trạng thái lượng tử. Giuseppe Carleo và Matthias Troyer lần đầu tiên khai thác ý tưởng để đưa ra một biểu diễn mới dựa trên máy Boltzmann hạn chế, một mạng nơron đặc biệt được sử dụng rộng rãi trong cộng đồng máy học. (Các biểu diễn mạng tenxơ và biểu diễn máy Boltzmann hạn chế được so sánh chi tiết hơn trên Hình 1.) Một biểu diễn máy Boltzmann hạn chế được sắp xếp thành hai lớp nơron, một lớp khả kiến và một lớp ẩn, như minh họa trên Hình 2. Các nơron khả kiến mô tả các qubit vật lý còn các nơron ẩn mô tả các bậc tự do bổ sung phụ trợ cuối cùng bị loại bỏ bởi một phép tính tổng để tạo ra đầu ra của mạng, là một số phức đóng vai trò là hệ số cho cấu hình qubit tương ứng.

Những loại trạng thái lượng tử nhiều hạt nào có thể được mô tả hiệu quả bằng máy Boltzmann hạn chế? Một số trạng thái kỳ lạ, chẳng hạn như trạng thái tôpô, được thể hiện tốt bởi các máy Boltzmann hạn chế. Hình 2 phác thảo biểu diễn máy Boltzmann hạn chế cho trạng thái cơ bản của Hamiltonian mã toric, là một trạng thái tôpô do Alexei Kitaev đưa ra để thực hiện các tính toán lượng tử tôpô. Để biểu thị trạng thái mã toric, mỗi nơron ẩn của máy Boltzmann hạn chế chỉ kết nối với bốn nơron khả kiến gần nhất với nó. Mỗi kết nối được mô tả bởi một tham số mạng, vì vậy tổng số tham số gần gấp bốn lần số lượng qubit, tức là tỷ lệ tuyến tính, thay vì theo hàm mũ, khi kích thước của hệ tăng. Biểu diễn cực kỳ nhỏ gọn như vậy của trạng thái mã toric cũng có thể mô phỏng các trạng thái kích thích.

Ngoài ra còn tồn tại các trạng thái lượng tử không mô phỏng được một cách hiệu quả bởi máy Boltzmann hạn chế. Tuy nhiên, khả năng ứng dụng của máy Boltzmann hạn chế sẽ tăng lên nếu nó bao gồm một lớp ẩn bổ sung. Khi đó mạng nơron, được gọi là máy Boltzmann sâu, có thể biểu diễn hầu hết tất cả các trạng thái lượng tử vật lý một cách hiệu quả, với số lượng tham số cần thiết tăng theo hàm đa thức với kích thước của hệ.

Rối giữa các trạng thái mạng nơron

Vậy điều gì hạn chế các mạng nơron trong việc biểu diễn trạng thái lượng tử của hệ nhiều hạt một cách hiệu quả? Đối với biểu diễn mạng tensor thông thường, rối lượng tử là chìa khóa. Liệu đó cũng là một yếu tố quan trọng cho biểu diễn mạng nơron?

Rối lượng tử (sau đây gọi tắt là rối) là một hiện tượng vật lý khi các phép đo trên một hạt sẽ ngay lập tức ảnh hưởng đến trạng thái của hạt khác, ngay cả khi các hạt cách xa nhau trong không gian bởi một khoảng cách lớn bất kỳ – một hiện tượng mà Einstein gọi là “tác động ma quỷ bất chấp khoảng cách.” Rối lượng tử cũng là tâm điểm của nghịch lý con mèo Schrödinger nổi tiếng. Cả Einstein và Schrödinger đều bị bất an sâu sắc bởi hiện tượng rối lượng tử.

Hãy tưởng tượng là một trạng thái thuần của một hệ nhiều hạt được chia thành hai hệ con, A và B, như trong Hình 3. Cũng giống như các hệ nhiều hạt cổ điển có thể được đặc trưng bởi các entropy của chúng, hệ nhiều hạt lượng tử có thể được đặc trưng bởi các entropy rối của chúng. Nhiều hệ lượng tử trong tự nhiên thỏa mãn định luật diện tích của rối, theo đó entropy rối của một hệ con cùng lắm là tỷ lệ với diện tích bề mặt hoặc ranh giới của hệ con chứ không phải là thể tích của nó. Đó chính là trường hợp đối với entropy Bekenstein-Hawking của một lỗ đen, entropy này tỷ lệ với diện tích của chân trời sự kiện của lỗ đen. Trên thực tế, nguồn gốc của entropy của lỗ đen được nhiều người tin là do hiện tượng rối giữa phần bên trong và phần bên ngoài của lỗ đen. Trong vật lý của hệ lượng tử nhiều hạt, các trạng thái cơ bản của nhiều Hamiltonian định xứ điển hình cũng thỏa mãn định luật diện tích của rối, mặc dù chứng minh chặt chẽ điều này là một thách thức lớn và vẫn còn chưa được biết.

Hình 3
Biểu diễn mạng nơron của một trạng thái lượng tử một chiều có rối lượng tử tuân theo định luật thể tích tối đa: Nếu hệ được chia thành hai hệ con, A và B, thì entropy của mỗi hệ con tỷ lệ với thể tích của nó. Mỗi nơron khả kiến kết nối tối đa với ba nơron ẩn, do đó, số lượng tham số cần thiết để mô tả hệ con tỷ lệ tuyến tính với kích thước của hệ chứ không phải theo hàm mũ như trong biểu diễn mạng tensơ thông thường.

Định luật diện tích rối rất quan trọng trong biểu diễn mạng tenxơ đối với các trạng thái lượng tử của hệ nhiều hạt và tạo thành “xương sống” của nhiều thuật toán dựa trên mạng tenxơ. Nói chung, số lượng tham số mà mạng tenxơ cần để mô phỏng một trạng thái lượng tử thỏa mãn định luật diện tích rối chỉ tăng như hàm đa thức của kích thước của hệ. Do đó, các trạng thái lượng tử như vậy thường được mô tả hiệu quả trong biểu diễn mạng tenxơ. Tuy nhiên, đối với các trạng thái lượng tử có sự rối lớn, như các trạng thái kích thích cao của các Hamiltonian lượng tử, khi entropy rối tỷ lệ với thể tích thì biểu diễn mạng tenxơ truyền thống không hiệu quả vì khi đó số lượng tham số cần thiết sẽ tăng theo hàm mũ với kích thước của hệ.

Tất cả các trạng thái mạng nơron của máy Boltzmann hạn chế với kết nối tầm ngắn đều tuân theo định luật diện tích rối, không phụ thuộc vào số chiều và các chi tiết hình học của hệ con. Các trạng thái mã toric, trong đó mỗi nơron chỉ kết nối với bốn đỉnh gần nhất, phải tuân theo định luật diện tích: kết luận này cũng đã được xác nhận bằng các kỹ thuật toán học tinh vi khác.

Nếu không có điều kiện kết nối tầm ngắn, các trạng thái tổng quát của máy Boltzmann hạn chế sẽ tuân theo định luật thể tích rối. Trong thực tế, người ta có thể xây dựng một cách giải tích các họ trạng thái của máy Boltzmann hạn chế với sự rối tối đa. Một phác thảo cho sự xây dựng như vậy được thể hiện trong Hình 3, từ đó suy ra ngay một kết luận kinh ngạc như sau: Việc mô tả các trạng thái rối lớn dựa trên máy Boltzmann hạn chế là rất hiệu quả. Mỗi nơron khả kiến được kết nối tối đa với ba nơron ẩn, do đó, số lượng tham số chỉ tăng tuyến tính với kích thước của hệ; sự mở rộng đó chứng tỏ sức mạnh vô song của các mạng nơron trong việc mô tả các trạng thái lượng tử nhiều hạt với sự rối lớn. Điều nói trên trái ngược hoàn toàn với biểu diễn mạng tenxơ truyền thống, là biểu diễn đòi hỏi một số lượng lớn các tham số (tăng theo hàm mũ với kích thước của hệ) để có thể mô tả các trạng thái rối lớn. Rõ ràng, sự rối không phải là yếu tố giới hạn cho hiệu quả của biểu diễn mạng nơron.
(Còn tiếp)

Nguyễn Bá Ân dịch
Nguồn: https://physicstoday.scitation.org/doi/10.1063/PT.3.4164

Tác giả

.

View all posts

(Visited 35 times, 1 visits today)