Học máy khám phá những câu hỏi khoa học vật liệu và giải quyết những bài toán khó
Bằng việc sử dụng những nguồn lực tính toán tại Trung tâm Tính toán khoa học nghiên cứu năng lượng quốc gia (NERSC) tại Phòng thí nghiệm quốc gia Lawrence Berkeley (Berkeley Lab), các nhà nghiên cứu tại Phòng thí nghiệm quốc gia Argonne đã thành công trong việc khám phá những câu hỏi quan trọng trong khoa học vật liệu và thực hiện được quá trình sử dụng học máy để giải quyết những bài toán khó trong tìm kiếm.
Với việc chấp thuận một thuật toán học máy từ trò chơi điện tử như AlphaGo, các nhà nghiên cứu đã phát triển được lĩnh vực quyền lực như các nanoclusters của 54 nguyên tố trong bảng tuần hoàn, một bước nhảy vọt đem lại hiểu biết về các đặc tính độc đáo của chúng và chứng minh khái niệm cho phương pháp tìm kiếm của mình. Nhóm nghiên cứu đã xuất bản kết quả nghiên cứu trên tạp chí Nature Communications.
Phụ thuộc vào quy mô – các hệ lớn hơn 100 nanomet so với các cụm nano nhỏ hơn 100 nanomet – các vật liệu có thể hiển thị các đặc tính khác biệt, bao gồm quang học và các đặc tính từ, các mức năng lượng riêng rẽ và tăng cường hiện tượng phát sáng quang hóa. Các đặc tính này có thể thêm vào những ứng dụng khoa học và công nghệ mới, và các nhà khoa học có thể học hỏi về chúng bằng việc phát triển các trường lực – các mô hình tính toán ước tính các năng lượng tiềm năng giữa các nguyên tử trong một phân tử và giữa các phân tử với nhau – cho mỗi nguyên tố hoặc các hợp chất. Nhưng các nhà khoa học vật liệu đã dành nhiều năm để sử dụng các phương pháp vật lý truyền thống để mở rộng các cấu trúc và lực giữa các nguyên tử trong các cụm nano của một nguyên tố.
“Chúng tôi muốn nhìn vào động lực ở cấp độ nano, và do đó, thông thường chúng tôi sử dụng một số lý thuyết tính toán lượng tử và lý thuyết phiếm hàm mật độ nhưng có những tính toán trên máy tính vô cùng đắt đỏ”, nhà khoa học vật liệu Sukriti Manna, một tác giả của bài báo.
Áp dụng học máy là một trong những cách tiềm năng để cắt giảm chi phí. Tuy nhiên, các thuật toán hiện nay đều đến từ những không gian tìm kiếm rời rạc như games, nơi số lượng các nhánh tìm kiếm và các kết quả cs thể đều hữu hạn. Trong một không gian hành động liên tục như các trường lực của các cụm nano hóa học, con số có thể tìm kiếm là vô hạn và lực vô cùng lớn – năng lực để chạy bất cứ kịch bản nào để tìm kiếm kết quả tốt nhất – không hề vận hành một cách đơn giản.
Làm việc thông minh hơn chứ không khó hơn
Để khiến một thuật toán đang có sẵn làm việc một cách thông minh hơn chứ không khó hơn, chuyên gia học máy Troy Loeffler đã sử dụng một dạng học tăng cường mang tên tìm kiếm tự do Monte Carlo (MCTS). Học tăng cường là một hình thức học mát cho phép một thuật toán tương tác một cách trực tiếp với môi trường của nóm học thông qua thưởng và phạt, với mục tiêu là tăng thêm phần thưởng tích lũy nhiều nhất theo thời gian. MCTS sử dụng một phương pháp “khám phá và khai phá” – ban đầu tìm kiếm một cách ngẫu nhiên, sau đó học hỏi để loại bỏ những con đường tìm kiếm ít năng suất nhất, hoặc các lượt chơi, và tập trung vào những con đường hiệu quả hơn. Loeffler đã đưa vào một số hàm mới để khiến thuật toán hiệu quả hơn: một hàm độc đáo để loại các tìm kiếm thừa thãi, một lược đồ chia tỷ lệ cửa sổ để tương quan độ sâu của cây với không gian hành động nhằm đem lại một cấu trúc hữu dụng và mở rộng lượt chơi, trong đó dạy thuật toán tối ưu các cuộc tìm kiếm ngẫu nhiên gần với những gì đã được chứng minh là hiệu quả.
“Rất nhiều việc chúng tôi đã làm để trên thực tế phát triển được thuật toán cho những không gian hành động liên tục, nơi bạn không cần không gian trò chơi rời rạc; bạn có các tham số có thể chuyển đến bất cứ nơi nào trên môi trường cụ thể” Loeffler nói. “Ý tưởng cốt lõi là nếu bạn sử dụng một kết hợp của cả ngẫu nhiên và nhân tố đã được xác định, với AI, để định hình ra”. Sự kết hợp này hoạt động thì có thể thu về trường lực của 54 nguyên tố trong một khoảng thời gian nhỏ cho trước để tìm các tham số chỉ cho một nguyên tố và chứng tỏ học tăng cường có thể là một công cụ hữu dụng trong không gian hành động liên tục.
Nhóm nghiên cứu đã sử dụng siêu máy tính Cori tại NERSC để thực hiện các phép toán của mình và tạo ra cả các bộ dữ liệu học tập và tập hợp, ban đầu sử dụng phần mềm Gói mô phỏng ban đầu Vienna (VASP) cho mô hình hóa vật liệu ở cấp độ nguyên tử và mã hóa động lực phân tử cổ điển LAMMPS. Dự án này chỉ là một trong số những dự án thực hiện tại NERSC từ nhóm Lý thuyết và Mô hình hóa của Argonne, những người thường tận dụng sức mạnh tính toán, thời gian đặt lịch tối thiểu và bảo trì đáng tin cậy ở NERSC.
“Với các nguyên tố như carbon, boron, và phosphorous, chúng tôi đòi hỏi một lượng lớn các bộ dữ liệu và chúng tôi đòi hỏi chất lượng phải tốt. với công trình mà chúng tôi sử dụng NERSC cho việc tạo ra các bộ dữ liệu vô cùng lớn bởi cấu trúc đa dạng của chúng. Cori là máy tính rất nhanh và khi tôi sử dụng nó, thời gian sử dụng vô cùng ngắn, vì vậy chúng tôi phải thực hiện rất nhanh công việc của mình”, Manna nói và cho biết thêm “nếu chúng tôi có 100% lượng công việc thì thời gian tính toán chúng tôi phụ thuộc vào NERSC tới 90%”.
Chuyên gia học máy Rohit Batra, người phát triển một khung học máy để phân tích xu hướng lỗi trong các chức năng tiềm tàng khắp bảng tuần hoàn, đồng tính với nhận định này. “Tôi là người hâm mộ Cori – tôi sử dụng nó cho rất nhiều mục tiêu”, anh nói. “Nó được bảo trì tố. Thi thoảng với những cụm khác, cũng có một số vấn đề có thể là nguyên nhân khiến nó phải dừng hoạt động trong một khoảng thời gian nhất định nhưng tôi nghĩ NERSC bảo trì rất tốt và đáng tin cậy”.
Tương lai của MCTS ngày càng sâu rộng
Với việc sử dụng MCTS trong không gian nghiên cứu liên tục đã được áp dụn, cái gì sẽ đến tiếp theo? Từ góc nhìn của một nhà khoa học vật liệu, có nhiều việc để làm với khám phá về các vật liệu phức hợp.
“Từ một góc độ ứng dụng, một phát triển trường lực, chúng tôi đã khám phá được mỏ quặng nguyên tố và một vài hợp kim được hình thành từ hai nguyên tố. Vì vậy trong tương lai gần, chúng tôi sẽ xem xét một số kết hợp, như oxit và sulfit, và phát triển những trường lực đó”, Manna nói . “Do thuật toán rất hiệu quả nên tất cả những gì chúng tôi cần là thời gian và các tập dữ liệu huấn luyện khác”.
Nhưng khoa học vật liệu không phải là ứng dụng duy nhất mà MCTS có được qua công trình này – và trong giai đoạn tiếp theo, bao gồm thử nghiệm về phạm vi tác động và các biên giới năng lực của thuật toán”.
“Chúng tôi đang sử dụng MCTS và áp dụng vào rất nhiều tình huống khác nhau”, Loeffler nói. “Chúng tôi có 10 hay 11 dự án khác nhau mà chúng tôi và các thành viên hợp tác đang quan tâm và hiện đang áp dụng thuật toán này”, bao gồm nghiên cứu định hướng game sâu hơn và điều chỉnh trường lực bổ sung. Đây là một quá trình đã chứng thực được thành công, do đó tương lai của nó rất tươi sáng, ông cho biết thêm. “Chúng tôi đang tìm kiếm rất nhiều thứ và cố gắng theo đuổi nó. Cho đến nay, những thứ mà chúng tôi đang cố gắng theo đuổi đều hoạt động rất tốt và hứa hẹn”.
Nguyễn Nhàn tổng hợp
Nguồn: https://cs.lbl.gov/news-media/news/2022/machine-learning-fuels-materials-science-and-search-in-continuous-action-spaces/
https://techxplore.com/news/2022-05-machine-explores-materials-science-difficult.html