Ứng dụng AI để nghiên cứu các phản ứng hóa học

Trong một vài năm trở lại đây, các nhà nghiên cứu đã áp dụng những kỹ thuật của khoa học dữ liệu để hỗ trợ việc giải quyết các bài toán của tổng hợp hữu cơ.

Các nhà nghiên cứu trong phòng thí nghiệm của Abigail Doyle, giáo sư hóa học A. Barton Hepburn của trường đại học Princeton, đã cộng tác với giáo sư khoa học máy tính Ryan Adams để phát triển phần mềm nguồn mở, qua đó đem lại một thuật toán tối ưu vô cùng tiên tiến để có thể áp dụng trong công việc nghiên cứu thường nhật, đưa những gì đã học được từ lĩnh vực học máy vào hóa học tổng hợp.

Phần mềm này có thể thích nghi với một số nguyên tắc chính của tối ưu Bayes để cho phép tổng hợp các hóa chất nhanh hơn và hiệu quả hơn.

Trên cơ sở lý thuyết Bayes, một công thức toán học có chức năng xác định tính xác suất điều kiện, tối ưu Bayes được sử dụng một cách rộng rãi trong nhiều lĩnh vực khoa học. Nó cho phép con người và máy tính sử dụng những hiểu biết đã có thể thông báo và tối ưu hóa các quyết định trong tương lai.

Các nhà hóa học ở phòng thí nghiệm của Doyle, trong hợp tác với Adams, một giáo sư khoa học máy tính, và các đồng nghiệp tại Bristol-Myers Squibb, so sánh các quyết định của con người với gói phần mềm. Họ tìm thấy là công cụ tối ưu hiệu quả hơn và ít thiên kiến hơn cả con người trong một phản ứng thử nghiệm. Công trình của họ xuất hiện trên tạp chí Nature với tiêu đề “Bayesian reaction optimization as a tool for chemical synthesis” (Tối ưu phản ứng Bayes như một công cụ cho tổng hợp hóa học).

“Tối ưu phản ứng có mặt ở khắp mọi nơi trong tổng hợp hóa học, cả trong nghiên cứu hàn lâm và ngành công nghiệp hóa học”, Doyle cho biết. “Kể từ khi không gian hóa học trở nên quá rộng lớn thì với các nhà hóa học, thật thông thể đánh giá được toàn bộ một không gian phản ứng trong thực nghiệm. Vì thế chúng tôi muốn phát triển và đánh giá tối ưu Bayes thành một công cụ cho hóa tổng hợp do thấy thành công của nó trong việc giải quyết những bài toán tối ưu trong nhiều lĩnh vực khoa học”.

Benjamin Shields, một cựu postdoct trong phòng thí nghiệm của Doylevà là tác giả thứ nhất của nghiên cứu, đã tạo ra gói Python.

“Tôi có nền tảng hiểu biết về hóa tổng hợp, vì vậy tôi có thể chắc chắn một điều là các nhà hóa tổng hợp đều rất giỏi trong việc xử lý các vấn đề này”, Shields nói. “Tôi cho rằng điểm mạnh thực sự của tối ưu Bayes là nó cho phép chúng tôi mô hình hóa các bài toán chiều bậc cao và nắm bắt các xu hướng mà chúng tôi có thể không thấy trong dữ liệu của mình, do đó nó có thể xử lý dữ liệu tốt hơn rất nhiều.

Và hai là trong cùng một không gian, nó sẽ không mắc phải sự thiên kiến vốn có của một nhà hóa học”, anh cho biết thêm.

Nó hoạt động như thế nào?

Phần mềm này được bắt đầu như một dự án nằm ngoài những yêu cầu của chương trình tiến sĩ của Shields. Doyle và Shield đã hình thành một nhóm nghiên cứu tại Trung tâm Máy tính hỗ trợ tổng hợp hóa học (C-CAS), một sáng kiến của Quỹ Khoa học Mỹ quy tụ năm trường đại học để chuyển đổi việc tổng hợp các phân tử hữu cơ phức tạp. Doyle là một thanhg viên chính của C-CAS kể từ năm 2019.

“Tối ưu phản ứng có thể là một quá trình chi phí cao và tốn thời gian”, Adams, giám đốc Chương trình Thống kê và học máy, nhận xét. “Cách tiếp cận này không chỉ là tăng tốc việc sử dụng các kỹ thuật tiên tiến mà còn có thể tìm thấy những giải pháp xuất sắc hơn cả con người có thể tạo ra. Tôi nghĩ điểm bắt đầu của cái có thể với tối ưu Bayes là chính trong không gian này”.

Những người tham gia bắt đầu xác định không gian tìm kiếm – những thực nghiệm có vẻ hợp lý để xem xét – như một danh sách của các chất xúc tác, chất thử, phối tử, nhiệt độ và các nồng độ. Một khi không gian được chuẩn bị và người sử dụng xác định được cách các thực nghiệm được tiến hành như thế nào thì phần mềm có thể sẵn sàng chọn những điều kiện thực nghiệm ban đầu để đánh giá. Sau đó nó đề xuất những thực nghiệm mới có thể thực hiện, lặp lại thông qua một số các lựa chọn nhỏ hơn và nhỏ hơn nữa cho đến khi phản ứng được tối ưu.

“Trong thiết kế phần mềm này, tôi cố gắng bao hàm cả những cách con người thường nghĩ về một phản ứng”, Shields nói. “Bất kể anh sử dụng nó hay học máy thì luôn luôn sẽ có một trường hợp dựa trên kinh nghiệm của con người”.

Các nhà nghiên cứu khác có thể truy cập phần mềm và những ví dụ của nghiên cứu này qua GitHub: phần mềm đại diện cho các hóa chất được đánh giá trong một định dạng máy có thể đọc được thông qua lý thuyết phiếm hàm mật độ; phần mềm cho tối ưu phản ứng; và nội dung thông tin được thu thập từ quyết định tối ưu của phản ứng thử của các nhà hóa học.

Tô Vân tổng hợp

Nguồnhttps://phys.org/news/2021-02-chemistry-science-artificial-intelligence-chemical.html

https://www.princeton.edu/

Tác giả

(Visited 55 times, 1 visits today)