MolMapNet: Mô hình học sâu dự đoán đặc tính dược phẩm
Trong vài thập kỷ qua, các nhà khoa học máy tính đã phát triển nhiều công cụ học sâu cho nhiều ứng dụng khác nhau, bao gồm cả phân tích dược phẩm. Gần đây nhất, họ đã đào tạo được các mô hình học sâu có khả năng dự đoán những đặc tính của dược phẩm để phân tích và học cách biểu diễn phân tử.
Các nhà nghiên cứu tại ĐH Thanh Hoa, ĐH Quốc gia Singapore, Khoa Dược (ĐH Phúc Đán) và ĐH Chiết Giang gần đây đã phát triển một công cụ trí tuệ nhân tạo (AI) mới có thể dự đoán các đặc tính dược phẩm của thuốc bằng cách phân tích cách biểu diễn phân tử dựa trên kiến thức của con người.
Công cụ có tên gọi là MolMapNet, được đăng trong một bài báo trên tạp chí Nature Machine Intelligence. Theo đó, ngay cả những người không có hoặc có ít kiến thức về khoa học máy tính, sinh học hoặc các ngành khoa học khác cũng có thể sử dụng được công cụ này dễ dàng. “Chúng tôi hiểu rằng việc khảo sát đánh giá các loại dược phẩm đòi hỏi phải hiểu biết nhiều về đặc tính phân tử. Tri thức của con người đã tạo ra những bộ sưu tập phong phú về đặc tính của nhiều phân tử, nhưng để AI học hỏi những đặc tính này là rất khó”, Yu Zong Chen, thành viên nhóm nghiên cứu, cho biết.
Mặc dù các công cụ AI thường rất giỏi trong việc nhận dạng hình ảnh được sắp xếp theo trình tự không gian (ví dụ hình ảnh của các vật thể), nhưng chúng không hoạt động tốt trên những dữ liệu không có trình tự như đặc tính phân tử. Điều này đã làm giảm đáng kể hiệu suất của AI trong phân tích dược phẩm.
Chen và các cộng sự muốn khắc phục điều này. Ông cho biết, “Với dữ liệu dược phẩm có giới hạn, thật khó để cải thiện các cấu trúc AI. Chúng tôi tự hỏi liệu mình có thể cải thiện cách AI đọc thuộc tính phân tử hay không. Giải pháp đưa ra là lập bản đồ cho các thuộc tính phân tử không có trình tự thành các hình ảnh có trình tự để AI nhận ra đặc tính hiệu quả hơn.”
Công cụ AI sáng tạo “vượt ngoài khuôn khổ” này không đòi hỏi tinh chỉnh tham số, nghĩa là người dùng không chuyên cũng có thể sử dụng được. Đáng chú ý, các nhà nghiên cứu nhận thấy nó hoạt động tốt hơn các công cụ AI hiện đại nhất trên hầu hết 26 bộ dữ liệu dược phẩm chuẩn. “Phương pháp của chúng tôi tuân theo ba bước để cải thiện dự đoán học sâu về các đặc tính dược phẩm,” Chen nói. Bước đầu tiên là hiểu rộng mối quan hệ nội tại của các đặc tính phân tử từ hơn 8 triệu phân tử khác nhau. Những mối quan hệ này có thể liên quan với nhau, do đó có thể là chỉ thị của một loạt đặc tính dược phẩm khác nhau.
Bước thứ hai sử dụng một kỹ thuật chuyển đổi dữ liệu mới được phát triển để sắp xếp các đặc tính phân tử của dược phẩm thành hình ảnh 2D, nơi các lớp điểm ảnh (pixel layout) phản ánh mối quan hệ nội tại giữa các đặc tính này. Các lớp này chứa những chỉ thị quan trọng về đặc tính dược phẩm mà các mô hình học sâu được đào tạo thích hợp có thể ghi nhớ được.
Bước thứ ba, họ đào tạo ra một công cụ nhận dạng hình ảnh để học các hình ảnh 2D và sử dụng chúng nhằm dự đoán đặc tính dược phẩm. Công cụ AI này có thể nhận dạng các mẫu đặc trưng trong mỗi lớp điểm ảnh để mô tả những đặc tính dược phẩm cụ thể. “Có hai kết quả đáng chú ý trong nghiên cứu của chúng tôi”, Chen nhận xét. “Thứ nhất là tạo ra phương pháp mới để sắp xếp các thuộc tính phân tử không có trình tự thành các hình ảnh có trình tự để thể hiện mối quan hệ nội tại của các thuộc tính phân tử. Thứ hai là phát triển một công cụ AI tiên tiến phục vụ cho việc dự đoán sâu về đặc tính dược phẩm với hiệu quả tốt nhất dùng cho những người không phải là chuyên gia”.
Trong tương lai, mô hình học sâu này có thể đẩy nhanh việc nghiên cứu dược phẩm một cách hiệu quả hơn. Trong các nghiên cứu tiếp theo, Chen và các cộng sự muốn tiếp tục phát triển mô hình này để có thể áp dụng cho các nghiên cứu về y sinh.
Ngô Hà dịch
Nguồn: https://techxplore.com/news/2021-03-molmapnet-out-of-the-box-deep-pharmaceutical-properties.html