Phương pháp AI tăng tốc cuộc săn tìm thuốc mới
Mô hình học sâu giúp rút ngắn quá trình sàng lọc thuốc tốn thời gian.
Phương pháp trí tuệ nhân tạo (AI) mới có thể giúp tăng tốc quá trình tìm ra thuốc mới, bằng cách loại bỏ việc sàng lọc thủ công tốn thời gian. Một mô hình AI được huấn luyện trên dữ liệu phức tạp từ tế bào người có thể mở ra con đường tắt trong cuộc đua phát triển dược phẩm.

Phương pháp này, được công bố ngày 23 tháng 10 trên tạp chí Science, tiếp nối xu hướng đang lan rộng trong lĩnh vực khám phá thuốc: sử dụng AI để tăng tốc quá trình tẻ nhạt và lặp đi lặp lại của việc rà soát hàng loạt hợp chất hóa học nhằm tìm ra những ứng viên tiềm năng cho các liệu pháp điều trị mới.
“Đây là một bản thiết kế mạnh mẽ cho tương lai,” theo Hongkui Deng, nhà sinh học tế bào tại Đại học Bắc Kinh, người không tham gia nghiên cứu. “Nó tạo ra một hệ thống sàng lọc thông minh có thể học hỏi từ chính các thí nghiệm của mình.”
Phương pháp tẻ nhạt
Trong nhiều thập kỷ, các nhà khoa học đã tìm kiếm thuốc bằng cách sàng lọc các thư viện hóa chất khổng lồ, thử nghiệm tác động của từng hợp chất lên tế bào nuôi cấy trong phòng thí nghiệm. Phương pháp này từng mang lại nhiều thành công, chẳng hạn phát hiện ra các thuốc có khả năng tiêu diệt tế bào ung thư.
Ngày càng nhiều nhà nghiên cứu hướng tới các phương pháp sàng lọc phức tạp hơn, có thể tận dụng dữ liệu gen đồ sộ được thu thập từ từng tế bào riêng lẻ trong thập kỷ qua. Về lý thuyết, các phương pháp này có thể đánh giá mức độ mà một hợp chất làm xáo trộn toàn bộ mạng lưới hoạt động gen — mở ra những hướng đi mới cho việc khám phá thuốc.
Tuy nhiên, theo Alex Shalek, kỹ sư y sinh tại Viện Công nghệ Massachusetts (MIT), quá trình tìm thuốc thường đòi hỏi sàng lọc hàng chục nghìn hợp chất, và việc kết hợp quy mô lớn như vậy với các xét nghiệm phức tạp là quá tốn kém và mất thời gian.
Để tìm ra cách tận dụng dữ liệu gen mới theo hướng khả thi hơn, Shalek đã hợp tác với các nhà nghiên cứu khác và công ty công nghệ sinh học Cellarity, có trụ sở tại Somerville, bang Massachusetts (ông cũng là cố vấn trả phí của công ty này). Nhóm nghiên cứu đã huấn luyện một mô hình học sâu có tên DrugReflector trên dữ liệu công khai, mô tả cách gần 9.600 hợp chất hóa học ảnh hưởng đến hoạt động gen trong hơn 50 loại tế bào khác nhau.
Họ đã sử dụng DrugReflector để tìm các hợp chất có thể tác động đến quá trình hình thành tiểu cầu và hồng cầu — đặc tính có thể hữu ích trong điều trị một số bệnh về máu. Sau đó, nhóm thử nghiệm 107 hợp chất để kiểm tra xem chúng có mang lại hiệu quả như dự đoán hay không.
Kết quả cho thấy DrugReflector hiệu quả hơn tới 17 lần trong việc phát hiện các hợp chất có liên quan so với phương pháp sàng lọc truyền thống dựa trên lựa chọn ngẫu nhiên. Khi nhóm nghiên cứu đưa dữ liệu từ vòng thử nghiệm đầu tiên trở lại mô hình để tiếp tục huấn luyện, tỷ lệ thành công của nó tăng gấp đôi.
Tiết kiệm công sức
Theo Bissan Al-Lazikani, nhà khoa học dữ liệu ung thư tại Trung tâm Ung thư MD Anderson thuộc Đại học Texas, phương pháp này có thể giảm đáng kể khối lượng công việc cần thiết để tìm thuốc mới. “Thay vì phải sàng lọc cả triệu hợp chất, bạn chỉ cần thử vài trăm,” bà nói.
Deng cho rằng những phương pháp như vậy có thể giúp phòng thí nghiệm của ông tìm ra các hợp chất có khả năng “tái lập trình” tế bào để đảm nhận chức năng mới. Phòng thí nghiệm của ông đã dành nhiều năm tìm kiếm các hóa chất có thể biến tế bào gốc thành tế bào sản xuất insulin, nhằm phục vụ điều trị bệnh tiểu đường.
Tuy nhiên, hiện tại DrugReflector chỉ có thể đánh giá trong phạm vi 9.600 hợp chất thuộc bộ dữ liệu huấn luyện và chưa thể phát hiện các phân tử hoàn toàn mới, Deng lưu ý.
Mục tiêu cuối cùng của các nhà khoa học là phát triển một hệ thống có thể dự đoán trực tiếp tác động sinh học của một phân tử chỉ từ cấu trúc hóa học của nó. “Các công nghệ hiện nay rất hứa hẹn,” Deng nhận định, “nhưng độ chính xác và khả năng khái quát của chúng vẫn cần được cải thiện đáng kể.”
Ngô Thành
