AI tối ưu việc phát triển thuốc kháng sinh

Các protein đã tiến hóa để vượt trội tất cả, từ tiếp xúc với các cơ đến tiêu hóa thức ăn đến ghi nhận các loại virus. Để tạo ra các protein ngày một tốt hơn, bao gồm kháng thể, các nhà khoa học đã thường tạo đột biến các amino acids – những đơn vị được sắp xếp thành một chuỗi trình tự để tạo thành các protein – trong những vị trí khác nhau cho đến khi tạo thành protein có một chức năng được cải thiện như dẫn đến một phản hồi miễn dịch mạnh hơn hay thu giữ carbon dioxide từ khí quyển hiệu quả hơn.

Giáo sư hóa sinh Peter S. Kim đồng nghiên cứu một phương pháp dựa trên học máy cho thiết kế thuốc kháng thể. Nguồn: Steve Fisch

Nhưng số lượng các trình tự amino acid có thể được tạo ra nhiều hơn cả số hạt cát trên trái đất. Và việc tìm được protein tốt nhất, do đó, là loại thuốc giàu tiềm năng nhất thường quá đắt đỏ hoặc gần như không thể.

Các nhà khoa học Stanford đã phát triển một phương pháp dựa trên học máy mới để dự đoán chính xác hơn và nhanh hơn những thay đổi phân tử sẽ dẫn đến các loại thuốc kháng thể tốt hơn.

Được xuất bản trên Science, cách tiếp cận này kết hợp cấu trúc 3D của khung protein với các mô hình ngôn ngữ lớn dựa trên các chuỗi amino acid, và cho phép các nhà nghiên cứu tìm thấy, trong vài phút, những đột biến hiếm gặp và được mong chờ có thể là chỉ có thể tìm thấy thông qua các thực nghiệm toàn diện 1.

Do Peter S. Kim, giáo sư hóa sinh và học giả tại Sarafan ChEM-H, và Brian Hie, trợ lý giáo sư kỹ thuật hóa học, dẫn dắt, nhóm nghiên cứu này đã chứng tỏ là họ có thể cải thiện một kháng thể SARS-CoV-2 đã được FDA phê chuẩn, nhưng đã bị ngừng sản xuất do không hiệu quả trước một chủng mới xuất hiện vào tháng 11/2022. Cách tiếp cận của họ dẫn đến kết quả cải thiện khả năng chống virus gấp 25 lần.

“Có nhiều nỗ lực về phát triển AI và thuốc được đặt vào tâm điểm của những dự án đòi hỏi rất nhiều dữ liệu về việc một phân tử nhất định thực hiện một nhiệm vụ nhất định, vì vậy một máy tính có thể học hỏi đủ để thiết kế ra một phiên bản tốt hơn”, giáo sư Kim nói. “Những gi đáng chú ý ở đây là chúng tôi đã chứng tỏ được cấu trúc đó có thể hữu dụng thay thế rất nhiều dữ liệu và máy tính vẫn có thể học hỏi được”.

Giờ thì có cơ hội tối ưu hóa nhiều kháng thể trên thực tế”, Hie nói. Anh cũng là một nhà nghiên cứu ở Viện Arc.

Khi đối mặt với thách thức tìm kiếm chuỗi amino acid cừ khôi nhất, các nhà khoa học sẽ thường phải tạo ra hàng triệu triệu chuỗi và kiểm tra chúng trên những phiên bản đơn giản hóa và thu nhỏ của các hệ sinh vật. Họ hi vọng là loại thuốc tốt nhất có trên đĩa thí nghiệm sẽ là loại thuốc tốt nhất cho con người.

“Có rất nhiều dự đoán rồi kiểm tra”, Hie nói. “Mục tiêu của rất nhiều thuật toán thông minh là loại bỏ phần việc đoán định khỏi chu trình đó”.

Để gia tốc quá trình này, các nhà khoa học đã phát triển các thuật toán học máy giống ChatGPT để rồi huấn luyện chúng trên các chuỗi amino acid của hàng triệu các protein rồi dự đoán các đột biến mong muốn.

Các mô hình này, tuy nhiên, thường chỉ cho các nhà khoa học hướng về các chuỗi mà, một khi được tạo ra trong phòng thí nghiệm, thường không bền hoặc tệ hơn cả nơi chúng bắt đầu.

Đó là bởi vì chức năng của protein phụ thuộc không chỉ vào chuỗi amino acids mà còn vào cấu trúc 3D của chuỗi đó. Ví dụ, để kích hoạt một phản hồi miễn dịch, các kháng thể phải được định hình đúng để gắn với các phân tử có trên bề mặt của các virus.

Vấn đề chính, nhóm nghiên cứu nghĩ, để phát triển một thuật toán dự đoán tốt hơn là cấu trúc. Vì vậy, họ giới hạn danh sách các đột biến có thể có lợi – được xác định bằng mô hình ngôn ngữ lớn dựa trên chuỗi trình tự này – với những đột biến bảo toàn hình dạng 3D của protein đầu.

Vào tháng 12/2022, nhóm nghiên cứu đã thử nghiệm giải pháp của mình lên liệu pháp kháng thể SARS-CoV-2 đã bị ngừng sản xuất.

“Có thể là chính lý thuyết phổ biến về việc cố gắng cải thiện kháng thể đã sai lầm”, Varun Shanker, một học viên cao học lý sinh và là tác giả thứ nhất của nghiên cứu, nói. “Virus quá nhỏ. Nó tiến hóa khi lan truyền qua hàng triệu người để biết chính xác cách đột biến như thế nào có thể tránh được các kháng thể”.

Việc Sử dụng các mô hình dựa trên trình tự để tối ưu protein chỉ tăng gấp đôi hiệu quả nhưng với cách tiếp cận do cấu trúc hướng dẫn của họ, nhóm nghiên cứu đã tăng hiệu quả gấp 25 lần. “Cuối cùng chúng tôi đã bắt được virus”, Shanker nói, anh hiện là một fellow ở Chương trình tập huấn giao thoa Hóa/sinh tại Sarafan ChEM-H.

Dạy các mánh lới mới cho mô hình cũ

Cấu trúc ba chiều của một kháng thể từng được FDA cấp phép sử dụng (thể hiện với màu xanh lá cây và cam) gắn với một protein xuất hiện trên bề mặt virus (màu trắng). Cách tiếp cận mới cho phép nhóm nghiên cứu nhận diện các thay đổi cụ thể với amino acids khiến cho antibody (các khối cầu xanh lam và hồng) hiệu quả gấp 25 lần với virus. | Varun Shanker

Phần lớn các nỗ lực sử dụng AI để thiết kế các loại thuốc tốt hơn đều phụ thuộc vào việc ‘tập luyện’ hoặc ‘tư vấn’ mô hình đều phải tham gia vào việc tạo ra những lượng dữ liệu khổng lồ về chức năng và hiệu suất của các chuỗi protein độc nhất vô nhị. Cách tiếp cận này mất nhiều thời gian và kết quả trong một mô hình được thiết kế cho hiệu suất thực hiện một nhiệm vụ cụ thể cho protein cụ thể.

Mô hình này không đòi hỏi bất kỳ dữ liệu đầu vào nào từ ‘nhiệm vụ’ của protein, về cách nó đã thực hiện nhiệm vụ ấy như thế nào hay bất kỳ thực nghiệm trong phòng thí nghiệm nào. Nguyên nhân là vì cấu trúc gắn bó chặt chẽ với chức năng, sự điều phối của protein trở thành hiệu suất.

Ví dụ với kháng thể COVID, chúng ràng buộc cấu trúc không chỉ để cho chính kháng thể mà còn để kháng thể gắn kết với virus. Từ đó, mô hình này ‘học’ được một số quy tắc của việc gắn kháng thể mà không cần được dạy.

Các thực nghiệm sớm cho thấy cách tiếp cận này có thể phổ quát với các dạng protein khác như các enzyme giúp tổng hợp các phản ứng hóa học trong cơ thể chúng ta. Hơn thế, các nhà nghiên cứu đã tìm thấy rằng mô hình này chỉ ra cho các nhà khoa học 10 protein, và trung bình, một nửa trong số đó đã trở nên thành thạo hơn ở điểm bắt đầu.

Công cụ này có thể được sử dụng để phản hồi nhanh chóng với sự xuất hiện hoặc tiến hóa của bệnh. Nó cũng giúp giảm bớt rào cản trong việc tạo ra các loại thuốc hiệu quả hơn. Việc tạo ra các loại thuốc như vậy có nghĩa là cần liều lượng thuốc ít hơn và điều đó có thể đem lại nhiều lợi ích hơn cho bệnh nhân. Với các bệnh truyền nhiễm như HIV, khi nghiên cứu chứng tỏ các liều của một kháng thể lớn hơn có thể bảo vệ bệnh nhân khỏi lây nhiễm và có thể tạo ra sự chuyển đổi.

Hiện tại, nhóm nghiên cứu đang tìm cách để mọi người có thể truy cập vào mô hình và mã một cách tự do. “Đây là một ví dụ thú vị về quyền lực của học sâu để dân chủ hóa quá trình thiết kế các protein tốt hơn”, Shanker nói. “Điều này không chỉ cho phép con người phát triển các loại thuốc mới mà còn mở ra những địa hạt mới của khám phá khoa học mà từ trước đến nay chưa từng được biết đến”.

Bội Linh tổng hợp

Nguồn: https://news.stanford.edu/stories/2024/07/new-ai-approach-to-faster-more-accurately-predict-improved-antibody-drugs

https://phys.org/news/2024-07-ai-approach-optimizes-antibody-drugs.html

—————————————–

1.https://www.science.org/doi/10.1126/science.adk8946

Tác giả

(Visited 1 times, 1 visits today)