Học máy tìm thấy các peptide quyền lực có thể thúc đẩy sự phân phối thuốc

Bệnh loạn dưỡng cơ Duchenne (DMD), một bệnh di truyền hiếm gặp thường được phát hiện ở các nam thanh niên, làm yếu các khối cơ khắp cơ thể cho đến khi tim hoặc phổi không còn hoạt động. Các triệu chứng thường thấy từ khi lên 5 tuổi; khi bệnh tiến triển, bệnh nhân mất đi năng lực đi lại ở tuổi 12. Ngày nay, tuổi thọ trung bình của người mắc bệnh DMD là khoảng 26 tuổi.

Có một tin tốt lành là sau một loại thuốc mang tính đột phá được loan báo vào năm 2019 hướng đích gene đột biến liên quan đến bệnh DMD. Liệu pháp này sử dụng antisense phosphorodiamidate morpholino oligomers (PMO), một phân tử tổng hợp lớn thấm qua các nhân tế bào để sửa đổi gene dystrophin, cho phép tạo ra một loại protein quan trọng đã bị mất trong các bệnh nhân mắc chứng DMD. “Nhưng có một vấn đề với chính bản thân PMO. Nó không bám vào các tế bào tốt như mong muốn”, Carly Schissel, nghiên cứu sinh Khoa Hóa MIT, nói.

Để thúc đẩy việc phân phối thuốc tới các hạt nhân, các nhà nghiên cứu có thể thêm vào thuốc các peptide xuyên tế bào (CPPs), do đó giúp nó có thể thấm qua tế bào và các màng nhân để chạm đến đích cần đến. Nhưng chuỗi peptide nào làm tốt việc này thì vẫn còn là một câu hỏi mù mờ.

Các nhà nghiên cứu MIT hiện đang phát triển một cách tiếp cận hệ thống để giải quyết vấn đề này bằng việc kết hợp hóa thực nghiệm với trí tuệ nhân tạo để khám phá các peptide không độc hại và có độ hoạt hóa cao có thể bám dính vào PMO để hỗ trợ việc phân phối thuốc. Bằng việc phát triển các chuỗi mới, họ hi vọng sẽ gia tốc thật nhanh sự phát triển của các liệu pháp gene cho DMD và các bệnh khác.

Kết quả nghiên cứu của họ đã được xuất bản trên tạp chí Nature Chemistry “Deep learning to design nuclear-targeting abiotic miniproteins” 1. Schissel và Somesh Mohapatra, một nghiên cuus sinh khác của Khoa Khoa học và Kỹ thuật vật liệu MIT là đồng tác giả thứ nhất. Rafael Gomez-Bombarelli, trợ lý giáo sư khoa học và kỹ thuật vật liệu, và Bradley Pentelute, giáo sư hóa học, là tác giả chính. Ngoài ra, nghiên cứu này còn có bảy tác giả khác.

“Việc lựa chọn những peptide mới với một máy tính không phải quá khó. nhưng việc định ra là nó tốt hay xấu mới là khó”, Gomez-Bombarelli nói. “Đổi mới sáng tạo quan trọng của việc này là sử dụng học máy để kết nối chuỗi peptide, cụ thể ở đây là một peptide bao gồm các amino axit phi tự nhiên, để đảm bảo về mặt thực nghiệm độ hoạt hóa sinh học”. 

Giấc mơ dữ liệu 

CPPs là các chuỗi ngắn liên kết, được tạo thành từ 5 đến 20 amino acids. Trong khi mỗi CPP có thể có một tác động tích cực lên việc phân phối thuốc, nhiều CPP liên kết với nhau để có một tác dụng hiệp đồng trong việc mang thuốc vượt qua vạch đích. Các chuỗi dài hơn, bao gồm 30 đến 80 amino acids, đều được gọi là các tiểu protein.

Trước khi một mô hình có thể đem lại những dự đoán đáng giá, các nhà nghiên cứu dựa trên khía cạnh thực nghiệm cần thiết để tạo ra một bộ dữ liệu. Bằng việc trộn và kết hợp 57 loại peptide khác nhau, Schissel và các cộng sự của mình đã có khả năng xay dựng được một thư viện gồm 600 tiểu protein, mỗi loại đều có khả năng gắn kết với PMO. Với thí nghiệm kiểu này, nhóm nghiên cứu đã có thể định lượng được cách từng tiểu protein có thê di chuyển chặng đường của mình qua toàn bộ tế bào.

Quyết định kiểm nghiệm độ hoạt hóa của từng chuỗi, với PMO đã được bám dính hết sức quan trọng. Bởi vì bất kỳ loại thuốc nào sẽ có xu hướng thay đổi độ hoạt hóa của một chuỗi CPP, thật khó để tái tạo dữ liệu hiện có và dữ liệu được tạo ra trong một phòng thí nghiệm, trên cùng các thiết bị, do cùng người thực hiện, đạt được tiêu chuẩn vàng về độ nhất quán trong các bộ dữ liệu học máy.

Một mục tiêu của dự án này là tạo ra một mô hình có thể hoạt động với bất kỳ amino acid nào. Trong khi chỉ có 20 amino acids xuất hiện một cách tự nhiên trong cơ thể con người thì có hàng trăm loại khác đang tồn tại ở đâu đó – giống như một gói mở rộng amino acid trong phát triển thuốc. Để tí hiện chúng trong một mô hình học máy, các nhà nghiên cứu sử dụng mã hóa one-hot, một phương pháp ấn định từng thành phần vào một loạt các biến nhị nhân. Ba amino acids, ví dụ, có thể được tái hiện thành 100, 010, và 001. Để tăng thêm các amino acids mới, số lượng các biến có thể gia tăng, điều đó có nghĩa là các nhà nghiên cứu có thể gặp khó khăn để tái  tạo mô hình của mình với mỗi lần tăng thêm như vậy.

Để giải quyết vấn đề này, thay vào đó, họ đã lựa chọn để tái hiện amino acids với các dấu topo, vốn cần thiết để tạo ra một mã vạch cho từng chuỗi, với mỗi đường trong mã vạch biểu thị sự hiện diện của hoặc thiếu vắng của một cấu trúc bên dưới của một phân tử cụ thể. “Ngay cả nếu trước đây mô hình này không thấy được [một chuỗi] nào, chúng tôi có thể tái hiện nó như một mã vạch, bao gồm cả các quy tắc mà mô hình đã thấy”, Mohapatra, người phụ trách phần phát triển của dự án này, nói. Bằng việc sử dụng hệ tái hiện này, nhóm nghiên cứu đã có thể mở rộng công cụ của mình.

Họ đã huấn luyện một mạng lưới thần kinh tích chập trên một bộ dữ liệu tiểu protein, với 600 tiểu protein được dán nhãn về độ hoạt hóa, chỉ dấu về năng lực xuyên qua tế bào. Đầu tiên, mô hình này sẽ đề xuất các tiểu protein với arginine, một amino acid có thể nhồi đầy một hố trong màng tế bào, nhưng không lý tưởng để giữ tế bào sống. Để giải quyết vấn đề này, họ đã sử dụng một cách tối ưu để làm giảm độ hoạt hóa của arginine.

Cuối cùng, khả năng diễn dịch các dự đoán do mô hình đề xuất là vấn đề chính. Các nhà nghiên cứu có thể đối chiếu các dự đoán của mô hình với mã vạch đại diện của cấu trúc chuỗi. “Thực hiện việc này để làm nổi bật một số vùng nhất định mà mô hình cho rằng đóng vai trò lớn nhất trong  độ hoạt hóa cao”, Schissel nói. “Nó không hoàn hảo, nhưng nó giúp tập trung vào các vùng nhất định. Thông tin đó chắc chắn sẽ giúp chúng tôi trong việc thiết kế các chuỗi mới trong tương lai”.

Thúc đẩy độ phân phối thuốc

Giáo sư Rafael Gomez-Bombarelli

Cuối cùng, mô hình học máy đề xuất các chuỗi hiệu quả hơn bất kỳ các kết quả nào trước đây. Một trong số đó có thể thúc đẩy PMO phân phối tới hiệu quả gấp 50 lần. Bằng việc tiêm vào chuột với các chuỗi do máy tính đề xuất, các nhà nghiên cứu đã đánh giá được các dự đoán và thử nghiệm các tiểu protein không độc.

Vẫn còn quá sớm để nói rằng sản phẩm này sẽ có hiệu quả với các bệnh nhân nhưng việc phân phối PMO tốt hơn theo nhiều cách. Ví dụ, nếu các bệnh nhân tiếp nhận được lượng thuốc ít hơn, họ có thể ít phải chịu đựng những tác dụng phụ ít hơn hoặc cần liều điều trị thấp hơn (PMO là thuốc tiêm tĩnh mạch, quá trình tiêm hàng tuần). Có thể việc điều trị này sẽ ít tốn kém hơn. 

Nhận thức được sự thiếu kết nối của một công trình do các chuyên gia học máy và hóa thực nghiệm, Mohapatra đã đưa mô hình này lên GitHub, cùng với một hướng dẫn thực nghiệm cho những người cũng có sẵn các chuỗi và chất hoạt hóa của mình. Ông cũng lưu ý có rất nhiều người trên khắp thế giới đã chấp thuận mô hình này, áp dụng nó để có được các dự đoán cho một phạm vi lớn của nhiều loại thuốc khac nhau.

Thanh Nhàn tổng hợp

Nguồn: https://phys.org/news/2021-08-machine-sequences-boost-drug-delivery.html

https://www.technologynetworks.com/drug-discovery/news/machine-learning-finds-powerful-peptides-that-could-improve-drug-delivery-351888

—-
1. https://www.nature.com/articles/s41557-021-00766-3

Tìm địa điểm Trường
Gọi trực tiếp
Chat Facebook
Chat Zalo

[flipbook id="1"]