Học máy tiết lộ công thức xây dựng protein nhân tạo
Trong một bước đột phá có khả năng ứng dụng ở lĩnh vực y tế, nông nghiệp và năng lượng, nhóm nghiên cứu Trường Kỹ thuật phân tử Pritzker thuộc ĐH Chicago đã phát triển một quy trình dựa trên trí tuệ nhân tạo (AI) sử dụng dữ liệu lớn để thiết kế ra các loại protein mới.
Protein là thành phần cần thiết cho sự sống của tế bào. Nó thực hiện các nhiệm vụ phức tạp và là chất xúc tác cho các phản ứng hóa học. Từ lâu, nhiều nhà khoa học đã tìm cách khai thác sức mạnh này bằng cách thiết kế các protein nhân tạo có thể thực hiện chức năng mới như điều trị bệnh tật, thu giữ carbon hoặc tích lũy năng lượng. Tuy nhiên, nhiều quá trình tạo ra các loại protein như vậy khá chậm chạm vì tính phức tạp của nó và tỷ lệ thất bại cao. Những nghiên cứu trước đây đã tạo ra nhiều phương pháp có thể định hình được cấu trúc protein, nhưng lại khó nắm bắt được chức năng của nó.
Thông qua việc phát triển các mô hình học máy có khả năng xem xét thông tin protein được chọn lọc từ cơ sở dữ liệu hệ gene, các nhà nghiên cứu ở Pritzker đã tìm ra các quy tắc thiết kế protein tương đối đơn giản để có thể tạo ra protein nhân tạo mới. Khi tạo dựng những protein này trong phòng thí nghiệm vật lý, họ thấy rằng chúng hoạt động tốt về mặt hóa học đến mức có thể cạnh tranh được với những loại có sẵn trong tự nhiên.
“Chúng ta đều tự hỏi làm sao một quá trình như tiến hóa lại có thể dẫn đến loại vật liệu hiệu suất cao như protein. Dữ liệu hệ gene chứa lượng thông tin khổng lồ về những quy tắc cơ bản liên quan tới cấu trúc và chức năng của protein. Giờ đây, chúng ta đã có thể nắm được những quy tắc của tự nhiên đó để tự tạo ra protein cho chính mình”, GS. Rama Ranganathan thuộc Khoa Sinh hóa và Sinh học phân tử của trường Pritzker nói. Kết quả nghiên cứu của họ được công bố trong bài báo “An evolution-based model for designing chorismate mutase enzymes” (Mô hình dựa trên tiến hóa để thiết kế các enzyme chorismate mutase), đăng trên Science.
Họ xem xét enzyme chuyển hóa chorismate mutase – một loại protein quan trọng đối với sự sống ở nhiều loài vi khuẩn, nấm và thực vật. Mô hình học máy cho thấy chỉ cần bảo tồn vị trí axit amin và mối tương quan của các cặp axit amin trong quá trình tiến hóa là có thể đủ để dự đoán các chuỗi axit amin nhân tạo mới có các đặc tính của họ protein. “Chúng ta thường cho rằng để xây dựng một cái gì đó, trước tiên phải hiểu sâu sắc cách thức hoạt động của nó. Nhưng ngay cả khi đang tìm hiểu cách thức hoạt động của nó hoặc tại sao nó được dựng lên như vậy, ta vẫn có thể sử dụng phương pháp học sâu để tìm hiểu quy tắc thiết kế của nó, nếu có đủ mẫu dữ liệu”, GS Ranganathan nói.
Sau đó, nhóm nghiên cứu đã tạo ra các gene tổng hợp để mã hóa protein, nhân bản chúng trong vi khuẩn và theo dõi vi khuẩn tạo ra các protein tổng hợp bằng cơ chế tế bào thông thường. Các protein nhân tạo này có chức năng xúc tác tương tự như các protein chorismate mutase tự nhiên.
Do các quy tắc thiết kế tương đối đơn giản, số lượng protein nhân tạo có khả năng được tạo ra vô cùng lớn. “Các quy tắc thiết kế của tự nhiên khá đơn giản, và chúng tôi tin rằng phương pháp tiếp cận tương tự sẽ giúp tìm ra những mô hình thiết kế trong các hệ sinh học phức tạp hơn như hệ sinh thái hoặc não bộ”, GS. Ranganathan cho biết. Mặc dù AI giúp tiết lộ các quy tắc thiết kế nhưng nhóm nghiên cứu vẫn chưa hiểu đầy đủ lý do tại sao những mô hình này lại hoạt động. Do vậy thời gian tới, họ sẽ tiếp tục nghiên cứu để hiểu cách mô hình mang lại kết quả.
Họ hi vọng sử dụng nền tảng này để phát triển những loại protein có thể giải quyết vấn đề xã hội cấp bách như biến đổi khí hậu. GS. Ranganathan và đồng nghiệp đã thành lập công ty Evozyne để thương mại hóa công nghệ này, ứng dụng trong ngành năng lượng, môi trường, xúc tác và nông nghiệp. Họ đã làm việc với Trung tâm khởi nghiệp và đổi mới sáng tạo của ĐH Chicago để đăng kí sáng chế và nhượng quyền tài sản trí tuệ cho công ty.
“Hệ thống này không chỉ dạy chúng ta về cách protein hoạt động và tiến hóa mà còn giúp ta tìm ra giải pháp cho những vấn đề như thu giữ carbon hoặc tích lũy năng lượng. Thậm chí các nghiên cứu về protein có thể giúp ta biết cách hoạt động của mạng thần kinh sâu trong học máy.” GS. Ranganathan nói.
Ngô Hà dịch
Nguồn: https://phys.org/news/2020-07-machine-reveals-recipe-artificial-proteins.html