Nobel Hóa học cho các nhà phát triển AlphaFold AI dự đoán cấu trúc protein

Giải thưởng năm nay vinh danh các công cụ tính toán đã làm thay đổi lĩnh vực sinh học và có tiềm năng cách mạng hóa khám phá thuốc.

David Baker, Demis Hassabis và John Jumper (trái qua phải). Credit: BBVA Foundation

Lần đầu tiên – có thể không phải cuối cùng – một đột phá khoa học từ AI đã được ghi nhận với một giải thưởng Nobel. Giải Nobel Hóa học 2024 đã được trao cho John Jumper và Demis Hassabis tại Google DeepMind ở London, bởi đã phát triển AlphaFold, một công cụ AI có khả năng làm thay đổi cuộc chơi cho dự đoán các cấu trúc protein, và David Baker, tại trường đại học Washington ở Seattle, bởi đã nghiên cứu về thiết kế protein tính toán, được thúc đẩy bằng Ai trong những năm gần đây.

“Tôi hy vọng khi chúng ta nhìn vào AlphaFold, đây sẽ là bằng chứng đầu tiên về tiềm năng đáng kinh ngạc của AI trong gia tốc phát hiện khoa học,” Hassabis nói trong một cuộc họp báo tại DeepMind vào ngày 9/10.

Tác động của AlphaFold, mới chỉ được tiết lộ trong vài năm trở lại đây. Công cụ này sẵn sàng cho các nhà nghiên cứu sử dụng và tăng cường các thực nghiệm mà một thập kỷ trước không thể tưởng tượng nổi. “Đây là một cuộc cách mạng,” theo Christine Orengo, một nhà sinh học tính toán tại trường College London và phòng thí nghiệm của ông đang sử dụng các cấu trúc do AlphaFold dự đoán để khám phá các protein mới.

“Từ lâu chúng tôi đã mơ được học cách dự đoán cấu trúc ba chiều của protein từ việc biết trình tự amino acid của chúng… Trong nhiều thập kỷ, điều này được coi là khôn thể,” chủ tịch Ủy ban Nobel Heiner Linke, nhà nghiên cứu khoa học nano tại ĐH Lund Thụy Điển, nói trong buổi họp báo công bố giải thưởng. Các nhà khoa học đoạt giải năm nay đã “bẻ khóa được mã này”, ông cho biết thêm. Họ chia sẻ giải thưởng trị giá 11 triệu kronor (một triệu USD).

AI thắng giải

DeepMind cho ra mắt AlphaFold vào năm 2018, khi giành chiến thắng lại cuộc thi dự đoán cấu trúc protein Đánh giá tới hạn dự đoán cấu trúc protein (CASP). Nhưng phải đến lần ra mắt thứ hai của mạng thần kinh nhân tạo này vào cuối năm 2020 thì nó mới thực sự làm thay đổi khoa học sự sống. Nhiều dự đoán của AlphaFold2 tại CASP đã chính xác đến mức không thể phân biệt với các cấu trúc protein từ thí nghiệm.Hassabis, đồng sáng lập DeepMind, và Jumper, người đứng đầu nhóm AlphaFold, đã dẫn dắt sự phát triển của AlphaFold2. Để dự đoán các cấu trúc protein, mạng thần kinh tích hợp dữ liệu từ các thứ viện của hàng trăm ngàn cấu trúc và hàng triệu trình tự từ các protein liên quan – nắm giữ thông tin về hình dạng của chúng.
Cụ thể, thành công của AlphaFold là do một phần không nhỏ từ Ngân hàng dữ liệu protein, một kho lưu giữ có sẵn, có thể truy cập được một cách tự do, gồm hơn 200.000 cấu trúc protein được xác định bằng các phương pháp như tinh thể học tia X và kính hiển vi điện tử cryo. “Phải khiêm tốn mà nói rằng từng phút chúng tôi huấn luyện AlphaFold là đều dựa nỗ lực tích lũy trong nhiều năm. Mỗi điểm dữ liệu đều là nỗ lực của ai đó trong nhiều năm đã qua,” Jumper nói trong cuộc họp báo của DeepMind.

Năm 2021, DeepMind đã để bộ mã làm nên AlphaFold2 được tự do truy cập, cùng với dữ liệu cần thiết để huấn luyện mô hình. Một cơ sở dữ liệu AlphaFold, do Phòng thí nghiệm sinh học phân tử châu Âu ở Hinxton, Anh, đang có các cấu trúc của hầu hết các protein của từng cơ thể sống được tái hiện trong các cơ sở dữ liệu di truyền, có khoảng 214 triệu dự đoán. Năm nay, DeepMind công bố phiên bản thứ ba của AlphaFold, có thể mô hình hóa các phân tử khác tương tác với các protein như thuốc.

Cuộc cách mạng mà Jumper, Hassabis và các cộng sự của họ đã tạo ra vẫn còn ở giai đoạn đầu và tác động đầy đủ của AlphaFold với khoa học sẽ cần đến nhiều năm để nắm bắt được hết. Giờ thì công cụ này đang giúp các nhà khoa học tạo ra những cái nhìn mới.

Một nhóm nghiên cứu tiên phong sử dụng công cụ này, cùng với dữ liệu thực nghiệm, đã lập bản đồ phức hợp lỗ nhân – các phức hợp protein lớn trải rộng trên màng nhân, tức lớp màng kép bao bọc xung quanh nhân tế bào nhân thực, một trong những cỗ máy lớn nhất của tế bào chúng ta vận chuyển các phân tử vào và ra khỏi nhân. Năm ngoái, hai nhóm đã sử dụng toàn bộ cơ sở dữ liệu AlphaFold để khám phá những góc xa nhất của vũ trụ protein, nhận diện được các họ protein, các loại gập và các kết nối đáng ngạc nhiên trong cỗ máy sự sống.

Nhiều nhà khoa học hy vọng là AlphaFold và các công cụ AI khác sẽ tryền cảm hứng để chuyển đổi ngành y bởi AlphaFold sẽ làm giảm chi phí và quá trình nhiều bước để phát triển thuốc an toàn. Các nhà khoa học đặt nền tảng cho các vaccine mới đang phát hiện ra là AlphaFold hữu dụng và trong một số trường hợp làm thay đổi cuộc chơi. Nhưng AlphaFold là một bổ sung cho các nghiên cứu thực nghiệm và các cách tiếp cận khác để lên sơ đồ và chỉnh sửa cấu trúc virus cho phát triển vaccine.

Với phần lớn các nhà nghiên cứu, một cấu trúc dự đoán là điểm bắt đầu của một nghiên cứu, không phải điểm kết thúc, theo Jan Kosinski, một nhà mô hình hóa cấu trúc tại EMBL ở Hamburg, Đức. “Tại điểm bắt đầu, đó là nỗi sợ hãi sẽ thay thế sinh học cấu trúc, con người sẽ mất việc làm… Trên thực tế, điều hoàn toàn trái ngược đã xảy ra,” ông nói thêm.

David Jones, một nhà tin sinh học tại University College London hợp tác với DeepMind ở phiên bản ban đầu của AlphaFold, nói những tác động lớn nhất của công cụ này đã thay đổi nhận thức ở các nhà sinh học, “có thể tạo ra những giả thuyết hữu dụng có thể thử nghiệm trong phòng thí nghiệm”.

Buổi họp báo công bố giải Nobel Hóa học.

Sáng tạo các protein mới

Hơn hai thập kỷ trước khi DeepMind nghiên cứu về AlphaFold, nhà sinh lý học tính toán David Baker và cộng sự của ông đã phát triển một công cụ phần mềm, Rosetta, mô hình hóa các cấu trúc protein theo các nguyên tắc vật lý. Công cụ này so sánh các phần nhỏ của các cấu trúc và trình tự protein hiện có để nhận diện một trình tự protein có thể gập theo một hình dạng cụ thể.

Ban đầu, Rosetta được ứng dụng để dự đoán các cấu trúc protein – nó đã là một trong những chủ đề hàng đầu tại CASPs, trước khi có sự nổi trội của AlphaFold. Nhưng Baker sớm nhận ra là mô hình này có thể được đảo ngược để thiết kế các protein hoàn toàn mới.

Công cụ này đã có thành công ban đầu trong việc thiết kế các protein mới, bao gồm các dạng enzyme mới, các protein có thể gắn kết chặt chẽ với các phân tử khác và các hạt nano protein tự lắp ráp giống các con virus (một trong những phương pháp hỗ trợ về cơ bản cho một vaccine COVID-19 đã được phê duyệt).

Khi AlphaFold2 xuất hiện, Baker và nhóm nghiên cứu của mình, bao gồm nhà hóa tính toán Minkyung Baek, giờ làm việc ở ĐH quốc gia Seoul, đã tìm hiểu phần mềm này và ứng dụng vào một số phiên bản dựa trên AI của Rosetta. Phiên bản đầu tiên của mạng lưới RoseTTAFold đã có năng lực gần như AlphaFold2. Kể từ năm 2021, cả hai mạng lưới đều tiếp tục được các nhà phát triển và những nhà khoa học khác cải thiện để giải quyết các thách thức như dự đoán cấu trúc của phức hợp nhiều protein tương tác.

Trong những năm gần đây, nhóm của Baker đã hưởng lợi khi áp dụng máy học: tạo ra những protein mới chưa từng có trong tự nhiên. Một công cụ do nhóm Baker mới phát triển kết hợp RoseTTAFold với các mạng thần kinh khuếch tán tự sinh hình ảnh đã dẫn đến một bước thay đổi trong năng lực thiết kế của các nhà nghiên cứu.

Thúc đẩy tiến trình

Nhiều công cụ đã trở thành cú gia tốc và thúc đẩy dân chủ hóa trong nghiên cứu, Sergey Ovchinnikov, một nhà sinh học tiến hóa tại MIT ở Cambridge từng là nghiên cứu sinh trong phòng thí nghiệm của Baker. Việc sử dụng Rosetta phải mất nhiều tuần để vận hành trên hang trăm bộ xử lý cho một thiết kế protein, một nhiệm vụ mà giờ các công cụ dựa trên AI mới hơn chỉ mất đến vài giây. “Giờ mọi người trên thé giới đều có thể thiết kế protein,” anh nói.

“Tôi đã được truyền cảm hứng từ nhiều người trong lĩnh vực này và cả những người tôi đã được làm việc cùng,” Baker, nói qua điện thoại tại buổi họp báo giải Nobel Hóa học. “Tôi đã đứng trên vai những người khổng lồ.”

Martin Steinegger, một nhà sinh học tính toán tại ĐH Quốc gia Seoul, ví tác động của AlphaFold, RoseTTAFold và các công cụ AI sử dụng trong lĩnh vực sinh học khác như sứ mệnh khám phá mặt trăng Apollo bởi nó đã chứng tỏ kỹ thuật có thể đạt được những gì. “Đây là thời điểm tương tự trong lĩnh vực dự đoán cấu trúc và sinh học cấu trúc – thấy những gì trở thành có thể,” ông nói.

Vẫn có một chút ngạc nhiên về quyết định của Ủy ban Nobel. Với Baker, “phần lớn mọi người đều nghĩ rằng ‘xứng đáng được trao giải, chỉ là chưa biết vào lúc nào’, sau khối lượng công việc mà ông đã thực hiện trong lĩnh vực này”, Jones nói. Jumper, biết là mình và Hassabis đã vào danh sách rút gọn cùng nhiều người khác, nói trong buổi họp báo là ông đã không ngủ được vào đêm trước khi loan báo giải thưởng.

Với Jumper, các cấu trúc được dự đoán mà AlphaFold tạo ra những cơ hội mới cho khám phá khoa học. Hàng triệu nhà khoa học đã sử dụng các công cụ này và ông hy vọng sẽ không lâu nữa thì một người trong số họ sẽ nhận được một cuộc gọi từ Thụy Điển. “Tôi sẽ vô cùng phấn khích nếu sẽ có một giải Nobel cho biết có nghiên cứu được thực hiện với AlphaFold,” ông nói.

Thanh Hương tổng hợp

Nguồn: doi: https://doi.org/10.1038/d41586-024-03214-7

Tác giả

(Visited 250 times, 1 visits today)