Các môi trường cực đoan đã mã hóa các hệ gene của sinh vật sống ở đó
Hệ gene của một sinh vật là một tập hợp gồm các chỉ thị DNA cần thiết cho sự phát triển, chức năng và tái tạo của nó. Hệ gene của một sinh vật đang sống ngày nay chứa thông tin về cuộc hành trình của nó trên đường tiến hóa được khởi phát với “tổ tiên chung phổ quát đầu tiên” của mọi dạng thức sống trên trái đất và lên tới cực điểm của sinh vật đó.
Được mã hóa trong chính nó, hệ gene của một sinh vật chứa thông tin có thể tiết lộ những kết nối với các tổ tiên của mình và những mối quan hệ họ hàng của nó.
Những chiều khác của hệ gene
Viết trên The Conversation, Kathleen A. Hill, giáo sư sinh học ĐH Western, và Lila Kari, giáo sư khoa học máy tính ĐH Waterloo, cho biết nghiên cứu của mìnhkhám phá giả thuyết là hệ gene của một sinh vật có thể chứa dựng những dạng thông tin khác, ngoài việc lập cây phả hệ hoặc phân loại. “Chúng tôi đặt câu hỏi: có thể hệ gene của một sinh vật chứa đựng thông tin mà có thể cho phép chúng tôi xác định kiểu môi trường mà sinh vật đó sống không?”.
Nhóm nghiên cứu của họ gồm các nhà khoa học máy tính và sinh học ở trường đại học Waterloo và đại học Western đã tìm hiểu về trường hợp của các sinh vật ưa cực (extremophile) – các sinh vật sống và phát triển ở những điều kiện vô cùng khắc nghiệt. Các điều kiện môi trường trải rộng từ phạm vi nhiệt cực đoan như hơn 100o C đến cực lạnh, dưới -12 oC, mức phóng xạ cao hoặc các điều kiện không tưởng về độ acid, áp suất. Trả lời trên Technology Networks, Lila Kari cho rằng “các sinh vật ưa cực là những tạo vật vô cùng thú vị, vì chúng sống ở những vùng rìa của sự sống sót và hơn thế. Bên cạnh sự hấp dẫn đối với cả người trẻ và người già, có một mối quan tâm lớn trong việc khám phá những cơ chế sinh học cho phép chúng tồn tại và thậm chí là sinh trưởng một cách đáng kể trong những môi trường thù địch”.
DNA như một ngôn ngữ
Họ đã nhìn vào DNA của hệ gene như một văn bản viết tay trong bằng một thứ “ngôn ngữ DNA”. Một sợi DNA (hay trình tự DNA) bao gồm một chuỗi các khối cơ bản được sắp xếp lần lượt, gọi là các nucleotide, được xâu thành chuỗi với nhau bằng một khung đường-phosphate. Có bốn khối DNA khác nhau: adenine, cytosine, guanine và thymine (A, C, G, T).
Nhìn một cách thoáng qua, một chuỗi DNA có thể được coi như một dòng chữ, được biết với những “chữ cái” từ “alphabet DNA”. Ví dụ, “CAT” có thể bằng ba chữ cái “DNA” tương ứng với chuỗi DNA gồm ba khối cytosine-adenine-thymine.
Trong những năm 1990, người ta đã khám phá ra nó bằng việc đếm những lần xuất hiện của nhiều chữ DNA trong một đoạn ngắn DNA được tách ra từ hệ gene của một sinh vật, có thể giúp nhận diện các loài của sinh vật đó và vị trí tương quan của nó với các sinh vật khác trong “cây đời”, cây phả hệ tiến hóa.
Cơ chế của việc nhận diện hay phân loại một sinh vật như vậy dựa trên từ DNA đếm được tương tự với quá trình cho phép chúng ta phân biệt một cuốn sách tiếng Anh với một cuốn sách tiếng Pháp: bằng việc lật từng trang ở mỗi cuốn sách cho thấy văn bản tiếng Anh có những lần xuất hiện của từ gồm ba chữ cái “the” trong khi văn bản tiếng Phap có nhiều lần xuất hiện từ gồm ba chữ cái “les”.
Lưu ý là hồ sơ tần suất từ xuất hiện trong mỗi cuốn sách không phụ thuộc vào từng trang mà chúng ta chọn để đọc và cả việc chúng ta xem xét nhiều trang, một trang hay toàn bộ một chương. Tương tự, tần suất hồ sơ của từ DNA trong một hệ gene không phụ thuộc vào vị trí và độ dài của một chuỗi DNA được lựa chọn để tái hiện hệ gene đó.
Trong sinh học, các hồ sơ tần suất xuất hiện chữ DNA có thể đóng vai trò như một “chữ ký hệ gene” của một sinh vật là một khám phá đáng kể, và cho đến bây giờ, vẫn được tin là hồ sơ tần suất chữ DNA của một hệ gene không chỉ hàm chứa thông tin tiến hóa liên quan đến loài (species), giống (genus), họ (family), bộ (order), lớp (class), ngành (phylum), giới (kingdom) hoặc vực (domain) mà sinh vật đó thuộc về.
Nhóm nghiên cứu của họ đã được thiết lập để trả lời việc liệu hồ sơ tần suất chữ DNA có thể tiết lộ các dạng khác của thông tin – ví dụ thông tin liên quan đến dạng môi trường cực đoan mà một vi sinh vật ưa cực sống trong đó.
Những dấu ấn môi trường trong DNA của vi sinh vật ưa cực
Các nhà nghiên cứu đã sử dụng một bộ dữ liệu gồm 700 vi sinh vật ưa cực sống trong điều kiện nhiệt độ cực đoan (cả cực nóng và cực lạnh) hoặc các điều kiện độ pH cực đoan (tính acid hoặc kiềm cực mạnh). Họ sử dụng cả các cách tiếp cận tính toán học máy có giám sát và không giám sát để kiểm tra giả thuyết của mình.
Trong các dạng điều kiện môi trường, họ đã khám phá ra là mình có thể dò được một cách rõ ràng một tín hiệu môi trường chỉ dấu dạng môi trường cực đoan mà một sinh vật sinh sống.
Trong trường hợp của học máy không giám sát, một thuật toán “mù” đã được đưa vào một bộ dữ liệu các chuỗi DNA của vi sinh vật ưa cực (và không có những thông tin khác về phân loại của chúng hay môi trường chúng sống). Thuật toán này sau đó đã được hỏi để phân nhóm các chuỗi DNA trong các cụm trên cơ sở những tương đồng nó có thể tìm thấy giữa các hồ sơ tần suất chữ DNA của chúng.
Các nhà nghiên cứu chờ đợi mọi cụm được khám phá theo cách này có thể là những dòng phân loại: vi khuẩn được đưa vào nhóm vi khuẩn và cổ khuẩn nhóm lại với cổ khuẩn. Họ ngạc nhiên khi thấy điều này không luôn luôn đúng, một số cổ khuẩn và vi khuẩn vẫn có thể được nhóm lại với nhau một cách nhất quán, dù họ sử dụng thuật toán nào.
Chỉ có thể giải thích cho sự tương đồng của chúng mà các thuật toán học máy phát hiện ra là chúng đều là những sinh vật ái nhiệt.
Một khám phá gây sốc
Cây phả hệ, một khung khái niệm được sử dụng trong sinh học tái hiện mối quan hệ gia phả học giữa các loài, có ba giới hạn lớn, gọi là các vực: vi khuẩn, cổ khuẩn và sinh vật nhân thực.
Các sinh vật nhân thực là những vi sinh vật có một nhân có màng bao bọc, và vực này bao gồm động vật, thực vật, nấm và các sinh vật nguyên sinh. Tương phản, vi khuẩn và cổ khuẩn là những sinh vật đơn bào không có nhân có màng bao bọc chứa hệ gene. Những gì có thể phân biệt vi khuẩn với khuẩn cổ là thành phần của thành tế bào.
Ba vực của sự sống khác biệt một cách rõ ràng với nhau và về mặt di truyền, một vi khuẩn khác biệt với một cổ khuẩn như một con gấu bắc cực (sinh vật nhân thực) với một vi khuẩn E. coli.
Sự kỳ vọng do đó là hệ gene của một vi khuẩn và của một cổ khuẩn có thể là càng xa nhau càng tốt trong bất kỳ cụm nào bằng việc đo lường sự tương đồng hệ gene. Phát hiện của các nhà nghiên cứu về một số vi khuẩn và cổ điển nhóm họp với nhau, dường như chỉ bởi chúng đều đáp ứng nhiệt cực đoan, nghĩa là môi trường nhiệt cực đoan mà chúng sống với những thay đổi trên diện rộng, toàn bộ hệ gene và mang tính hệ thống trong ngôn ngữ hệ gene của chúng.
Phát hiện này có phần giống với phát hiện về một chiều hoàn toàn mới của hệ gene, một phát hiện về môi trường, tồn tại cùng với chiều phân loại mà chúng ta đã biết.
Tác động của môi trường với hệ gene
Bên cạnh sự bất ngờ, phát hiện này có thể có những gợi ý cho hiểu biết của chúng ta về sự tiến hóa của sự sống trên trái đất, cũng như dẫn dắt suy nghĩ của chúng ta về cái có thể đón lấy để sống trong không gian bên ngoài trái đất.
Thực vậy, nghiên cứu đang tiến hành của chúng tôi là để khám phá sự tồn tại của một tín hiệu môi trường trong chữ ký hệ gene của các sinh vật ưa cực kháng bức xạ, như Deinococcus radiodurans, vốn có thể sống sót sau khi phơi nhiễm bức xạ cũng như các điều kiện chân không, khử nước, nhiệt độ thấp và acid, và đã chứng tỏ có thể sống sót trong không gian bên ngoài trong vòng ba năm tới.
Tô Vân tổng hợp