Cải tiến phương pháp lưu trữ dữ liệu bằng DNA
DNA là kho lưu trữ dữ liệu di truyền của nhân loại trong hàng thiên niên kỷ. Với đặc tính bền và nhỏ bé, nó có thể chứa nhiều thông tin đến mức chỉ cần một gram DNA có thể chứa dữ liệu cho 10 triệu giờ video có độ nét cao.
Dù có nhiều tiềm năng song hiện nay, việc sử dụng DNA để lưu trữ dữ liệu vẫn còn hạn chế vì tốn kém nhiều thời gian, chi phí cho việc đọc và ghi dữ liệu.
Một nghiên cứu mới đã tìm cách cải tiến phương pháp lưu trữ dữ liệu bằng DNA dưới dạng mã nhị phân – cùng chuỗi số 0 và 1 được sử dụng trong các máy tính hiện nay. Điều này có thể góp phần giảm chi phí và tăng tốc độ so với việc mã hóa thông tin vào trình tự các khối tạo nên DNA – các tế bào và hầu hết các nghiên cứu khai thác DNA để lưu trữ dữ liệu hiện nay đều đi theo hướng này.
Các nhà nghiên cứu đã công bố kết quả trên tạp chí Nature vào cuối tháng 10 vừa qua. Phương pháp mới rất đơn giản và dễ ứng dụng – 60 tình nguyện viên ở nhiều lĩnh vực khác nhau có thể dùng phương pháp này để lưu trữ văn bản theo ý muốn của họ. Long Qian, một nhà sinh học tổng hợp tính toán tại Đại học Bắc Kinh (Trung Quốc), tác giả của nghiên cứu cho biết, nhiều người trong số đó ban đầu không nghĩ rằng phương pháp này sẽ hiệu quả.
Cách phổ biến nhất để lưu trữ thông tin trong DNA là kết hợp dữ liệu vào trình tự DNA. Quá trình này đòi hỏi phải tổng hợp một chuỗi DNA từ đầu. Albert Keung, một nhà sinh học tổng hợp tại Đại học bang Bắc Carolina ở Raleigh (Mỹ) cho biết, phương pháp này chậm và tốn kém hơn nhiều lần so với lưu trữ dữ liệu điện tử.
Để phát triển một phương pháp rẻ hơn và nhanh hơn, Qian và các đồng nghiệp đã tìm đến hệ gene biểu sinh (epigenome) – một loạt các phân tử mà tế bào sử dụng để kiểm soát hoạt động của gene mà không làm thay đổi trình tự DNA. Chẳng hạn, các phân tử nhóm methyl có thể được bổ sung hoặc loại bớt khỏi DNA để thay đổi chức năng DNA.
Qian và các đồng nghiệp đã phát triển một giải pháp bao gồm một loạt các “viên gạch” DNA (các sợi DNA tổng hợp có thể liên kết với nhau như những viên gạch) ngắn, được chế tạo sẵn – có hoặc không có nhóm methyl – có thể được thêm vào ống phản ứng để tạo thành một chuỗi DNA đang phát triển với mã nhị phân phù hợp. Để truy xuất dữ liệu, các nhà nghiên cứu sử dụng một kỹ thuật giải trình tự DNA giúp phát hiện các nhóm methyl dọc theo chuỗi DNA. Kết quả có thể được diễn giải dưới dạng mã nhị phân, với sự xuất hiện của nhóm methyl tương ứng với 1 và không có nhóm methyl tương ứng với 0.
Keung cho biết, do sử dụng các đoạn DNA chế tạo sẵn, phương pháp này có thể được tối ưu hóa hơn nữa để sản xuất hàng loạt, giúp tiết kiệm chi phí hơn nhiều so với việc tổng hợp một chuỗi DNA riêng cho từng bit thông tin. Ông cho biết, rào cản tiếp theo sẽ là xem xét hệ thống có thể mở rộng quy mô để chứa các tập dữ liệu lớn như thế nào.
Với mục tiêu trên, Qian và các đồng nghiệp đã mã hóa và đưa ra các câu lệnh để tạo ra hình ảnh bản khắc một con hổ từ thời nhà Hán ở Trung Quốc cổ đại và một bức tranh màu về một con gấu trúc giữa khung cảnh xanh tươi. Các hình ảnh được mã hóa thành gần 270.000 số 1 và 0, hay còn gọi là “bit”.
Hiện tại, việc giảm chi phí là điều kiện tiên quyết để phương pháp lưu trữ dữ liệu bằng DNA có thể cạnh tranh so với lưu trữ điện tử. “Lưu trữ DNA còn một chặng đường dài để có thể thương mại hóa”, ông nói. “Nhưng chúng ta vẫn cần những công nghệ đột phá [cho lưu trữ dữ liệu]”.□
Thanh An lược dịch
Nguồn: https://www.nature.com/articles/d41586-024-03443-w
Tin đăng Tia Sáng số 21/2024