Xây dựng bộ dữ liệu hệ gene đầu tiên mang tính đại diện cho quần thể người Việt

Với hơn 1.000 hệ gene được giải trình tự, cơ sở dữ liệu biến dị di truyền cho quần thể người Việt do Viện Nghiên cứu Dữ liệu lớn VinBigData xây dựng không chỉ là bộ cơ sở dữ liệu quý cho cộng đồng nghiên cứu mà còn tạo tiền đề cho sự phát triển của nghiên cứu y sinh và y học chính xác.


Công đoạn xử lý mẫu được triển khai tại phòng thí nghiệm thuộc Bệnh viện Đa khoa quốc tế Vinmec. 
 
Sau ba năm thực hiện với khoảng đầu tư 4,5 triệu USD, vào ngày 16/12 vừa qua, VinBigdata đã công bố hoàn tất dự án “Xây dựng cơ sở dữ liệu biến dị di truyền cho quần thể người Việt”. Cụ thể, họ đã giải trình tự toàn bộ hệ gene của hơn 1.000 người trưởng thành khỏe mạnh, từ 35-55 tuổi, không có quan hệ huyết thống và có đủ thông tin kiểu hình và nhân khẩu học; phân tích một phần hệ gene hơn 4.000 trường hợp liên quan đến các bệnh lý phổ biến và khả năng đáp ứng thuốc. Kết quả, đã phát hiện hơn 40 triệu biến thể di truyền, trong đó có gần 2 triệu biến thể gene phổ biến đặc trưng cho quần thể người Việt. “Đây là bộ dữ liệu toàn hệ gene người Việt đầu tiên đảm bảo tính đại diện và phổ quát cho quần thể, phù hợp với phân bố dân cư về địa lý (miền Bắc: 37%; miền Trung 22%; miền Nam: 41%) và giới tính (cân bằng tỷ lệ nam nữ). Bên cạnh đó, bộ dữ liệu gen có đầy đủ chú giải về chức năng sinh học cũng như nguy cơ bệnh lý”, TS Võ Sỹ Nam, Giám đốc Trung tâm Tin Y sinh VinBigData, chia sẻ tại buổi lễ công bố hoàn tất dự án. 
 
Tuy nhiên, theo GS.TS Nông Văn Hải, Nguyên viện trưởng Viện nghiên cứu hệ gen, Viện Hàn lâm KH&CN Việt Nam, 1.000 người là một con số lớn, nhưng ông vẫn mong muốn nhà nước và các đơn vị tư nhân trong tương lai có thể đầu tư để nâng lên thành dự án lớn hơn nữa như 10.000 hệ gen hoàn chỉnh hoặc hệ gen mã hóa. “Lĩnh vực này nên nhận được những đầu tư lớn để chúng ta có thẻ bắt kịp với thế giới, và dữ liệu này cũng phải được khai thác một cách hữu hiệu”. 
 
Hiện tại, một phần dữ liệu của dự án đã được mở để cộng đồng truy cập thông qua Hệ thống quản lý, phân tích và chia sẻ dữ liệu y sinh (MASH Portal) (https://genome.vinbigdata.org). Người dùng có thể tra cứu nhằm mục đích tham khảo, phục vụ các nghiên cứu y sinh. Hệ thống cũng cung cấp thử nghiệm một số công cụ phân tích tốc độ cao (từ 30 phút đến 1 giờ) cho dữ liệu toàn hệ gene người. 
 
Sau khi VinBigdata đã hoàn tất dự án này, điều mà mọi người tò mò nhất đó là họ sẽ làm gì với cơ sở dữ liệu mà mình đã thu thập được? “Chúng tôi xem đây là kết quả bước đầu trên con đường hướng tới y học chính xác”, TS Võ Sỹ Nam chia sẻ. Mặc dù đã bắt đầu phát triển trên thế giới nhưng ở Việt Nam, y học chính xác vẫn còn mới manh nha. Vì thế, dự án này được hi vọng sẽ đem lại những hiểu biết rất cơ bản về hệ gene người Việt, qua đó tạo tiền đề cho những hướng nghiên cứu sâu hơn về các bệnh di truyền, các bệnh phổ biến ở người Việt, các đột biến gene liên quan đến bệnh, xây dựng các bộ chỉ thị sinh học phân tử để chẩn đoán bệnh, tìm hiểu mức độ đáp ứng thuốc của người Việt trong tương lai…  
 
Dự kiến, VinBigdata sẽ triển khai những nghiên cứu cụ thể liên quan đến Dược lý Di truyền như những tác dụng có hại của thuốc và y học cá thể. Theo PGS.TS Lê Thị Lý – Trưởng phòng Dược lý Di truyền VinBigData, đồng chủ nhiệm dự án, hiện tại VinBigdata đang cộng tác với nhóm bác sĩ của Viện 108 để thu thập mẫu của các bệnh nhân bị tổn thương gan do thuốc. Ngoài ra nhóm cũng đang cùng Bệnh viện Thống Nhất thiết kế thí nghiệm cho nhóm bệnh nhân bị tác dụng phụ của thuốc chống kết tập tiểu cầu. “Trong tương lai, chúng tôi sẽ thực hiện thêm nhiều dự án tương tự, và hy vọng rằng sẽ có những thực hành cụ thể hơn với quy mô lớn cho người Việt để có thể tối ưu hóa việc điều trị”. 
 

Tác giả

(Visited 16 times, 1 visits today)