Khai thác dữ liệu để hiện đại hóa “thuốc ta”
Việt Nam là một trong những quốc gia có đa dạng sinh học cao nhất thế giới. với khoảng 12.000 loài thực vật.
Trong số đó, khoảng 10.500 cây đã được định danh, và khoảng 3.780 cây (chiếm 36%) có giá trị dược liệu. Các loài dược liệu của Việt Nam chiếm khoảng 11% trong số 35.000 cây dược liệu trên thế giới. Con số này khá thấp vì còn có nhiều cây dược liệu chỉ được đồng bào dân tộc thiểu số (chiếm tới 14% dân số) dùng chữa trị bệnh tật hoặc nâng cao sức khỏe1.
Tại Việt Nam, cây thuốc không chỉ được dùng để chữa những bệnh thông thường mà còn được dùng kèm với một số “thuốc Tây” để chữa những bệnh nguy hiểm khác. Số liệu của Bộ Y tế cho thấy rằng có khoảng 30% bệnh nhân dùng thuốc Đông – Tây y kết hợp. Vì thế, nhu cầu cây thuốc ngày càng tăng, làm cho hàng ngàn tấn cây thuốc quý bị khai thác từ môi trường tự nhiên1.
Với nguồn thực vật đa dạng như vậy, việc chúng ta cần làm là tìm hiểu, định danh, xác nhận cấu trúc những hoạt chất mà ta cho rằng có thể có dược tính quan trọng từ kinh nghiệm dùng cây thuốc trong dân gian. Sau đó, bằng thử nghiệm lâm sàng, ta có thể khẳng định chắc chắn những hoạt tính đã biết (theo kinh nghiệm), hay thậm chí tìm ra những hoạt tính mới, rồi từ đó phát triển thành thuốc. Các loại hoạt chất đã được khoa học các nước phát triển có điều kiện phát triển thành thuốc trước có thể dùng làm mẫu để những người nghiên cứu thảo dược ở nước ta tìm ra và phát triển các loại thuốc từ cây cỏ của nước mình.
Tuy nhiên, khó khăn lớn nhất để Việt Nam phát triển theo hướng này là ít có tài liệu về cây thuốc nam. Ngoài tài liệu về cây thuốc Việt Nam bằng tiếng Anh của Tổ chức Y tế thế giới (WHO) xuất bản lần gần đây nhất là vào năm 1990 và bằng tiếng Việt là của giáo sư Đỗ Tất Lợi3, thì từ đó đến nay có rất ít tài liệu hệ thống lại các cây thuốc, tác dụng, các chất có hoạt tính sinh học và phân bố của các loại cây thuốc này tại Việt Nam.
Hiện tại, trang VIETHERB của nhóm tác giả Lê Thị Lý đã thống kê được khoảng 2.881 loài, 10.887, 458 vị trí địa lý và 8.046 công dụng của các cây thuốc Việt Nam4. Những số liệu này được kết hợp từ nhiều nguồn tài liệu đáng tin cậy trong nước (Cây thuốc, Từ điển cây thuốc Việt Nam) và nước ngoài (KNApSAcK, Tropicos, The Plant List, ChEBI, GBIF). Những số liệu được thống kê trên trang VIETHERB có ưu điểm là rất đặc trưng cho cây thuốc Việt Nam, điều không dễ tìm kiếm được trên các ngân hàng dữ liệu lớn như TCM hoặc KNApSAcK.
Trang này cũng có thêm công cụ tìm kiếm (search engine) để tìm cây bằng tên khoa học và tên thông thường, và tìm các chất bằng tên chất và công thức hóa học (chemical formula). Các các giả còn thiết kế cơ sở dữ liệu cách dùng (công dụng), trong đó có chỉ rõ liên hết hai chiều (binary relationships) giữa cây và nơi dùng, cây thuốc và tác dụng sinh học. Việc kết hợp kiến thức về công dụng của các loài cây, với những cơ sở dữ liệu tập hợp (omics) hiện đại, trong đó có metabolomics, là một bước quan trọng để hiểu rõ hơn tác dụng của các thành phần khác nhau trong cây thuốc lên cơ thể con người 5. Ngày nay, trên thế giới, việc nghiên cứu tập hợp các chất chuyển hóa (metabolomics) đang ngày càng chiếm vị trí quan trọng trong các nghiên cứu về sự tương tác giữa thực vật với môi trường, đặc biệt là giữa thực vật với con người. Hiện nay có rất nhiều cơ sở dữ liệu về các chất chuyển hóa (metabolite) từ nhiều nguồn khác nhau, ví dụ như PubChem, KEGG, trong đó dữ liệu chủ yếu thiên về các chất và các con đường trao đổi chất. Sự liên kết các bộ dữ liệu hóa học các chất chuyển hóa, dữ liệu di truyền, dữ liệu sinh hóa, và dữ liệu dược tính đóng vai trò then chốt trong việc xác định chính xác cách thức cây tạo ra thuốc, rồi từ đó ứng dụng vào sản xuất (xem ảnh minh họa)2. Tuy nhiên, ngoài KNApSAcK, vẫn còn ít các cơ sở dữ liệu lưu giữ những dữ liệu về mối liên hệ giữa các chất này với nguồn gốc sinh hóa và tác dụng của chúng.
Nếu những thông tin về cây thuốc từ những vùng khác nhau và có mục đích sử dụng khác nhau có thể được tổng hợp lại trong một cơ sở dữ liệu, chúng ta có thể dùng cơ sở dữ liệu này có thể hệ thống lại việc sử dụng một số cây nhất định trong nước, và cả thế giới.
Những thông tin về cây thuốc, các hợp chất được tạo ra từ các cây này sẽ tạo điều kiện cho những nghiên cứu sâu hơn về mặt dược học, hóa học sinh hóa và dữ liệu cây thuốc. Các số liệu trong dữ liệu này cũng cho thấy một lỗ hổng trong nghiên cứu cây dược liệu tại Việt Nam, đó là những nghiên cứu sâu về tính năng của các chất riêng rẽ, hơn là các cây. Các nghiên cứu cơ bản về sinh hóa và sinh học tổng hợp vì thế còn gặp nhiều trở ngại.
Tuy nhiên, nhóm tác giả cũng chỉ ra một số hạn chế của công trình này, ví dụ như hầu hết các thông tin trên VIETHERB được thu thập và chuyển đổi bằng tay. Hơn nữa, mặc dù các cây thuốc truyền thống của Việt Nam đã được dùng hàng ngàn năm và được kiểm chứng bằng dẫn chứng khoa học, nhưng vẫn có một số các bài thuốc được thu thập từ nhiều nguồn chưa được kiểm chứng bài bản, ví dụ như từ kinh nghiệm dân gian của đồng bào dân tộc thiểu số chưa qua nghiên cứu dược lý hay lâm sàng. Hiện tại, nhóm nghiên cứu này đang phát triển một hệ thống phản hồi (feedback and consensus) để cho phép người dùng có thể tạo một phiên bản riêng phù hợp với mục tiêu nghiên cứu của họ. Vì vậy, có thêm những nhà nghiên cứu về y học cổ truyền, dược học, hóa học, sinh hóa tham gia để mở rộng hơn, kiểm chứng và hoàn thiện những dữ liệu trên cơ sở dữ liệu này là điều hết sức cần thiết.
Ngoài ra, cơ sở dữ liệu VIETHERB này còn có thể phát huy tác dụng nhiều hơn nữa nếu được bổ sung tên thông thường của cây bằng tiếng Anh (ngoài tên thường gọi tiếng Việt và tên khoa học), chia các chất theo từng nhóm (alkaloid, terpenoid, phenylpropanoid, v.v…) và theo phân tử lượng, đồng thời ghi kèm nguồn tài liệu tham khảo tin cậy (nếu có). Cuối cùng, một cơ sở dữ liệu như VIETHERB nếu được cập nhật thường xuyên sẽ là một nguồn thông tin hết sức giá trị cho những người làm nghiên cứu hay sản xuất trong lĩnh vực sinh hóa, hóa học thực vật cũng như hóa dược. □
——
Tài liệu tham khảo:
[1] Tran TTH (2016). The interface between access and benefit-sharing rules and biotrade in Viet Nam. United Nations Conference on Trade and Development.
[2] Li FS, Weng JK (2017). Demystifying traditional herbal medicine with modern approach. Nature Plants 3:17109. https://doi.org/10.1038/nplants.2017.109
[3] Đỗ Tất Lợi (2004). Những cây thuốc và vị thuốc Việt Nam. NXB Thời Đại. p. 1485.
[4] Nguyen-Vo TH, Le T, Pham D, Nguyen T, Le P, Nguyen A, Nguyen T, Nguyen TN, Nguyen V, Do H, Trinh K, Duong HT, Le L (2019). VIETHERB: A database for Vietnamese herbal species. Journal of Chemical Information and Modeling 59:1. https://doi.org/10.1021/acs.jcim.8b00399
[5] Afendi FM, Okada T, Yamazaki M, Hirai-Morita A, Nakamura Y, Nakamura K, Ikeda S, Takahashi H, Altaf-Ul-Amin M, Darusman LK, Saito K, Kanaya, S. (2012). KNApSAcK family databases: Integrated metabolite–plant species databases for multifaceted plant research. Plant and Cell Physiology 53: e1. https://doi.org/10.1093/pcp/pcr165