Dự báo dịch tễ học COVID-19: Cần một cơ sở dữ liệu lớn, chi tiết

Từ khi dịch bệnh COVID bắt đầu bùng phát đến nay, các nhà khoa học trên thế giới liên tục đưa ra những mô hình dự báo dịch tễ học khác nhau để tư vấn cho chính phủ các biện pháp phòng chống dịch cho từng giai đoạn. Trong cuộc trao đổi với Tia Sáng, TS.BS Nguyễn Thu Anh, Giám đốc Viện Nghiên cứu Y khoa Woolcock, người đứng đầu một trong các nhóm nghiên cứu độc lập hiếm hoi phân tích mô hình và đưa ra dự báo cho bốn đợt dịch COVID ở Việt Nam, cho biết các nhà khoa học Việt Nam cũng sẽ làm được điều này khi họ được tiếp cận với cơ sở dữ liệu đầy đủ và kịp thời.


TS.BS Nguyễn Thu Anh, Giám đốc Viện Nghiên cứu Y khoa Woolcock

Chị nhận định như thế nào về diễn biến và mức độ phức tạp của đợt dịch thứ tư này?

Dựa trên báo cáo phát hiện ca bệnh và thông tin dịch tễ từ Bộ Y tế và Sở Y tế một số tỉnh/thành phố, chúng tôi cho rằng, đợt dịch này có thể bắt đầu từ giữa tháng 4/2021 hoặc sớm hơn, nên đến khi phát hiện ca đầu tiên thì đợt dịch này đã qua nhiều chu kỳ lây nhiễm. Người dân trong cộng đồng mang virus, khi bị ốm (vì một nguyên nhân nào đó), đã nhập viện và làm lây lan virus trong các bệnh viện. Từ đó, bệnh viện trở thành ổ dịch và tiếp tục phát tán ra ngoài cộng đồng. Quá trình lây lan này đã diễn biến qua nhiều chu kỳ. Dưới đây là ví dụ về một chuỗi lây nhiễm qua ít nhất năm chu kỳ (sơ đồ 1, 2) của ổ dịch tại BV Nhiệt đới TƯ cơ sở 2. Sơ đồ 2 cho thấy khi đang triển khai các biện pháp truy vết tại hai bệnh viện thì chuỗi lây nhiễm đã tới Bắc Ninh và Lạng Sơn, sau đó lan sang Hòa Bình và Bắc Giang, chứng tỏ chúng ta đang đuổi theo dịch. Sơ đồ 3 cho thấy sự phức tạp của các chuỗi lây nhiễm COVID-19 trong cộng đồng, như vậy việc cắt đứt chuỗi lây nhiễm để hạn chế các ổ dịch mới phức tạp hơn và cần thực hiện nhanh, triệt để hơn.

 

Nghĩa là đợt dịch này phức tạp hơn những đợt trước ?

Khi phân tích toàn cảnh diễn biến đợt dịch này, tôi rất lo lắng vì đợt dịch này khác các đợt trước ở Đà Nẵng, Hải Dương. Hai lần trước, dịch chỉ khu trú vào một vài nơi, bắt nguồn từ một vài ca bệnh và chủ yếu lây lan trong nội bộ tỉnh, do đó có thể dồn toàn lực để kiểm soát. Nhưng đợt dịch này chúng ta “túm” và chạy theo đuôi chứ không phải “túm” được đầu: ban đầu, cùng lúc, chúng ta “túm” được nguồn lây từ ca nhập cảnh và nguồn lây từ Bệnh viện Bệnh Nhiệt đới Trung ương; đây là hai đầu của sợi dây, nhưng chúng ta không biết ở giữa có bao nhiêu chu kỳ lây và bao nhiêu người đã bị nhiễm, chưa kể nguồn lây từ Bệnh viện Bệnh Nhiệt đới Trung ương đã tỏa đi nhiều tỉnh/thành phố. Dịch bùng phát đúng vào thời điểm người dân đi lại nhiều, nên thực tế hiện nay số tỉnh phát hiện ra bệnh có thể nhiều hơn con số 29, cho nên tình hình phức tạp hơn rất nhiều.

Chúng ta đều nhắc lại nhiều lần là những ca mắc bệnh mới phát hiện là những ca đã cách ly hoặc ở trong khu vực phong tỏa nên không lây ra ngoài nữa. Tuy nhiên, không dễ để truy vết được tất cả những người tiếp xúc với nguồn lây. Bạn có nhớ đầy đủ, và có biết được trong một tuần qua, bạn đã đi đến đâu và gặp những ai không? Mặt khác, nếu không xét nghiệm kịp thời bên ngoài thì đương nhiên là chậm tìm thấy ca bệnh, và nếu không tìm thấy ca bệnh thì virus tiếp tục lây lan. Còn nếu chủ quan cho rằng, chúng ta tìm thấy hết ca bệnh rồi thì phải lật lại câu hỏi là tại sao chúng ta không phát hiện ra ca bệnh đầu tiên ở Bệnh viện Bệnh Nhiệt đới trung ương, mặc dù chúng ta đã truy vết các ca chuyên gia người Ấn Độ, Trung Quốc và không thấy có mối liên hệ dịch tễ.

 

Theo chị có thể dự báo được đỉnh dịch và đợt này sẽ kết thúc vào thời điểm nào?

Chúng tôi đã xây dựng mô hình dự báo dịch SEIQHCDRO1 với số liệu dịch tễ, lâm sàng, xã hội học của Việt Nam, có tham khảo cách phân tích tổng hợp dữ liệu từ các nước trên thế giới như Anh, Mỹ, Úc, Hàn Quốc, Singapore…2,3,4,5 và tính đến các chiến lược đáp ứng riêng của Việt Nam như truy vết, cách ly và đưa ra các kịch bản sau:


Sơ đồ 1. Chuỗi lây nhiễm COVID-19 từ chuyên gia Trung Quốc (không bao gồm 17 ca chưa công bố nguồn lây).

Kịch bản 1 – đang diễn ra hiện nay: Giữ nguyên các biện pháp phòng chống dịch hiện tại như truy vết, cách ly tập trung, cách ly y tế vùng dịch và giãn cách xã hội các khu vực có nguy cơ cao (giảm tiếp xúc xã hội ở mức 20% từ ngày 4/5 và 50% từ ngày 9/5 theo báo cáo gần nhất của Google mobility).

Số ca lây nhiễm cộng đồng cộng dồn từ đầu đợt dịch đến 18/5 dao động từ 1.600 đến 2.600. Đỉnh dịch nằm ở tuần thứ 3-4 tháng 5/2021 với số ca nhiễm mỗi ngày có thể lên tới 150 – 210 ca (đây là số ca thực nhiễm trong cộng đồng, không phải số ca phát hiện và báo cáo). Dịch có thể kết thúc vào giữa hoặc cuối tháng 6/2021 với tổng cộng từ 4.100 – 6.600. Tuy nhiên, do chúng tôi không có đủ thông tin chi tiết về ổ dịch tại Bắc Giang nên có thể tình hình dịch sẽ nghiêm trọng hơn.

Kịch bản 2: Thực hiện giãn cách xã hội, giảm tiếp xúc trên quy mô cấp tỉnh/thành với các tỉnh có nguy cơ cao, có số ca nhiễm mới tăng nhanh (giảm tiếp xúc xã hội ở mức 20% từ ngày 4/5, 50% từ ngày 9/5 và 60% từ ngày 24/5).

Đỉnh dịch vẫn ở tuần thứ 3-4 tháng 5/2021 tuy nhiên dịch có thể kết thúc sớm hơn 10 ngày với số ca tích lũy ít hơn, dao động từ tổng cộng 2.900 – 4.500 ca.

 

 


Sơ đồ 2. 5 vòng của chuỗi lây nhiễm COVID-19 từ Bệnh viện Nhiệt đới trung ương (27/4 – 11/5/ 2021).

 

Làm thế nào để chúng ta tính được mức độ giãn cách của cư dân và tác động của nó lên hai kịch bản trên?

Rất may mắn là chúng ta có dữ liệu của Google mobility report, họ ghi lại hết mức độ thay đổi sự dịch chuyển của người dân trên toàn quốc cũng như theo từng tỉnh thành phố. Dữ liệu đó cho thấy nếu người dân giảm đi lại 20%, 40% thì kịch bản lây bệnh tương ứng là như thế nào. Chúng ta kiểm chứng rất rõ với trường hợp đợt dịch ở Hải Dương: khi giãn cách giảm đi lại tiếp xúc xã hội tới 80% thì số ca bệnh giảm như thế nào.

 

Trước đây có ý kiến cho rằng dữ liệu y tế nói riêng và dữ liệu nói chung khá thiếu và tản mát, vậy làm sao các chị có đủ dữ liệu để xử lý?

Quả thực là chúng tôi phải tổng hợp từ nhiều nguồn: thứ nhất là từng ca bệnh được thông báo trên trang web của Bộ Y tế, thứ hai là các dữ liệu đăng công khai trên website của các sở y tế hoặc là CDC của các tỉnh về tình hình khai báo dịch tễ của các ca bệnh. Chúng tôi cũng thu thập thông tin từ các báo, nhưng nguồn thông tin này phải kiểm chứng trước khi sử dụng.

 

Nhưng nói thực là dữ liệu vẫn không đủ dùng, nên chúng tôi phải xin tài trợ và điều tra khảo sát riêng. Với nguồn tài trợ của Bộ Ngoại giao thương mại Úc, Viện chúng tôi đã hợp tác với một số CDC và Bệnh viện Bệnh Nhiệt đới Trung ương để triển khai khảo sát lưu hành huyết thanh học sau khi dịch bệnh được kiểm soát ở Đà Nẵng, Hải Dương, Hạ Lôi (Vĩnh Phúc), Quảng Ninh để đánh giá xem thực sự có bao nhiêu người bị nhiễm virus, trong số đó có bao nhiêu người đã được phát hiện, bao nhiêu người không được phát hiện. Đồng thời, Viện chúng tôi cũng có hợp tác với Bệnh viện Bệnh Nhiệt đới trung ương để phân tích các dữ liệu về lâm sàng như tỉ lệ bệnh nhân có triệu chứng, tỉ lệ ủ bệnh, thời gian nằm viện, thời gian từ lúc chẩn đoán cho tới lúc nằm điều trị hồi sức cấp cứu. Những số liệu đó được chúng tôi sử dụng để làm ước tính dự báo.

Ngoài ra, để bổ sung các dữ liệu còn thiếu và đối chiếu với các nghiên cứu trên thế giới, chúng tôi thu thập và sử dụng kết quả của các nghiên cứu systematic review (phân tích hệ thống) hoặc là meta annalysis (phân tích gộp). Ví dụ như thời gian ủ bệnh của Việt Nam cũng khác so với thế giới, số liệu của chúng tôi thu thập là 6.4 ngày, ở Trung Quốc là 5.2 ngày, còn trên thế giới dao động nhiều lắm, từ 2-14 ngày. Khi khoảng thời gian dao động lớn như vậy, chúng tôi phải phân tích tất cả các nghiên cứu đó để đưa ra một khoảng tin cậy rồi dùng phương pháp phân tích độ nhậy (sensitivity analysis) để chọn con số phù hợp.

Thời gian phân tích dữ liệu như vậy mất tới mấy tháng và luôn phải cập nhật, để đủ cho việc phát triển hai sản phẩm, một là mô hình dự báo dịch như tôi vừa kể trên; hai là dashboard (bảng tổng hợp dữ liệu) về dịch bệnh, có nhiều thông tin rất cụ thể như tỉ lệ tử vong theo tuổi, theo giới, lây do tiếp xúc gần thì lây qua đâu? qua hộ gia đình hay quán ăn, cơ quan để đưa ra các khuyến cáo.

 

 


Sơ đồ 3. Mối liên hệ phức tạp của các chuỗi lây nhiễm COVID-19 trong cộng đồng (27/4 – 11/5/2021).

 

 

Sai số của mô hình này tới đâu? Những yếu tố nào tác động tới sai số?

Mô hình này đã được kiểm chứng với hai đợt bùng phát dịch tại Đà Nẵng và Hải Dương, cho kết quả có độ chính xác cao, sai số dưới 5%. Tuy nhiên, ước tính quy mô dịch của Hà Nội và thành phố Hồ Chí Minh của đợt dịch Hải Dương tháng 1-2/2021 thì không thành công, vì số ca bệnh quá nhỏ nên độ dao động rất lớn. Với hai vụ  dịch tại Hải Dương (1-2/2021) và Đà Nẵng (7-8/2020), số bệnh nhân đủ lớn nên độ dao động trong mô hình toán học sẽ nhỏ lại.

 

Về dữ liệu, chúng ta cũng có một vấn đề là dữ liệu không đầy đủ, chi tiết và không được tập hợp một cách hệ thống. Ở thời điểm xảy ra vụ dịch Đà Nẵng (7-8/2020), chúng tôi vẫn tổng hợp được thông tin để làm dashboard vì Sở Y tế Đà Nẵng đã thu thập và chia sẻ các thông tin rất chi tiết, hữu ích và hệ thống. Tuy nhiên ở các vụ dịch sau, thông tin ở trên website https://ncov.moh.gov.vn/ không còn đủ chi tiết nữa nên hiện nay chúng tôi đã phải lược bỏ một số biểu đồ trên dashboard. Tuy vậy về cơ bản thì dashboard dành cho những người không có chuyên môn sâu vẫn nhìn thấy được quy mô của dịch.

Nói thêm là với mỗi ca bệnh, nhất là các ca bệnh có nguồn lây không rõ ràng, có khi chúng tôi phải thảo luận trong nhiều giờ là trường hợp này lây ở đâu, có thực sự là nguồn lây đó không hay không rõ nguồn lây, rồi những chỉ số như thế này có phù hợp không. Ngoài ra, nhờ đi khảo sát trên thực tế nên chúng tôi cũng nhận thấy ngoài các ca bệnh được phát hiện, vẫn còn một số ca trong cộng đồng không phát hiện được. Nhưng nhờ các biện pháp phong tỏa chặt chẽ, số ca bị sót rất nhỏ và chỉ nằm trong vùng phong tỏa và tự khỏi mà không lây cho ai nữa. Rõ ràng, đây là những ca không truy vết được và nếu không bị phong tỏa chặt chẽ, họ có thể là nguồn lây tiềm tàng trong cộng đồng.


Cán bộ y tế lấy mẫu xét nghiệm xuyên đêm ở Bắc Giang. Ảnh: Website Bộ Y tế. 

Từ những mô hình của mình, chị có khuyến nghị gì cho công tác chống dịch đợt này?

Tôi đánh giá là đợt dịch này sẽ kiểm soát được, nhưng sẽ kiểm soát trong bao lâu, tổn thất như thế nào? Nếu chúng ta giãn cách xã hội ngay từ khi có số ca bệnh ít, thời gian kiểm soát ngắn, khối lượng công việc của cán bộ phòng chống dịch sẽ vừa phải, còn nếu không làm thế mà làm muộn hơn thì vẫn kiểm soát được, nhưng tiền, công sức bỏ ra nhiều, số người bị bệnh nhiều, có thể sẽ có thêm các ca tử vong và ca chuyển biến nặng. Khi đó hệ thống y tế thực sự gặp áp lực về sức người lẫn thiếu trang thiết bị. Ví dụ, trong những ngày gần đây, chúng ta có thể thấy báo chí đưa tin về hình ảnh các cán bộ y tế kiệt sức, không thể đứng nổi, không được ngủ, làm việc với cường độ cao ở các ổ dịch.

Cần ước tính được khả năng đáp ứng của hệ thống y tế. Nếu không đáp ứng được, việc giãn cách tạm thời trong vòng hai tuần sẽ làm cho đường lây dừng lại, sau đó khối lượng công việc sẽ không tăng quá nhanh và giảm dần xuống. Lúc đó, cán bộ phòng dịch mới thực hiện hiệu quả nhiệm vụ của họ.

 

Tôi tin rằng sự quyết tâm chống dịch là rất lớn nhưng tôi cũng tin rằng không thể ngăn chặn hoàn hảo được, có nghĩa sau một thời gian nhất định, dịch sẽ quay trở lại và lại phải tiếp tục chống dịch. Có điều là chúng ta phải chấp nhận hi sinh kinh tế đến đâu. Nếu chấp nhận có nhiều ca bệnh thì chúng ta đã có sự chuẩn bị như thế nào cho việc có 10 nghìn, 20 nghìn, 30 nghìn ca bệnh? Đồng ý là có các bệnh viện, nhiều máy thở hơn trước đây nhưng việc có 30 nghìn bệnh nhân sẽ gây quá tải lớn cho hệ thống y tế, ảnh hưởng tới công tác chăm sóc sức khỏe cho các bệnh nhân mắc các bệnh khác nữa. Mặt khác khi có nhiều ca bệnh chúng ta có chấp nhận và chuẩn bị cho kịch bản chữa bệnh tại nhà không?

Phân loại mức đáp ứng dịch cho tuyến tỉnh.

 

Trong lúc chưa có vaccine thì phải chủ động phát hiện ca bệnh/ổ dịch tiềm tàng bằng cách xét nghiệm tầm soát để càng tìm được ca bệnh sớm, càng ít phải truy vết và phong tỏa. Những người thuộc nhóm nguy cơ cao như nhân viên y tế, nhân viên khu cách ly, nhân viên dịch vụ (sân bay, bến xe, giao hàng hóa) cần được xét nghiệm định kỳ. Còn khi có nhiều ca bệnh thì lại phải tính đến giãn cách tạm thời. Để đảm bảo vừa chống dịch vừa duy trì kinh tế thì chúng ta linh hoạt bật tắt, giãn cách rồi sau đó lại khôi phục kinh tế chứ không thể để cho bệnh dịch lây nhanh chóng trong cộng đồng được vì hệ lụy về kinh tế sẽ vô cùng lớn.

 

Có ý kiến cho rằng không thể nào giãn cách được nữa, phải phát triển kinh tế chứ

Lịch sử đã cho thấy, dịch bệnh không chỉ tác động lên sức khỏe con người và sự phát triển kinh tế của xã hội, nó còn có thể gây ra tác động tiêu cực trong xã hội. Khi mất kiểm soát thì bệnh dịch sẽ dẫn tới sự thay đổi cả những quan niệm sống của con người. Ví dụ như người dân sẽ phân hóa và kỳ thị, xua đuổi người bị bệnh hoặc nghi mắc bệnh, xu hướng tích trữ hàng hóa tăng cao… Dịch bệnh có thể gây ra bất ổn, đói nghèo, thất nghiệp và làm gia tăng tệ nạn xã hội. Thế hệ trẻ, con em của chúng ta, khi phải sống trong một xã hội bất ổn nhìn nhận về cuộc đời, giá trị sống thế nào khi người lớn xung quanh các em phải tranh giành nhau oxy, giành giật cơ hội sống của nhau. Chúng ta có chấp nhận cái giá đó hay không?

Hơn một năm qua, Việt Nam đã chứng minh là kinh tế vẫn tăng trưởng. Việc tìm ra một thế cân bằng giữa phát triển kinh tế và phòng chống dịch bệnh cần dựa trên bằng chứng khoa học và các đánh giá về chi phí – hiệu quả của các biện pháp can thiệp. Chúng ta sẽ không thể hy vọng quay lại cuộc sống bình thường cũ cho đến khi 60-70% người dân được tiêm vaccine có hiệu lực cao với các chủng virus đang lưu hành.

Chúng tôi đưa ra một kịch bản bật/tắt với các chỉ tiêu rõ ràng để các cơ quan quản lý và mọi người cùng tham khảo. Chúng tôi tham khảo cách làm mà New Zealand đã triển khai và cho thấy hiệu quả, đồng thời điều chỉnh cho phù hợp với tình hình Việt Nam (xem bảng phân loại). □

 

Trân trọng cảm ơn chị về cuộc trao đổi!
Thu Quỳnh
thực hiện

 

Cần cơ sở dữ liệu (database) chi tiết cho phép nhà khoa học tiếp cận
Để đưa ra các mô hình dự báo, các nhà khoa học cần nhất là các dữ liệu chi tiết, đầy đủ và cập nhật kịp thời. Bộ dữ liệu của vụ dịch tại Đà Nẵng, Vĩnh Phúc là một ví dụ tốt và cần được nhân rộng trên toàn quốc. Một cơ sở dữ liệu lớn cho toàn quốc sẽ giúp các nhà khoa học có thể đóng góp nhiều hơn, đồng thời giúp cho chúng ta chuẩn bị cho các vụ dịch trong tương lai. Đó là nếu các nhà khoa học độc lập được có một vị trí trong công cuộc phòng chống dịch.

—-

Chú thích:

SEIQHCDRO là một mô hình đa thành phần mở rộng của mô hình SEIR, gồm 9 thành phần: S (Susceptible), E (Exposed), I (Infected), Q (Quarantined), H (Hospitalised), C (Critical), D (Death), R (Recovered), O (Other-recovered).

2 Nicholas G. Davies et. al. Estimated transmissibility and impact of SARS-CoV-2 lineage B.1.1.7 in England. Science  09 Apr 2021: 372(6538), eabg3055. http://doi.org/10.1126/science.abg3055

3 Balram Rai et. al. Estimates of serial interval for COVID-19: A systematic review and meta-analysis. Clin Epidemiol Glob Health. 2021 January-March; 9: 157–161. http://doi.org/10.1016/j.cegh.2020.08.007

4 https://aci.health.nsw.gov.au/covid-19/critical-intelligence-unit

5 Malahat Khalili et. al. Epidemiological characteristics of COVID-19: a systematic review and meta-analysis. Epidemiol Infect. 2020; 148: e130. http://doi.org/10.1017/S0950268820001430

Tác giả