Thuật toán dự đoán nguy cơ bùng phát bệnh tiêu chảy do biến đổi khí hậu
Các nhà nghiên cứu Việt Nam và nước ngoài đã phát triển một hệ cảnh báo sớm bệnh tiêu chảy cho Việt Nam, Nepal, và Đài Loan bằng các thuật toán đa dạng. Với nỗ lực này, họ mong muốn có được một hệ cảnh báo sớm bệnh tiêu chảy đa quốc gia trước hàng tuần đến hàng tháng để kịp thời có những kế hoạch “đón lõng” trong bối cảnh biến đổi khí hậu.
Sự gia tăng của các sự kiện khí hậu cực đoan đang làm giới chuyên môn lo ngại khi có nhiều kết quả nghiên cứu cho thấy nó liên quan đến sự bùng phát của nhiều loại bệnh truyền nhiễm, trong đó có bệnh tiêu chảy – một trong tám nguyên nhân hàng đầu dẫn đến sự tử vong ở mọi lứa tuổi với con số khoảng 1,2 triệu. Thêm vào đó, căn bệnh này có thể ảnh hưởng đến những yếu tố khác như làm giảm sự phát triển của trẻ hoặc gia tăng nguy cơ của các bệnh truyền nhiễm và mãn tính khác.
Mức nhiệt gia tăng trên toàn cầu liên quan đến biến đổi khí hậu có thể thúc đẩy sự tăng trưởng, phân bố của mầm bệnh, trong đó có căn bệnh tiêu chảy thông qua đường ăn uống. Trong khi đó, cộng đồng dân cư ở nhiều quốc gia đang phát triển thiếu khả năng tiếp cận nước sạch nên sử dụng nhiều nguồn nước không đảm bảo làm tăng nguy cơ tiếp xúc với mầm bệnh. Đây là một trong những lý do cần có những hệ thống cảnh báo sớm để đảm bảo các cộng đồng dân cư có thể lường trước được những nguy cơ, qua đó sẵn sàng ứng phó.
Để phát triển một hệ như vậy, nhóm các nhà khoa học ở Mỹ, Nepal, Việt Nam (ĐH Huế), Thụy Điển, Đài Loan đã sử dụng dữ liệu bệnh tiêu chảy tại 75 huyện từ tháng 7/2002 đến tháng 6/2014 của Nepal; 21 quận từ năm 2008 đến 2019 ở Đài Loan; 37 tỉnh từ năm 2000 đến 2015 ở Việt Nam, trong đó Đài Loan; Việt Nam bao gồm người bệnh ở mọi nhóm tuổi và Nepal dưới năm tuổi. Đồng thời, họ cũng sử dụng dữ liệu khí tượng từ Mạng lưới Khí hậu lịch sử toàn cầu, dữ liệu El Niño – Dao động Nam từ Trung tâm Dự đoán Khí hậu quốc gia Mỹ (NOAA), dữ liệu bổ sung của Trung tâm Dự báo thời tiết hạn vừa châu Âu…
Dựa trên cơ sở dữ liệu này, họ đã huấn luyện các mô hình mạng thần kinh nông theo thời gian (shallow Time-Series NN Models) để dự đoán tỉ lệ bệnh tiêu chuẩn ở một vùng cho trước tại một thời gian cho trước; mô hình rừng ngẫu nhiên để đánh giá vì nó hoạt động tốt trong những thiết lập theo thời gian; thuật toán tăng cường gradient (Gradient Boosting Machine) bởi sự xuất sắc của nó trong phân tích dữ liệu dạng bảng và phân tích theo thời gian; mạng thần kinh nhân tạo (Artificial NNs) sử dụng nhiều thần kinh nhân tạo đa lớp để hỗ trợ ra quyết định; mô hình bộ nhớ dài hạn – ngắn hạn (Long-Short Term Memory) để giải quyết các vấn đề phụ thuộc thời gian dài hạn và ngắn hạn.
Các nhà nghiên cứu đã phát triển bốn mô hình khác nhau phù hợp với điều kiện từng nơi, trong đó dữ liệu của Nepal và Việt Nam có sẵn theo tháng và theo tuần của Đài Loan. Mặt khác tỉ lệ lưu hành bệnh tiêu chảy ở từng nơi cũng khác nhau, với tỉ lệ 0,8 trên 1000 người ở Việt Nam, 33,6 trên 1000 người ở Nepal, và 12,2 trên 1000 ở Đài Loan. Ở Nepal, tỉ lệ mắc cao hơn trong những tháng mùa hè và ngược lại, trong khi ở Đài Loan, tỉ lệ mắc cao hơn trong những tháng mùa đông. Tuy nhiên, ở Việt Nam, không có mẫu hình mắc theo mùa như vậy.
Họ kiểm tra sự hiệu quả dự đoán của mô hình bằng việc sử dụng một dữ liệu thử nghiệm và kiểm chứng độ chính xác dự đoán bệnh tiêu chảy có sẵn vào năm trước. Kết quả cho thấy, mặc dù thiếu vắng nhiều dữ liệu có sẵn nhưng hệ thống cảnh báo sớm vẫn có thể dự đoán tỷ lệ mắc bệnh theo thời gian khá tin cậy và có sự tương đồng của dự đoán với dữ liệu. Việc kết hợp các biến thời tiết cùng với tỷ lệ bệnh tật trong lịch sử thường làm tăng độ chính xác dự đoán.
Về tổng thể, khả năng dự đoán của hệ thống cảnh báo sớm ở Đài Loan và Nepal cao hơn Việt Nam, có thể do nguyên nhân thiếu dữ liệu khí tượng ở quy mô vùng ở Việt Nam.
Kết quả được nêu chi tiết trong bài báo “A prototype early warning system for diarrhoeal disease to combat health threats of climate change in the asia-pacific region”, xuất bản trên tạp chí Environmental Research Letters.
Bài đăng Tia Sáng số 21/2024