Cần phát triển khoa học thống kê
Nói đến hai chữ “thống kê” có lẽ nhiều người nghĩ ngay đến những hoạt động mang tính “truyền thống” dưới hình thức như cân, đo, đong, đếm. Ngày xưa ở Âu Châu, giới vua chúa, tu sĩ và các gia đình hoàng tộc sử dụng thống kê như là một công cụ quản lí tài sản, đất đai, nhân sự và dân số. Trong xã hội hiện đại, chính quyền cũng sử dụng thống kê như là một phương tiện quản lí kinh tế - xã hội.
Khoa học thống kê
Nhưng bộ môn thống kê mà tôi muốn bàn ở đây không phải là các hoạt động truyền thống như mô tả trên, mà là khoa học thống kê (statistical science), tức là một bộ môn khoa học thực nghiệm: phát triển giả thiết khoa học, tiến hành thí nghiệm, phân tích dữ liệu, và diễn dịch dữ liệu. Có người thường nghĩ rằng thống kê là một công cụ của khoa học, nhưng tôi nghĩ rằng quan điểm đó không chính xác, vì trong thực tế, nhà thống kê học là không chỉ là người đơn thuần làm phân tích dữ liệu, mà là một nhà khoa học, một nhà suy nghĩ (“thinker”) về nghiên cứu khoa học.
Khoa học thống kê đóng một vai trò cực kì quan trọng, một vai trò không thể thiếu được trong bất cứ công trình nghiên cứu khoa học, nhất là khoa học thực nghiệm như y khoa, sinh học, nông nghiệp, hóa học, và ngay cả xã hội học. Thí nghiệm dựa vào các phương pháp thống kê học có thể cung cấp cho khoa học những câu trả lời khách quan nhất cho những vấn đề khó khăn nhất.
Làm sao chúng ta biết phẫu thuật A có hiệu quả tốt hơn phẫu thuật B? Làm sao chúng ta biết aspirin có thể đem lại lợi ích cho bệnh nhân? Trong số 25 ngàn gen trong cơ thể con người, gen nào có khả năng gây ra ung thư, tiểu đường, loãng xương? Làm sao chúng ta biết một giống lúa mới có sản lượng cao hơn giống lúa cũ? Làm sao chúng ta biết được quá trình học vấn ở cấp phổ thông có ảnh hưởng đến kết quả học tập ở bậc đại học? Tại sao học sinh tiểu học ở nông thôn hay bỏ học? Làm sao chúng ta biết những đặc tính nào của cà phê được người tiêu thụ ưa chuộng, và có sự khác biệt về sở thích giữa nam và nữ hay không? Một số du khách vào Việt Nam có xu hướng “một đi không trở lại”, vậy yếu tố nào đã làm cho họ có xu hướng đó? Làm sao chúng ta biết người dân ủng hộ chính sách A mà không là chính sách B?… Đó là những vấn đề mà thống kê học có thể cung cấp câu trả lời khách quan và đáng tin cậy nhất.
Chẳng hạn như vấn đề bệnh teo cơ delta (có khi gọi là bệnh “chim sệ cánh”) mà ngành y tế nước ta đang đương đầu hiện nay. Cho đến nay dù đã xảy ra hơn 2000 trường hợp trên toàn quốc, mà các chuyên gia vẫn chưa biết chính xác nguyên nhân hay các yếu tố nguy cơ nào gây nên bệnh! Chính vì không có dữ liệu trong tay, cho nên có khá nhiều chuyên gia hàng đầu trong ngành đề xuất nhiều yếu tố nguy cơ dựa vào những phát biểu cá nhân và chung chung như “theo ý kiến của tôi”, hay “qua kinh nghiệm 50 năm hành nghề của tôi”, hay “tôi nghĩ rằng”. Nhưng trong khoa học, không có cái gọi là “theo ý kiến của tôi” hay “theo kinh nghiệm của tôi”, vì khoa học dựa vào dữ liệu thực tế được quan sát và đo lường chính xác (hay ít ra là khá chính xác) để phát hiện một yếu tố nguy cơ cho bệnh tật, hay nói chung là để phát biểu một định đề. Và, để có những dữ liệu đó, nhà khoa học phải tiến hành thí nghiệm. Một thí nghiệm khoa học được bắt đầu bằng một ý tưởng, một giả thiết, và để thử nghiệm giả thiết đó, một qui trình khảo sát phải được tiến hành theo các bước chung như: thiết kế, thu thập dữ liệu, phân tích dữ liệu, và diễn dịch ý nghĩa của dữ liệu. Mỗi một bước trong qui trình đó đều có sự cống hiến quan trọng của thống kê học.
Trong khoa học thống kê, có hai trường phái “cạnh tranh” song song với nhau, đó là trường phái tần số (frequentist school) và trường phái Bayes (Bayesian school). Phần lớn các phương pháp thống kê đang sử dụng ngày nay được phát triển từ trường phái tần số, nhưng hiện nay, trường phái Bayes đang trên đà “chinh phục” khoa học bằng một suy nghĩ “mới” về khoa học và suy luận khoa học. Phương pháp thống kê thuộc trường phái tần số thường đơn giản hơn các phương pháp thuộc trường phái Bayes. Có người từng ví von rằng những ai làm thống kê theo trường phái Bayes là những thiên tài!
Để hiểu sự khác biệt cơ bản giữa hai trường phái này, có lẽ cần phải nói đôi qua vài dòng về triết lí khoa học thống kê bằng một ví dụ về nghiên cứu y khoa. Để biết hai thuật điều trị có hiệu quả giống nhau hay không, nhà nghiên cứu phải thu thập dữ liệu trong hai nhóm bệnh nhân (một nhóm được điều trị bằng phương pháp A, và một nhóm được điều trị bằng phương pháp B). Trường phái tần số đặt câu hỏi rằng “nếu hai thuật điều trị có hiệu quả như nhau, xác suất mà dữ liệu quan sát là bao nhiêu?”, nhưng trường phái Bayes hỏi khác: “Với dữ liệu quan sát được, xác suất mà thuật điều trị A có hiệu quả cao hơn thuật điều trị B là bao nhiêu?”. Tuy hai cách hỏi thoạt đầu mới đọc qua thì chẳng có gì khác nhau, nhưng suy nghĩ kĩ chúng ta sẽ thấy đó là sự khác biệt mang tính triết lí khoa học và ý nghĩa của nó rất quan trọng. Đối với người bác sĩ (hay nhà khoa học nói chung), suy luận theo trường phái Bayes là rất tự nhiên, rất hợp với thực tế. Trong y khoa lâm sàng, người bác sĩ phải sử dụng kết quả xét nghiệm để phán đoán bệnh nhân mắc hay không mắc ung thư (cũng giống như trong nghiên cứu khoa học, chúng ta phải sử dụng số liệu để suy luận về khả năng của một giả thiết).
Khoa học thống kê ở Việt Nam
Trong vòng trên dưới 100 năm qua, thống kê học đã nhanh chóng tiến vào tất cả các lĩnh vực nghiên cứu khoa học, và trong quá trình chinh phục, thống kê học tạo nên những bộ môn nghiên cứu mới. Các bộ môn đó có thể kể đến như biometry (sinh trắc học), technometrics (kĩ thuật trắc học), bioinformatics (thông tin học), psychometry (tâm lí trắc học), anthropometry (nhân trắc học)… Thật vậy, khoa học thống kê đã chi phối đến tất cả các bộ môn khoa học, và ảnh hưởng của các nhà thống kê đã lan tràn đến mọi bộ môn khoa học với sự chinh phục nhanh chóng sánh ngang hàng với Attila, Mohammed, và loài bọ Colorado” (“Statisticians have already over-run every branch of science with a rapidity of conquest rivalled by Attila, Mohammed, and the Colorado beetle” (Maurice Kendall, 1942)).
Tuy khoa học thống kê đã góp phần tạo nên diện mạo khoa học hiện đại ngày nay, nhưng ở nước ta, khoa học thống kê còn rất kém. Trong khi bất cứ đại học nào ở các nước tiên tiến đều có một bộ môn thống kê học, một bộ môn chuyên cung cấp tư vấn về thống kê học cho các nhà khoa học thực nghiệm, thì ở nước ta, các bộ môn khoa học vẫn còn giới hạn ở khoa toán, và chỉ xoay quanh một vài vấn đề căn bản thống kê.
Sự “lạc hậu” về khoa học thống kê ở nước ta đã làm ảnh hưởng không nhỏ đến khoa học nước nhà. Vì các bộ môn khoa học thực nghiệm ở nước ta chưa được sự hỗ trợ từ khoa học thống kê, cho nên rất nhiều nghiên cứu khoa học ở nước ta chưa có chất lượng cao, và chưa thể công bố trên các tập san khoa học quốc tế. Người viết bài này biết rất nhiều trường hợp nhiều nghiên cứu từ Việt Nam chỉ vì không được thiết kế đúng phương pháp, hay việc phân tích dữ liệu chưa đúng tiêu chuẩn khoa học nên bị các tập san khoa học từ chối công bố. Hệ quả là sự hiện diện của khoa học Việt Nam trên trường quốc tế còn quá khiêm tốn. Chỉ tính trong ngành y sinh học mà thôi, trong vòng 40 năm qua, số lượng bài báo từ các nhà khoa học ở Việt Nam chỉ trên dưới con số 300. Con số này cực kì khiêm tốn nếu so với 5.000 từ Thái Lan hay trên 20.000 từ Singapore.
Như đã đề cập phần trên, một công trình nghiên cứu dù có tốn bao nhiêu tiền, bao nhiêu năm tháng, mà không được thiết kế đúng và không được phân tích đúng phương pháp thì không thể xem là “khoa học”. Muốn thiết kế nghiên cứu đúng và phân tích dữ liệu đúng tiêu chuẩn, cần phải có sự đóng góp của khoa học thống kê và nhà thống kê học. Nhưng Việt Nam thiếu các nhà khoa học thống kê. Tuy nước ta có một viện toán học bề thế và có uy tín trên trường quốc tế, thì những môn học thiết thực nhất và căn bản nhất về thống kê ứng dụng lại nhờ các chuyên gia nước ngoài vào giảng dạy ngắn hạn. Mấy năm gần đây, trong quá trình hội nhập với thế giới, chúng ta phát hiện rằng khoa học nước ta còn kém về thống kê ứng dụng, và các cơ quan tài trợ học bổng phải gửi sinh viên ta đi học ở nước ngoài, kể cả… Thái Lan!
Do đó, để nâng cao chất lượng nghiên cứu khoa học ở nước ta, một chiến lược quan trọng cần đặt ra là phát triển khoa học thống kê trong các trường đại học. Chúng ta cần rất nhiều nhà khoa học thống kê trong bất cứ lĩnh vực nghiên cứu nào. Ở nước ta, để phát triển khoa học nói chung và công nghệ sinh học nói riêng, chúng ta cần một đội ngũ nhà khoa học thống kê hơn là cần một đội ngũ nhà toán học. Người viết bài này tin rằng cùng với thế mạnh của toán học Việt Nam hiện nay, đội ngũ các nhà khoa học thống kê gốc Việt ở nước ngoài có thể và có khả năng đóng góp một phần công sức cho chiến lược phát triển khoa học nước nhà.