Không “mặn mà” với các tính điểm cho công trình khoa học
Thật ra, việc cho điểm một công trình khoa học là rấ khó, vì sự đa dạng và tiềm năng của các lĩnh vực nghiên cứu khoa học. Chẳng hạn như một công trình nghiên cứu y học có thể có nhiều bài báo được công bố trên các “tập san quốc tế” (tôi sẽ quay lại cụm từ này sau), và không phải tập san nào cũng có giá trị như nhau, do đó nếu cứ có một thang điểm cho các bài như thế, tôi e rằng sẽ không công bằng. Tuy nhiên, tôi cũng biết rằng xuất phát từ tình hình ở bên nhà, nên cũng cần có một thang điểm để đánh giá. Ở các nước, họ không có “nghiệm thu” công trình khoa học, bởi vì theo họ dù có nghiệm thu hay đánh giá gì đi nữa thì chuyện cũng đã xảy ra rồi. Công trình tốt hay xấu thì sẽ ảnh hưởng đến sự nghiệp và khả năng xin tài trợ của nhà nghiên cứu về lâu về dài. Do đó, họ có cách kiểm tra “đầu vào” rất kĩ, và do đó tránh được tình trạng “chuyện đã rồi”. Bây giờ tôi sẽ góp ý từng phần trong bản dự thảo qui định nghiệm thu các công trình nghiên cứu cơ bản.
2. Thế nào là “nghiên cứu cơ bản”? Theo tôi, cụm từ này cần phải được định nghĩa cho rõ ràng, chứ không thể chung chung được, và cũng không thể giả định rằng người đọc sẽ hiểu nó có nghĩa gì. Trong nghiên cứu y sinh học, người ta thường xếp những nghiên cứu trong phòng thí nghiệm như sinh học phân tử, như phân tích gien, hay nghiên cứu trên tế bào là “khoa học cơ bản” (basic science), nhưng đó là quan niệm xưa rồi, bởi vì đối với y học nghiên cứu lâm sàng ở bệnh nhân cũng là nghiên cứu cơ bản! Tôi muốn nói rằng rất khó mà nói thế nào là một công trình nghiên cứu cơ bản và ứng dụng. Chẳng hạn như nghiên cứu về việc sử dụng gien cho việc tiên lượng và chẩn đoán bệnh, hay nghiên cứu phát triển mô hình toán để tiên đoán nguy cơ ung thư, chúng ta xem đó là khoa học cơ bản hay không? Thật ra, cái lằn ranh giữa cơ bản và lâm sàng ở đây không có ý nghĩa gì nữa, bởi vì đây là những công trình nghiên cứu mang tính interdiscipline – liên ngành. Do đó, tôi đề nghị bỏ đi cụm từ “khoa học cơ bản”. Không phân biệt cơ bản và ứng dụng gì cả. Anh / chị đã nhận tiền chính phủ, tiền của dân để nghiên cứu, thì anh / chị có trách nhiệm, có nghĩa vụ phải báo cáo những gì anh / chị đã làm, đã phát hiện, đã đem lại lợi ích gì. Đơn giản thế thôi.
3. Nguyên tắc đánh giá. Trong “Điều 2. Nguyên tắc đánh giá” tôi thấy chẳng có gì là nguyên tắc cả, mà có vẻ loên quan đến tổ chức thì đúng hơn. Tôi hiểu chữ “nguyên tắc” theo nghĩa tiếng Anh principle. Nếu là nguyên tắc, thì tôi đề nghị đưa ra cụ thể những nguyên tắc chung để người đọc hiểu rõ thêm về ý nghĩa của bản dự thảo.
4. Điều 3. Hồ sơ đánh giá. Theo tôi một báo cáo tổng hợp và bản thuyết minh (là gì ?) vẫn chưa đủ. Cần phải nói rõ trong báo cáo tổng hợp phải có nội dung như thế nào. Tôi thấy có nhiều báo cáo mà tác giả còn chụp hình những buổi nói chuyện nữa, nó chẳng khoa học tính chút nào cả! Thế còn số liệu thì sao? Một số nơi như Mĩ cơ quan FDA đòi hỏi các công trình nghiên cứu lâm sàng phải công bố tất cả các số liệu, dữ liệu trong một CD, để khi cần họ có thể phân tích và kiểm tra lại xem có gian lận hay lừa đảo hay không. Cần phải có qui định rằng Bộ hay Hội đồng Khoa học có quyền đến kiểm tra số liệu bất cứ lúc nào, nếu cần thiết. Ngoài ra, còn phải nộp tất cả những bài báo đã công bố, tất cả những abstracts đã gửi đi dự hội nghị, những conference papers đã đăng, v.v…
5. Điều 4. Tiêu chí đánh giá. Đây là chỗ cần bàn nhiều nhất. Tôi chỉ có mấy ý kiến ngắn như sau:
(a) Cần phải định nghĩa rõ ràng thế nào là một bài báo khoa học. Theo tôi nên phân loại rạch ròi những bài báo như sau: original paper, review paper, technical commentary, editorial, book chapter, và letter. Tất nhiên, cũng cần xem xét đến abstract, conference paper (ở các nước đã phát triển không ai tính điểm cho mấy loại này, nhưng ở các nước đang phát triển thì họ tính).
(c) Tôi thấy không nên phân loại đề tài “đạt” hay “không đạt”, bởi vì trong thực tế cách phân biệt này có vẻ máy móc quá. Ví dụ (chỉ ví dụ thôi), một công trình có 6 điểm là đạt, nhưng 5.9 điểm thì không đạt! Nó chẳng những thiếu tính thực tế mà còn có khi phản tác dụng. Cách dán nhãn hiệu như thế gây ra một tâm lí tiêu cực (nếu công trình không đạt) và không tốt chút nào cả. Nhà khoa học đều là người lớn cả, không nên xem họ như học trò! Đạt hay không đạt thì đã có điểm rồi; dân trong nghề nhìn vào là biết ngay, đâu cần dán thêm một nhãn hiệu nữa.
(d) Không phải tạp chí trong ISI hay SCI nào cũng có giá trị và uy tín như nhau. Nên nhớ rằng các nước như Singapore, Trung Quốc, thậm chí Thái Lan cũng có một vài tạp chí nằm trong danh sách của ISI và SCI (bởi vì họ có tổ chức hẳn hoi và có hệ thống peer review nghiêm chỉnh), nhưng uy tín của các tạp chí này — như có thể đoán được — cực kì thấp. Nếu theo tiêu chí trong bản dự thảo thì một bài báo trên tờ tạp chí y học Thái Lan (có trong ISI) tương đương với một bài báo trong tạp chí New England Journal of Medicine hay JAMA! Tôi nghĩ không có tác giả nào đồng ý với cách cho điểm này.
Vậy thì phải làm sao cho chính xác hơn? Cách thứ nhất là dựa vào impact factor của tạp chí. Cái impact factor này không phải là hoàn chỉnh, nhưng nó cũng phản ảnh chất lượng và uy tín của tạp chí, và bài báo trên một tạp chí có impact factor cao cũng có xác suất có chất lượng cao.
Nhưng vấn đề ở đây là các tạp chí trong các ngành như toán, vật lí, hóa học … thường có impact factor thấp hơn các ngành “thời thượng” như sinh học phân tử, miễn nhiễm học, di truyền học, v.v… Do đó, nếu chỉ đơn thuần dựa vào impact factor thì sẽ không công bằng.
Để làm cho công bằng hơn là dựa vào vị trí của tạp chí trong chuyên ngành. Chẳng hạn như trong ngành nội tiết học có khoảng 5 tạp chí hàng đầu (trong số 20 tạp chí trong ISI và SCI), và tạp chí số 1 của ngành có impact factor chỉ 6.5 (trong y khoa tạp chí có impact factor cao nhất có thể lên đến 50 – tùy theo năm và thời thế!)
Do đó, tôi nghĩ cách đánh giá khách quan nhất và công bằng nhất là tìm một công thức quân bình giữa impact factor và vị trí của tạp san trong chuyên ngành. Dựa vào impact factor là nhằm khuyến khích nhà khoa học làm nghiên cứu tốt để công bố trên các tập san lớn (như Science, Nature, Cell, PNAS Proceeding of the National Academy of Sciences, v.v…) Dựa vào vị trí của chuyên ngành là nhằm “cứu” (hay nói chính xác hơn là nâng đỡ) những nhà khoa học trong các chuyên ngành hẹp.
Tôi có hỏi một người bạn Mĩ, hiện là giáo sư y khoa tại một trường đại học lớn ở Trung Đông, và được cho biết nhiều đại học ở Trung Đông áp dụng các thang điểm sau đây để đánh giá công trình khoa học. (Tôi chỉ viết lại để tham khảo chứ không mặn mà mấy với kiểu này !)
(*) Nếu bài báo có 2 tác giả, số điểm sẽ được tính bằng 0,8*điểm; nếu có hơn 2 tác giả, số điểm là: 1,8×điểm/n (trong đó, n là số tác giả).
(**) Nếu tác giả đóng góp hơn 1 chương sách trong sách, tổng số điểm là (1+k/c)×điểm (trong đó, k là số chương sách, c là tổng số chương trong sách).
6. Điều 9. Qui trình làm việc. Ở đây tôi thấy có 3 vấn đề: thời gian, appeal, và consistency.
Vấn đề thứ nhất là thời gian “phản biện” không được ghi rõ. Theo tôi hiểu thì Hội đồng chỉ họp một lần và chỉ vài giờ đồng hồ (hay cho luôn 8 tiếng cũng được!) Với một thời gian ngắn như thế thì làm sao đánh giá nghiêm túc công trình khoa học của người ta? Một luận án tiến sĩ trung bình đòi hỏi phải thẩm định trong vòng 3 – 6 tháng. Không thể đánh giá một công trình nghiên cứu tốn hàng mấy năm trời của người ta trong vòng vài giờ đồng hồ, nhất là công trình có liên quan đến sự nghiệp và uy tín của nhà khoa học.
Vấn đề thứ hai là tôi thấy không có cơ chế để cho nhà khoa học “kháng án” (appeal). Nếu nhà khoa học cảm thấy Hội đồng đánh giá không công bằng thì anh ta (hay chị ta) khiếu nại với ai ? Như thế là không công bằng. Mình phán xét người ta, thì cũng để người ta có cơ hội đánh giá lại chứ!
Vấn đề thứ ba là không thấy có cơ chế gì để đảm bảo nhất quán trong khi cho điểm. Giả dụ như Hội đồng có 10 người, và mỗi người đều cho điểm. Nếu cả 10 người đều cho điểm giống nhau hay gần giống nhau thì không có chuyện gì. Nhưng chúng ta biết rằng 9 người 10 ý, cho nên nếu có người cho điểm quá khác nhau thì phải làm sao? Trung bình hóa hay tổng số điểm sẽ không công bằng. Ở đây, không thể đem trò thống kê đơn giản được, mà phải có cách nào đó để tạo công bằng cho công trình và cách cho điểm.
Nói tóm lại, tôi thấy có nhiều vấn đề trong bản dự thảo cần phải xem xét lại, làm cho sáng tỏ hơn, và nhất là công bằng cho cả đôi bên.
Nhưng như đã nói ngay từ đầu tôi không mặn mà với kiểu cho điểm. Theo tôi, tốt hơn hết là tham khảo cách làm việc của các nước trong vùng hay Âu Mĩ để xây dựng một mô hình mới để đánh giá công trình nghiên cứu.
——————-
* Viện nghiên cứu y khoa Garvan
Sydney, Australia