Từ năm 2015, kỳ thi THPT quốc gia được tổ chức với mục tiêu kép - vừa dùng kết quả để xét công nhận tốt nghiệp THPT, vừa làm căn cứ tuyển sinh đại học, cao đẳng. Với môn Tiếng Anh, chương trình giáo dục phổ thông đặt mục tiêu học sinh khi kết thúc bậc phổ thông có năng lực giao tiếp đạt Bậc 3 theo Khung năng lực ngoại ngữ 6 bậc dùng cho Việt Nam (tương đương trình độ B1 theo Khung tham chiếu ngôn ngữ chung Châu Âu - CEFR).
Hai năm qua, đề thi tiếng Anh đứng trước những ý kiến trái chiều về mức độ khó của đề. Học sinh được kỳ vọng đạt chuẩn B1, nhưng lại phải đối mặt với các bài thi nhiều từ vựng khó đến mức nhiều học sinh dù đã có IELTS 7.0 nhưng vẫn chần chừ không tự tin sau khi làm bài xong.
Phần đọc hiểu thường chiếm tỷ trọng lớn, ít nhất khoảng 30% tổng điểm toàn bài. Do đó, điểm số của học sinh phụ thuộc rất lớn vào khả năng xử lý hai đoạn văn này. Để đánh giá khách quan dựa trên dữ liệu thay vì dựa trên cái nhìn cảm tính về độ khó, nhóm tác giả Trường Đại học Sư phạm Hà Nội và Trường Đại học Ngoại ngữ (Đại học Đà Nẵng) đã phân tích 22 đoạn văn đọc hiểu xuyên suốt 11 năm thi (2015-2025), từ đó đánh giá mức độ hợp lý của các bài đọc hiểu trong kỳ thi tốt nghiệp THPT Quốc gia so với năng lực của học sinh.
Hà Nội có hơn 230 điểm thi tốt nghiệp THPT với 124.000 thí sinh, đông nhất cả nước. Tại điểm thi ở trường THCS và THPT Lương Thế Vinh, gần 700 thí sinh được về chia về 29 phòng. Thí sinh ở điểm này chủ yếu dự thi môn lựa chọn là Tiếng Anh, Lịch sử, Địa lý, Giáo dục kinh tế và pháp luật, Vật lý. Ảnh: Giang Huy
Một số bài đọc đòi hỏi năng lực tương đương sinh viên Mỹ
Để đánh giá một đoạn văn là dễ hay khó, nhóm nghiên cứu đã sử dụng hai thước đo phổ biến trên thế giới là chỉ số Flesch Reading Ease (FRES) và Flesch-Kincaid Grade Level (FKGL).
Cụ thể, chỉ số FRES dùng để chấm điểm mức độ dễ đọc của văn bản; điểm số càng cao thì bài văn càng dễ tiếp thu, và ngược lại, điểm càng thấp thì văn bản càng mang nặng tính hàn lâm, đánh đố người đọc.
Song song đó, thước đo FKGL sẽ giúp quy đổi trực tiếp độ khó này thành cấp độ tương ứng trong hệ thống giáo dục Mỹ. Chẳng hạn, nếu bài đọc đạt chỉ số 10, nghĩa là nó phù hợp với năng lực của học sinh lớp 10; điểm số càng lớn thì văn bản càng đòi hỏi trình độ học vấn cao hơn.
Cả FRES và FKGL đều thu thập hai dữ liệu đầu vào giống nhau là chiều dài câu trung bình (Average Sentence Length) và số lượng âm tiết trung bình trên mỗi từ (Average Syllables per Word), song có cách xử lý số liệu khác nhau để cho ra hai loại thang đo.
Một bài đọc càng bị nhồi nhét nhiều từ vựng dài và cấu trúc câu phức tạp thì hệ thống sẽ tự động xếp hạng độ khó cao hơn. Những bài có lối hành văn cồng kềnh buộc thí sinh phải căng não, tiêu tốn nhiều thời gian và năng lượng nhận thức hơn để xử lý thông tin, qua đó phản ánh mức độ áp lực mà bài thi tạo ra.
Như có thể thấy từ Bảng 1, phần lớn các bài đọc hiểu trong đề thi đạt từ 50 đến 70 điểm trên thang FRES, phù hợp với học sinh từ lớp 9 đến lớp 10 trong hệ thống giáo dục Mỹ theo chỉ số FKGL. Mức độ này có sự tương đồng với kỳ thi tuyển sinh đại học toàn quốc của Hàn Quốc (CSAT). Theo hệ thống phân loại, đây là các văn bản nằm trong ngưỡng từ "Tiêu chuẩn" (Standard) đến "Khá khó" (Fairly Difficult).
Tuy nhiên, một số bài đọc lại có điểm FRES dưới 50. Trong đó có những bài tương đương với yêu cầu đọc hiểu văn bản mức cho sinh viên đại học của Mỹ! Những bài đọc này xuất hiện vào các năm 2015, 2016, 2017, 2019 và 2025.
Đáng chú ý, bài đọc thứ hai trong đề năm 2016 ở mức 22 điểm FRES, rất thấp, thường gặp ở văn bản học thuật hoặc chuyên môn cao. Việc sử dụng các câu văn dài dòng, lắt léo kết hợp cùng hệ thống từ vựng phức tạp vượt quá xa giới hạn của học sinh phổ thông.
Từ vựng hiếm gặp trong đời sống thực tế sẽ khiến học sinh mất nhiều thời gian giải mã
Theo các lý thuyết ngôn ngữ học, vốn từ vựng là yếu tố quyết định trực tiếp đến năng lực đọc hiểu của thí sinh. Về mặt số lượng, để nắm bắt được nội dung cơ bản của một văn bản, thì cứ 100 từ thí sinh phải biết từ 95 từ trở lên. Nếu muốn tự đọc trôi chảy mà không cần tra cứu từ điển, tỷ lệ này phải chạm mốc 98%.
Để đo lường chính xác xem thí sinh thực sự cần bao nhiêu từ vựng để vượt qua các rào cản trên, các nhà khoa học đã tiến hành đếm số lượng theo đơn vị "họ từ" (word families) thay vì từ đơn lẻ. (Ví dụ: các từ chung gốc như care, careful, careless chỉ được tính gộp là một họ từ). Khối lượng họ từ cần thiết này sau đó được đem quy chiếu sang Khung tham chiếu ngôn ngữ chung Châu Âu (CEFR).
Theo hệ quy chiếu này, người học đạt chuẩn đầu ra B1 ở bậc THPT thường chỉ sở hữu từ 2.000 đến 3.000 họ từ thông dụng. Bước sang cấp độ B2, vốn từ vựng mở rộng lên khoảng 4.000 họ từ. Trong khi đó, để làm được bài ở mức như C1 và C2, người học bắt buộc phải làm chủ một khối lượng từ vựng đồ sộ, dao động từ 5.000 đến 9.000 họ từ, tức là gấp 2 - 4,5 lần so với bậc B1.
Những từ rất ít khi xuất hiện trong tiếng Anh thực tế (tần suất thấp) sẽ tạo ra rào cản nhận thức lớn hơn cho người học. Nếu một đoạn đọc cần tới số lượng từ vựng cao mới đạt ngưỡng bao phủ 95-98%, điều đó cho thấy văn bản chứa nhiều từ vựng hiếm gặp, thí sinh sẽ mất nhiều thời gian và công sức để giải mã.
Khi dùng phần mềm quét 22 đoạn văn đọc hiểu, kết quả chỉ ra rằng có 16 đoạn thí sinh cần sở hữu "vốn liếng" từ 2.000 đến 3.000 họ từ để đạt được ngưỡng hiểu 95% này. Vốn từ vựng này được đánh giá là tương đương với năng lực B1, chứng tỏ 16 bài đọc nói trên đã đáp ứng nhiệm vụ đánh giá chuẩn đầu ra đúng như kỳ vọng của Bộ Giáo dục và Đào tạo đối với học sinh trung học phổ thông.
Tuy nhiên, với các bài đọc còn lại, đặc biệt là Bài đọc 2 của các năm 2015, 2016, 2017, 2018 và 2025, 3.000 họ từ mà các em đã miệt mài tích lũy suốt nhiều năm học chỉ như... muối bỏ bể. Để đạt ngưỡng hiểu cơ bản (95%) ở những bài này, học sinh cần biết từ 3.000 đến 5.000 họ từ. Chưa hết, nếu muốn thực sự hiểu trọn vẹn văn bản (98%) để tự tin chọn đáp án, các sĩ tử 18 tuổi phải có một khối lượng từ vựng từ 6.000 đến 10.000 họ từ. Riêng đề thi năm 2025 còn đẩy sự đánh đố này lên mức 14.000 họ từ - và các em phải hoàn thành bài trong quỹ thời gian sít sao.
Nhóm nghiên cứu chỉ ra rằng yêu cầu vốn từ vựng này là một sự kỳ vọng xa rời thực tế đối với mặt bằng chung học sinh trung học phổ thông. Chúng tương đương với các mức độ C1-C2 - mức cao nhất của Khung tham chiếu châu Âu CEFR - vốn dành cho những người dùng tiếng Anh ở mức độ học thuật chuyên sâu.
Câu hỏi về sự công bằng trong một bài thi quốc gia
Việc đề thi năm 2025 khó bất ngờ được lý giải, có thể vì đó là năm tiếng Anh không còn là môn thi bắt buộc, chỉ có khoảng 30% thí sinh lựa chọn thi môn này.
Khi hướng tới mục tiêu đưa tiếng Anh thành ngôn ngữ thứ hai, chúng ta đặt ra kỳ vọng rằng học sinh khi bước chân vào đại học phải có khả năng tự đọc tài liệu, nghiên cứu và làm dự án bằng tiếng Anh.
Một mặt đề thi phải kiểm tra mức độ cơ bản (chuẩn B1) để xét tốt nghiệp cho đại đa số học sinh; mặt khác lại phải cài cắm các văn bản học thuật siêu khó để phân loại thí sinh xét tuyển đại học. Vai trò kép này đã khiến đề thi tiếng Anh có yêu cầu rất cao, đến mức một giáo viên tiếng Anh cho rằng "Sách giáo khoa hiện tại khó có bộ nào đáp ứng được yêu cầu về độ khó của đề tốt nghiệp. Đầu ra của lớp 12 là B1, nhưng đề chắc chắn khó hơn C1".
Sự chênh lệch giữa yêu cầu đề thi và sách giáo khoa vô tình làm trầm trọng thêm khoảng cách cơ hội giữa những học sinh ở các thành phố lớn với học sinh ở vùng nông thôn hoặc có hoàn cảnh khó khăn. Đó là lý do phần đọc hiểu của đề thi năm 2025 với từ "Greenwashing" (tẩy xanh) đã vấp phải nhiều ý kiến phản đối, khi nó đòi hỏi thí sinh không chỉ có vốn từ vựng phong phú mà còn phải hiểu về các vấn đề thời sự.
Học sinh thi tốt nghiệp tại TP.HCM, tháng 6/2026. Ảnh: Quỳnh Trần
Trong khi học sinh ở thành phố có thể theo học những lò luyện IELTS, nguồn tài liệu phong phú, bộ đề chất lượng, nguồn tin tức đa dạng, thì học sinh vùng khó khăn lại có ít cơ hội tiếp cận các học liệu mở rộng. Kiến thức của các em quanh quẩn bên những bài đọc trong sách giáo khoa - vốn không tương xứng độ khó của đề - và những cuốn sách tham khảo có tuổi đời chục năm trước trong thư viện đã cũ. Đã có nghiên cứu chỉ ra, số học liệu, sách, truyện mà một học sinh thuộc nhóm nghèo nhất có không thể sánh được học sinh thuộc nhóm giàu. Trong khi trung bình, mỗi trẻ em ở nhóm giàu có tới 6,8 quyển sách truyện tham khảo thì trẻ ở nhóm nghèo chỉ có 1,6 quyển, tức là cao hơn 4,25 lần.
Rốt cục bài đọc khó của đề thi vô hình trung lại trở thành thước đo cho sự khác biệt về điều kiện kinh tế và khả năng tiếp cận giáo dục của thí sinh, chắn ngang cơ hội bước vào ngưỡng cửa đại học của những em vốn phụ thuộc vào kỳ thi để thay đổi cuộc đời. Và chúng ta cũng chưa biết các bài khó đó ảnh hưởng tới tâm lý chung của học sinh khi thi, đặc biệt là của học sinh ở các vùng trũng lâu nay ít có điều kiện học thêm hay đọc sách, tới mức nào.
Sự liên kết giữa chương trình, sách giáo khoa và việc ra đề thi
Đó là lý do nhóm nghiên cứu cho rằng "cần có một sự liên kết chặt chẽ hơn giữa việc thiết kế chương trình giảng dạy, phát triển sách giáo khoa và công tác đánh giá cấp quốc gia."
Theo đó, đối với khâu ra đề, để bài thi đọc hiểu sát thực tế hơn, ban ra đề nên thay đổi cách chọn từ vựng. Thay vì cố gắng tìm kiếm các từ mới lạ, ít gặp, bài thi nên ưu tiên các từ vựng mang tính ứng dụng cao trong thực tế. Thay vì đưa vào quá nhiều từ vựng hiếm (tần suất thấp) mà học sinh hiếm khi được ôn tập trên lớp, đề thi nên tập trung kiểm tra khả năng vận dụng linh hoạt các họ từ thông dụng (tần suất cao) của các em trong những ngữ cảnh đời sống thực tế.
Bên cạnh đó, cần ứng dụng các công cụ máy tính và phân tích kỹ thuật để xây dựng bộ dữ liệu chính thức, từ đó thiết lập các hướng dẫn ra đề phù hợp.
Còn nếu vẫn đưa các bài đọc khó thì cần đổi mới phương pháp giảng dạy kỹ năng đọc tại nhà trường. Khi đó, thay vì chỉ dựa vào sách giáo khoa, giáo viên chủ động đa dạng hóa chiến lược học tập và bổ sung các nguồn tài liệu thực tế như báo chí hay các tác phẩm tự sự để học sinh dần làm quen với văn bản dài và phức tạp.
Để khắc phục hạn chế về thời gian trên lớp, giáo viên nên khuyến khích học sinh học từ vựng thông qua các phương pháp như sử dụng sách đọc phân cấp (graded readers) hoặc rèn luyện tính tự chủ trong việc học từ vựng ngẫu nhiên. Bên cạnh đó, việc học từ vựng cần được thực hiện theo hệ thống các họ từ, cụm từ kết hợp và các dạng biến đổi thay vì ghi nhớ đơn lẻ. Cuối cùng, việc tăng cường tần suất tiếp xúc với từ vựng qua các hoạt động thực hành hoặc thẻ ghi nhớ là yếu tố then chốt giúp học sinh ghi nhớ lâu hơn và sử dụng ngoại ngữ trôi chảy hơn. Tuy nhiên, cũng chưa thể đánh giá được học sinh vùng trũng sẽ có khả năng tìm kiếm tài liệu và tự học thêm ở mức nào so với học sinh có điều kiện giáo dục thuận lợi.
---
Nguồn tham khảo:
Cao Thi Hong Phuong, Thai Linh Chi, Nguyen Thi My Hang, Analysis of the reading passage difficulty and lexical demands in the Vietnamese high school graduation English tests (2015-2025), The University of Danang - Journal of science and technology, Vol. 24, No.1, 2026.
Multidimensional Inequality in Vietnam, MDRI.
https://vietnam.oxfam.org/latest/publications/research-report-multidimensional-inequality-vietnam