Thứ sáu, 4/4/2025, 10:50 (GMT+7)

CAPTCHA: “Cuộc vật lộn”để phân biệt người thật với người giả

Việc phân biệt được con người với các máy tính khác đóng giả làm con người không phải là một điều dễ dàng.

Ảnh: iStock

CAPTCHA là những thử thách phổ biến hiện nay mà chúng ta phải đối mặt để chứng minh rằng mình là người chứ không phải bot (chương trình máy tính thực hiện các tác vụ một cách tự động) khi đăng nhập vào nhiều trang web.

Các trang web và ứng dụng di động từ lâu đã bị các bot tấn công trên quy mô lớn. Các bot độc hại này được lập trình để tự động tiêu thụ một lượng lớn tài nguyên máy tính, đăng tin nhắn rác, thu thập dữ liệu từ các trang web và thậm chí đăng ký và thực hiện xác thực người dùng. Tình trạng này dẫn đến sự ra đời của CAPTCHA - từ viết tắt của Completely Automated Public Turing test to tell Computers and Humans Apart (Bài kiểm tra Turing công khai hoàn toàn tự động để phân biệt máy tính và con người).

Theo nhận xét của một nhà khoa học máy tính, CAPTCHA là lá chắn hiệu quả cho các trang web để ngăn chặn các cuộc tấn công tự động, tăng cường an ninh mạng và cải thiện trải nghiệm của người dùng – ít nhất là trong ngắn hạn. Ví dụ, các cuộc tấn công từ chối dịch vụ tạo ra nút thắt và khiến máy chủ web bị quá tải và không phản hồi. CAPTCHA giúp ngăn chặn các bot tự động thực hiện các cuộc tấn công như vậy và thậm chí là các hoạt động gian lận như gửi tin nhắn rác và tạo tài khoản giả.

Các tổ chức tài chính cũng dựa vào CAPTCHA để chống lại các bot cố gắng đánh cắp dữ liệu của khách hàng. Bên cạnh đó, CAPTCHA cũng cải thiện sự liêm chính của việc bỏ phiếu và thăm dò trực tuyến nhờ vào việc ngăn chặn các bot tự động thao túng kết quả.

Cách CAPTCHA hoạt động

CAPTCHA được thiết kế để hiển thị các câu hỏi hoặc thử thách mà con người có thể dễ dàng trả lời nhưng đối với bot máy tính thì lại rất khó. Trên thực tế, có một số loại CAPTCHA khác nhau: CAPTCHA dựa trên văn bản, dựa trên hình ảnh, dựa trên âm thanh và dựa trên hành vi.

CAPTCHA trong tương lai cũng có thể hoạt động cùng với các hệ thống AI theo thời gian thực, cũng như liên tục thích ứng và phát triển để đi trước các cuộc tấn công tự động.

CAPTCHA dạng văn bản đã rất phổ biến kể từ những ngày đầu của Internet. Loại CAPTCHA này yêu cầu người dùng phải đọc một hình ảnh văn bản phức tạp và bị bóp méo, sau đó nhập câu trả lời vào trường văn bản. Một loại hình CAPTCHA dạng văn bản khác yêu cầu người dùng giải các bài toán đơn giản như "18+5" hoặc "23-7". Tuy nhiên, gần đây thử thách này đã có thể được giải quyết bằng các thuật toán nhận dạng ký tự quang học tiên tiến nhờ vào sự phát triển của AI học sâu.

Và khi văn bản được điều chỉnh để trở nên méo mó và phức tạp hơn, trớ trêu thay, chính con người lại không đưa ra được câu trả lời chính xác .

Một loại CAPTCHA khác là dạng âm thanh sẽ phát một đoạn âm thanh ngắn chứa một chuỗi số hoặc chữ cái do giọng nói của con người hoặc giọng nói tổng hợp thực hiện để người dùng nghe và sau đó nhập vào trường văn bản được cung cấp. Các thông tin này sẽ được xác minh với câu trả lời đúng để xác định xem người dùng có phải là con người hay không. Giống như CAPTCHA dạng văn bản, CAPTCHA âm thanh có thể khó hiểu đối với con người do các yếu tố như tiếng ồn xung quanh, chất lượng âm thanh kém, độ méo âm thanh và giọng nói không quen thuộc.

CAPTCHA dựa trên hình ảnh đã ra đời để làm cho thử thách trở nên khó khăn hơn đối với bot. Người dùng phải xác định các đối tượng cụ thể từ hình ảnh, ví dụ, chọn tất cả các khối hình ảnh có đèn giao thông. Thử thách này tận dụng nhận thức thị giác của con người, vốn vẫn vượt trội hơn hầu hết các bot dựa trên thị giác máy tính. Tuy nhiên, loại CAPTCHA này cũng gây nhầm lẫn cho con người trong nhiều trường hợp.

CAPTCHA dựa trên hành vi phân tích hành vi của người dùng như chuyển động của chuột và kiểu gõ. reCAPTCHA - một CAPTCHA dựa trên hành vi phổ biến - yêu cầu người dùng đánh dấu vào ô "Tôi không phải là robot". Trong quá trình này, reCAPTCHA phân tích chuyển động của chuột và nhấp chuột để phân biệt giữa con người và bot. Con người thường có hành vi đa dạng hơn và khó dự đoán hơn, trong khi bot thường thể hiện các hành động chính xác và nhất quán.

AI và con người

Trong bối cảnh hiện nay, CAPTCHA còn là một chiến trường trong cuộc chiến dường như bất tận giữa AI và con người. Ngày nay, AI đã trở nên tiên tiến hơn, sử dụng các kỹ thuật hiện đại như học sâu và thị giác máy tính để giải quyết các thử thách CAPTCHA.

Chẳng hạn, các thuật toán nhận dạng ký tự quang học đã được cải tiến, khiến CAPTCHA dựa trên văn bản kém hiệu quả hơn. CAPTCHA âm thanh cũng có thể bị công nghệ chuyển giọng nói thành văn bản tiên tiến "đánh bại". Tương tự như vậy, các mô hình AI được đào tạo trên các tập dữ liệu hình ảnh lớn có thể giải quyết nhiều CAPTCHA dựa trên hình ảnh với tỷ lệ chính xác cao .

Ở phía bên kia "chiến trường", các nhà nghiên cứu CAPTCHA đã tạo ra các công nghệ CAPTCHA phức tạp hơn. Ví dụ, reCAPTCHA đánh giá tương tác của người dùng và tính toán khả năng người dùng đó thực sự là con người.

Trớ trêu thay, con người lại đang giúp AI giải quyết các CAPTCHA phức tạp. Một trong những ví dụ tiêu biểu là các "trang trại nhấp chuột" (click farms) thuê một nhóm lớn nhân viên được trả lương thấp để nhấp vào quảng cáo, chẳng hạn như bài đăng trên mạng xã hội, theo dõi tài khoản, viết đánh giá giả và thậm chí giải các câu hỏi CAPTCHA. Công việc của họ là giúp các hệ thống AI hoạt động giống như con người để đánh bại CAPTCHA và các kỹ thuật phòng chống gian lận khác.

Tương lai của CAPTCHA

Trong tương lai, CAPTCHA sẽ bị ảnh hưởng bởi những tiến bộ đang diễn ra trong lĩnh vực AI. Các phương pháp CAPTCHA truyền thống đang trở nên kém hiệu quả hơn, do đó các hệ thống CAPTCHA trong tương lai có khả năng sẽ tập trung nhiều hơn vào việc phân tích hành vi của người dùng, chẳng hạn như cách mọi người tương tác với các trang web, để khiến bot khó bắt chước hành vi đó hơn.

Các trang web có thể chuyển sang sử dụng CAPTCHA sinh trắc học, chẳng hạn như nhận dạng khuôn mặt hoặc quét dấu vân tay, mặc dù những điều này có thể gây ra mối lo ngại về quyền riêng tư. CAPTCHA có thể được thay thế bằng blockchain, sử dụng thông tin xác thực có thể xác minh để xác thực người dùng. Những thông tin xác thực này, do các thực thể đáng tin cậy cấp và được lưu trữ trong ví kỹ thuật số, sẽ giúp đảm bảo các tương tác được thực hiện bởi con người thực sự chứ không phải bot.

CAPTCHA trong tương lai cũng có thể hoạt động cùng với các hệ thống AI theo thời gian thực, cũng như liên tục thích ứng và phát triển để đi trước các cuộc tấn công tự động.

Nguồn: theconversation.com

Bài đăng KH&PT số 1338 (số 14/2025)

Mỹ Hạnh dịch

Trở lại Khoa học - Công nghệTrở lại Khoa học - Công nghệ

Tia Sáng
Chuyên trang tri thức của VnExpress
Tổng biên tập: Phạm Văn Hiếu

Địa chỉ: Tầng 10, Tòa A FPT Tower,
số 10 Phạm Văn Bạch, phường Cầu Giấy, Hà Nội
Điện thoại: (024) 39428445
Email: tiasang@vnexpress.net