Thứ ba, 5/5/2026, 12:05 (GMT+7)

Dừng thu thập ADN vào căn cước là cần thiết trước rủi ro bảo mật gia tăng

Đây có thể là bước đi quan trọng đối với hệ thống dữ liệu công dân, dựa trên nguyên tắc “thu thập tối thiểu, bảo vệ tối đa”.

Ngày 29/4, Chính phủ chính thức bãi bỏ các thủ tục thu thập và cập nhật thông tin sinh trắc học về ADN và giọng nói vào Cơ sở dữ liệu căn cước quốc gia, theo Nghị quyết 22/2026/NQ-CP về Cắt giảm, phân cấp, đơn giản hóa thủ tục hành chính và cắt giảm, đơn giản hóa điều kiện kinh doanh thuộc phạm vi quản lý của Bộ Công an [1].

Quyết định quan trọng này được đưa ra trong bối cảnh những rủi ro bảo mật ngày càng hiện rõ. Thậm chí, một số công ty AI cho biết đã có những AI siêu mạnh đến mức có thể phát hiện lỗ hổng bảo mật trên mọi hệ thống, nếu không kiểm soát có thể sẽ "đe dọa an ninh mạng toàn cầu". Điều đáng lo hơn là chính các công ty phát triển AI dự báo các AI siêu mạnh như vậy sẽ phổ biến chỉ trong 18 tháng nữa.

Người dân đến làm căn cước công dân gắn chip tại TP Thủ Đức ngày 13/3/2021. Ảnh: Quỳnh Trần — Người dân đến làm căn cước công dân gắn chip tại TP Thủ Đức ngày 13/3/2021. Ảnh: *Quỳnh Trần*

Theo GS. Phan Dương Hiệu, trưởng nhóm An ninh mạng - Mật mã tại Trường Viễn Thông thuộc Đại học Bách Khoa Paris, Pháp, động thái "phanh lại" của Chính phủ trong việc hạn chế tập trung những dữ liệu cá nhân nhạy cảm nhất của người dân vào một hệ thống duy nhất là bước đi tích cực.

Trong các phân tích trước đây trên Tia Sáng, GS. Phan Dương Hiệu nhiều lần cảnh báo logic thu thập dữ liệu "càng nhiều càng tốt" mà một số chính phủ và tập đoàn đa quốc gia đang áp dụng. Ông khẳng định việc tăng dần các công cụ xác thực sinh trắc từ dấu vân tay, khuôn mặt, giọng nói đến ADN là rất rủi ro.

Nếu mật khẩu bị lộ, người dùng có thể thay đổi, nhưng nếu thông tin sinh trắc bị lộ và bị lạm dụng, họ gần như không có cơ hội "đặt lại" danh tính sinh học của mình. Một khi đã mất quyền kiểm soát các dữ liệu này, họ sẽ mất nó vĩnh viễn.[2]

Hơn nữa, đối với nhà nước, việc dùng dữ liệu ADN để định danh là một phương án dư thừa dữ liệu khi có nhiều phương pháp khác cũng rất hiệu quả để định danh. "Chúng ta cũng không gặp khủng hoảng an ninh và cũng không có mấy nước dùng dữ liệu gen để xác thực, định danh thông thường," GS. Phan Dương Hiệu, cũng là cố vấn khoa học của Phòng Nghiên cứu Mật mã tiên tiến do Ban Cơ yếu Chính phủ và Viện Nghiên cứu cao cấp về Toán tổ chức, nhấn mạnh [3].

Chính vì vậy, việc hạn chế mở rộng thu thập các lớp dữ liệu nhạy cảm nhất không chỉ là quyết định kỹ thuật, mà còn là lựa chọn chiến lược về bảo mật quốc gia và quyền riêng tư lâu dài.

Lý do thu thập dữ liệu sinh trắc học

Từ trước tới nay, việc Chính phủ thu thập dữ liệu sinh trắc học chủ yếu nhằm nâng cao độ chính xác trong xác thực danh tính và hạn chế nguy cơ giả mạo giấy tờ.

Ví dụ, trong một số hợp đồng đất đai, các bên giao kết với nhau có thể lăn tay (điểm chỉ) bên cạnh thông tin số căn cước công dân để tránh làm giả giấy tờ căn cước hoặc phát sinh tranh chấp, bởi dấu vân tay là đặc điểm sinh trắc học độc nhất của mỗi người.

Khi các giao dịch hành chính, tài chính, y tế... chuyển dần sang môi trường số, việc xác thực "bạn có thực sự là bạn hay không" trở nên tối quan trọng. Những phương thức truyền thống như mật khẩu, mã OTP hay thẻ vật lý ngày càng bộc lộ giới hạn do có thể bị đánh cắp, chia sẻ hoặc tấn công.

Trong khi đó, sinh trắc học được xem như lớp bảo mật cao hơn, vì chúng gắn chặt với cơ thể con người và gần như không thể thay đổi suốt cuộc đời.

Lấy vân tay để tích hợp vào căn cước công dân gắn chip. Ảnh: Quỳnh Trần — Lấy vân tay để tích hợp vào căn cước công dân gắn chip. Ảnh: *Quỳnh Trần*

Theo Luật Căn cước 2023, công dân từ 6 tuổi trở lên "bắt buộc" phải thu thập các dữ liệu sinh trắc gồm ảnh khuôn mặt, vân tay và mống mắt khi cấp thẻ căn cước công dân.

Thông tin sinh trắc học về ADN (lấy từ mẫu máu/nước bọt) và giọng nói chỉ được thu thập khi công dân "tự nguyện" cung cấp hoặc cơ quan tố tụng, cơ quan xử lý hành chính chia sẻ dữ liệu từ vụ việc liên quan.

Việc bãi bỏ thủ tục thu thập ADN và giọng nói theo Nghị quyết 22/2026 [1] mới đây đồng nghĩa với việc cơ quan quản lý không còn triển khai quy trình hành chính riêng để tiếp nhận, cập nhật hai loại dữ liệu này vào hệ thống căn cước như trước. Nói cách khác là bít lối tập trung các dữ liệu sinh trắc nhạy cảm hơn vào cùng một "hũ mật" dữ liệu vốn đã vô cùng hấp dẫn.

Không có bức tường nào không lọt gió

Một trong các nguyên tắc căn bản của an ninh mạng là không tồn tại hệ thống nào an toàn tuyệt đối[4].

Chúng ta không thể lường trước được mọi lỗ hổng. Nếu hôm nay chúng ta phát hiện lỗ hổng A, thì có khả năng lỗ hổng này đã tồn tại và bị khai thác từ trước. Hơn nữa, với sự hỗ trợ của AI, tốc độ phát hiện lỗ hổng mới đang tăng đột biến theo từng ngày, đồng nghĩa với việc hàng trăm, thậm chí hàng nghìn điểm yếu có thể bị phát hiện và khai thác trong âm thầm mà chúng ta không kịp nhận biết.

Dữ liệu có giá trị càng cao sẽ càng thu hút tấn công. Những "hũ mật" chứa đầy những thông tin nhạy cảm như danh tính cá nhân, lịch sử tài chính, tiêu dùng, đi lại của mọi người luôn là đích ngắm của các nhóm hacker. [5]

Các bộ dữ liệu lớn, tập trung luôn là điểm ngắm của hacker. Ảnh minh họa: Canvas. — Các bộ dữ liệu lớn, tập trung luôn là điểm ngắm của hacker. Ảnh minh họa: *Canvas.*

Việt Nam luôn nằm trong top các quốc gia bị tấn công mạng nhiều nhất khu vực châu Á - Thái Bình Dương, chiếm 5% số vụ trên toàn cầu trong giai đoạn 2021-2022, theo báo cáo của Kaspersky.

Kết quả là, năm 2024, Việt Nam có khoảng 14,5 triệu tài khoản bị rò rỉ; sang năm 2025, con số này tăng lên 25,5 triệu - theo công ty an ninh mạng Viettel Cyber Security. [6]

Năm ngoái, hệ thống giám sát của Viettel Cyber Security ghi nhận 627 vụ rao bán dữ liệu của người Việt Nam, với tổng cộng hơn 4 tỷ bản ghi và khoảng 1,27 TB thông tin bị rò rỉ trên các diễn đàn ngầm. Đáng chú ý, phạm vi tấn công không còn giới hạn ở tài khoản người dùng thông thường mà đã mở rộng sang tài khoản quản trị cấp cao và các hệ thống quản trị dữ liệu doanh nghiệp như CRM hoặc các nền tảng quản lý khách hàng bên thứ ba. [6]

Các chuyên gia cảnh báo nhiều khả năng, các cuộc tấn công trong năm 2026 sẽ tiếp tục phức tạp hơn, khi các nhóm tấn công ngày càng chuyên nghiệp và tận dụng mạnh mẽ các công nghệ mới từ AI. Sự lan rộng của deepfake, có thể gây rủi ro cho các hệ thống xác thực sinh trắc học và quy trình định danh khách hàng điện tử (eKYC).

Thu thập dữ liệu tối thiểu (hay còn gọi là giảm thiểu dữ liệu) là một nguyên tắc an ninh mạng và quyền riêng tư cơ bản, giới hạn việc thu thập và lưu giữ dữ liệu ở mức tối thiểu cần thiết để thực hiện một mục đích cụ thể, hợp pháp. Ảnh minh họa: Canvas. — Thu thập dữ liệu tối thiểu (hay còn gọi là giảm thiểu dữ liệu) là một nguyên tắc an ninh mạng và quyền riêng tư cơ bản, giới hạn việc thu thập và lưu giữ dữ liệu ở mức tối thiểu cần thiết để thực hiện một mục đích cụ thể, hợp pháp. Ảnh minh họa: *Canvas.*

Vì vậy, theo GS Phan Dương Hiệu kết luận, để bảo vệ công dân trong thời đại số cần "thu thập tối thiểu, bảo vệ tối đa". Nghĩa là, khi không thể đảm bảo an toàn tuyệt đối thì cách duy nhất để giảm rủi ro là giảm lượng dữ liệu nhạy cảm được thu thập và lưu trữ.

Nếu nhìn theo nguyên tắc này, việc dừng thu thập ADN và giọng nói của Chính phủ không chỉ đơn thuần là bỏ một thủ tục hành chính rườm rà, tốn thời gian - dù thủ tục đó chỉ mang tính "tự nguyện" - mà là thu hẹp một phần bề mặt rủi ro của cả hệ thống: từ việc coi dữ liệu là nguồn lực cần tích lũy tối đa sang coi dữ liệu, đặc biệt là dữ liệu sinh trắc, như một loại tài sản rủi ro cao, cần được giới hạn ngay từ đầu.

Trong một lĩnh vực mà nhiều quyết định gần như không thể đảo ngược, việc dừng lại đúng lúc có thể là cách duy nhất để giữ cho hệ thống kịp thích ứng với những rủi ro đang thay đổi nhanh hơn dự tính.

Thông tin sinh trắc học về ADN là dữ liệu di truyền cá nhân được thu thập từ mẫu sinh phẩm (như máu, nước bọt) để xác định danh tính độc nhất của mỗi người.

Đối với căn cước công dân, dữ liệu di truyền từ ADN không được tích hợp dưới dạng bộ giải trình tự gene đầy đủ, vì điều này quá phức tạp, tốn kém (khoảng 15-50 triệu đồng/mẫu) và không cần thiết cho mục đích định danh cá nhân mà chỉ phù hợp khi chẩn đoán bệnh di truyền trong y tế.

Thay vào đó, thông tin sinh trắc học ADN trong căn cước sẽ được lưu trữ dưới dạng hồ sơ ADN, gồm 13-24 vị trí các đoạn gen ngắn lặp lại nhiều lần (STR - Short Tandem Repeats) hoặc các đoạn gen biến dị di truyền (SNP - Single Nucleotide Polymorphisms) đặc trưng, tạo mã số độc nhất giống như "dấu vân tay di truyền".

Ví dụ, đoạn gene GATA-GATA-GATA là một đoạn gen STR mà số lần lặp lại ở mỗi người là khác nhau, có người 7 lần, có người 10 lần... Hoặc, một thay đổi chữ cái nhỏ trên gene quy định khả năng cảm nhận vị đắng TAS2R38 sẽ là một biến dị di truyền quyết định việc người đó có thấy ăn bưởi rất đắng hay hoàn toàn bình thường.

Người cung cấp có thể đến các đơn vị/tổ chức/doanh nghiệp thu thập mẫu được Bộ Công an cho phép để lấy mẫu máu hoặc nước bọt. Mẫu này sẽ được phân tích bằng thiết bị PCR để trích xuất các dấu ấn sinh học trong gene. Sau đó, các hồ sơ dấu ấn sinh học sẽ được gửi và lưu vào Cơ sở dữ liệu quốc gia căn cước (không lưu trình tự gốc để bảo mật) [7].

Về nguyên tắc, các hồ sơ ADN này giúp xác định huyết thống hoặc danh tính tội phạm với độ chính xác gần như tuyệt đối.

Một mẫu kết quả xét nghiệm ADN định danh cá nhân được thực hiện theo quy trình của Luật Căn cước để tích hợp vào cơ sở dữ liệu quốc gia. Trong ảnh là 24 vị trí các đoạn gene STR ngắn lặp lại nhiều lần. Nguồn: GeneStory. — Một mẫu kết quả xét nghiệm ADN định danh cá nhân được thực hiện theo quy trình của Luật Căn cước để tích hợp vào cơ sở dữ liệu quốc gia. Trong ảnh là 24 vị trí các đoạn gene STR ngắn lặp lại nhiều lần. Nguồn: *GeneStory.*

---

Tài liệu tham khảo:

[1] Nghị quyết số 22/2026/NQ-CP ngày 29/4/2026 của Chính phủ về cắt giảm, phân cấp, đơn giản hóa thủ tục hành chính và cắt giảm, đơn giản hóa điều kiện kinh doanh thuộc phạm vi quản lý của Bộ Công an. https://vanban.chinhphu.vn/?pageid=27160&docid=217978

[2] Phan Dương Hiệu, (2024), Dữ liệu sinh trắc học: Cần cẩn trọng trước những bước đi 'không thể đảo ngược'! Tia Sáng

[3] Phan Dương Hiệu, (2024), Sự nguy hiểm của chiến lược thu thập dữ liệu gen trên diện rộng, Tia Sáng.

[4] Phan Dương Hiệu, (2026), Bảo mật dữ liệu quốc gia: Không có chuẩn tuyệt đối an toàn. Tia Sáng.

[5] Toàn cảnh vụ việc Trung tâm Thông tin Tín dụng Quốc gia CIC bị tin tặc tấn công. Tia Sáng, 2025.

[6] Báo cáo Tình hình nguy cơ ATTT tại Việt Nam năm 2025. Viettel Cyber Security, 2026.

[7] Hướng dẫn lấy mẫu và tích hợp thông tin sinh trắc học về ADN vào Cơ sở dữ liệu Căn cước. GeneStory, 2024.

--

Xem thêm:

Trở lại Diễn đànTrở lại Diễn đàn

Tia Sáng
Chuyên trang tri thức của VnExpress
Tổng biên tập: Phạm Văn Hiếu

Địa chỉ: Tầng 10, Tòa A FPT Tower,
số 10 Phạm Văn Bạch, phường Cầu Giấy, Hà Nội
Điện thoại: (024) 39428445
Email: tiasang@vnexpress.net