Vì sao deepfake ngày càng tinh vi

Là sản phẩm của nhiều vòng đấu trí giữa "kẻ giả mạo" và "chuyên gia giám định", năng lực ngụy tạo của deepfake ngày càng tinh vi.

Các mô hình AI luôn thay đổi khiến cho con người ngày càng khó phân biệt sản phẩm deepfake. Ảnh: Mỹ Hạnh/Tia Sáng.

Cốt lõi của công nghệ deepfake là trí tuệ nhân tạo (AI), cụ thể hơn là công nghệ học sâu (deep learning), một nhánh của học máy (machine learning). Công nghệ này giúp máy tính học và mô phỏng các khả năng nhận thức của con người thông qua dữ liệu lớn.

Để tạo ra deepfake, mô hình học sâu sẽ phân tích các video, hình ảnh hoặc bản ghi âm thật của một người. Từ đó, nó học các chuyển động khuôn mặt, đặc điểm giọng nói và cách nói chuyện. Sau khi được “huấn luyện”, mô hình học sâu có thể tạo ra nội dung mới trông và nghe giống như thật.

Mô hình học sâu phổ biến nhất để tạo deepfake hiện nay là Mạng đối nghịch tạo sinh (Generative Adversarial Networks – GAN). Hệ thống này gồm hai mạng AI hoạt động song song:

  • Bộ tạo (Generator): tạo ra hình ảnh, âm thanh hoặc video giả.
  • Bộ phân biệt (Discriminator): cố gắng phát hiện nội dung đó là thật hay giả.

Mỗi khi bộ tạo Generator sinh ra một deepfake, bộ phân biệt Discriminator sẽ tìm cách “soi” và chỉ ra điểm bất thường. Quá trình này được lặp đi lặp lại. Dần dần, bộ Generator sẽ học được cách đánh lừa bộ Discriminator tốt hơn, tạo ra các sản phẩm cực kỳ khó phân biệt thật giả.

“Deepfake” được ghép từ “deep learning” và “fake” (giả mạo, bịa đặt).

Tên gọi này xuất hiện lần đầu vào năm 2017, do một người dùng Reddit ẩn danh sử dụng khi chia sẻ những video được tạo ra hoặc chỉnh sửa bằng AI. Từ đó, “deepfake” dần trở thành cách gọi quen thuộc cho tất cả các hình ảnh, video và bản ghi âm được tạo bằng AI để có vẻ như thật.

Ban đầu, deepfake chỉ được xem như một trò thử nghiệm công nghệ mang tính giải trí. Nhưng sau khi được lan truyền trên các diễn đàn trực tuyến và cộng đồng mã nguồn mở, công nghệ này đã phát triển nhanh không tưởng.

Nói cách khác, mạng đối nghịch tạo sinh GAN giống như trò đấu trí giữa kẻ giả mạo tranh và chuyên gia giám định nghệ thuật. Cả hai cùng học hỏi lẫn nhau, mục đích cuối cùng là tạo ra hàng giả ngày càng bớt “giả trân”.

Chính vì cơ chế đấu trí đó, khi công nghệ phát hiện được cải thiện bao nhiêu thì công nghệ tạo giả cũng tiến bộ bấy nhiêu, cộng thêm nguồn dữ liệu huấn luyện ngày càng lớn và đa dạng, deepfake trở nên ngày càng tinh vi và khó phát hiện.

Sự khác biệt của deepfake

Khác biệt lớn nhất giữa deepfake và các công cụ chỉnh sửa truyền thống như Photoshop hay các loại hình nghệ thuật kỹ thuật số khác (ví dụ: vẽ kỹ thuật số, mô hình 3D, thiết kế đồ họa) là ở mức độ tham gia của con người trong quá trình tạo sản phẩm.

Trong khi Photoshop và các loại hình digital art đòi hỏi nhiều thao tác thủ công, kỹ năng chuyên môn và thường để lại những dấu vết chỉnh sửa tương đối dễ nhận ra, thì deepfake vận hành gần như hoàn toàn tự động.

Nếu các công cụ truyền thống đòi hỏi kiến thức về xử lý hình ảnh và mỹ thuật số, thì deepfake đã hạ rào cản xuống đến mức tối thiểu. Người dùng chỉ cần gõ một vài từ đơn giản mô tả ý tưởng – chẳng hạn “hãy dùng ảnh tải lên để tạo ra album tôi đang đi du lịch ở Nhật Bản vào mùa đông” – ấn nút lệnh và 30 giây sau có ngay kết quả! Phần việc ‘sáng tạo’ nặng nhất thường tốn đến vài ngày đã có AI làm cho. Đó cũng là một trong những lý do vì sao các sản phẩm deepfake lại sinh sôi nảy nở nhanh như vậy.

Lý do còn lại nằm ở chi phí tiếp cận của mô hình AI hiện nay đã hạ thấp. Bất kỳ ai có điện thoại hoặc máy tính đều có thể truy cập vào cửa hàng ứng dụng, tải xuống một trong rất nhiều ứng dụng – miễn phí hoặc chỉ tốn một khoản phí nhỏ chừng vài đô-la – để tạo một phút video ngắn ở chất lượng trung bình. Tuy nhiên, các sản phẩm deepfake phục vụ mục đích thương mại, được tùy chỉnh theo yêu cầu, có thể có mức giá cao hơn, từ 300 đến 20.000 đô-la mỗi phút.

Có phải tất cả các deepfake đều độc hại?

Giống như mọi công cụ do con người tạo ra, công nghệ deepfake có thể mang lại lợi ích nếu được sử dụng cho mục đích tốt, nhưng trở nên nguy hại khi bị lạm dụng.

Đáng tiếc là hiện nay, các deepfake tiêu cực đang xuất hiện lấn át. Từ lan truyền thông tin sai lệch, tống tiền, quấy rối tình dục qua mạng, lừa đảo tài chính, trộm cắp danh tính đến xâm phạm quyền riêng tư, deepfake trở thành công cụ đắc lực cho các hành vi phạm pháp.

Trong môi trường số, một hình ảnh AI khắc họa cụ già đói khổ ngay trong cơn bão lũ để kêu gọi từ thiện có thể lan xa như virus. Một cuộc gọi giả giọng CEO của công ty nổi tiếng có thể đánh lừa nhà đầu tư và các bên liên quan để phá hoại đối thủ trong ngành. Bản thân công nghệ deepfake không tự tạo ra hậu quả, nhưng nó khuếch đại và tăng tốc những ý đồ xấu sẵn có của con người.

Ở chiều ngược lại, khi được sử dụng hợp pháp và có đạo đức, deepfake có thể trở thành một công cụ sáng tạo mạnh mẽ.

Trong điện ảnh và giải trí, công nghệ này đã giúp khắc họa chính xác hình ảnh diễn viên ở các độ tuổi khác nhau, khiến họ ít bị phụ thuộc vào hóa trang hoặc công nghệ tạo hình ảnh bằng máy tính (CGI) đắt đỏ. Các nhà làm phim cũng đã tạo ra phiên bản kỹ thuật số của một vài diễn viên quá cố để họ tiếp tục đảm nhận vai diễn còn dang dở hoặc xuất hiện trong các tác phẩm mới.

Trong giáo dục và đào tạo, deepfake hỗ trợ dịch thuật theo thời gian thực, tạo người hướng dẫn ảo và tái hiện các bối cảnh lịch sử, khoa học, văn hóa một cách sống động, giúp bài học tri thức trở nên hấp dẫn hơn.

Còn trong kinh doanh và marketing, các thương hiệu đã bắt đầu tạo ra những người phát ngôn ảo có khả năng nói nhiều ngôn ngữ và cá nhân hóa thông điệp giới thiệu sản phẩm dựa trên hành vi người tiêu dùng. Điều này khiến doanh nghiệp có thể tiết kiệm một khoản chi phí lớn và mở rộng thị trường.

Những ví dụ nêu trên cho thấy deepfake, nếu được đặt trong khung pháp lý và chuẩn mực đạo đức rõ ràng, có thể khuếch đại trí tưởng tượng, giáo dục và các giá trị xã hội – thay vì chỉ phóng đại mặt tối của con người.

Làm sao để phát hiện deepfake?

Trước khả năng làm mờ ranh giới thật – giả hết sức tinh vi của deepfake, chúng ta cần học cách phát hiện deepfake để tự bảo vệ mình khỏi các nạn lừa đảo, đánh cắp danh tính, thông tin sai lệch…

Việc này trước hết đòi hỏi phải có ý thức cảnh giác và kỹ năng phản biện nhất định.

Một số người đã tích lũy các dấu hiệu để nhận biết deepfake, chẳng hạn các video bị vỡ hình hay mờ đi ở một số vùng nhất định; âm thanh không khớp với chuyển động; bàn tay thừa ngón hay có khớp không tự nhiên; ánh sáng hoặc bóng đổ không theo quy luật vật lý; những chi tiết phi logic… Đôi khi, đó chỉ đơn thuần là cảm giác “hơi ảo” khi nhìn vào một bức hình trông đẹp đến mức khó tin.

Tuy nhiên, các mô hình tạo giả liên tục được cải thiện. Nếu người xem nhận ra không chớp mắt là một dấu hiệu của deepfake, thì vài tuần sau sẽ xuất hiện các mô hình cập nhật làm cho nhân vật chớp mắt như người thật.

Deepfake có thể dùng các mô hình AI để trộn biểu cảm của nhiều khuôn mặt khác nhau, tạo ra những người hoàn toàn không có thật. Ảnh: CC-BY-4.0

Theo News Scientist, có những công cụ phát hiện deepfake bằng các phép phân tích tổng thể (meta-analysis) video và âm thanh để xem có sự chỉnh sửa nào giữa các khung hình hoặc trong phần tiếng hay không. Những mô hình này chỉ đánh giá xác suất nội dung đã bị can thiệp, chứ không thể khẳng định 100%. Hầu hết các công cụ phát hiện đều như vậy, cùng lắm chỉ có thể chỉ ra vị trí bị làm giả hoặc chỗ đáng ngờ để con người tiếp tục xem xét.

Một khảo sát nhanh của iProov trên 2.000 người tiêu dùng ở Vương quốc Anh và Mỹ đầu năm ngoái cho biết, chưa đầy 1% số người tham gia có thể xác định chính xác tất cả deepfake do AI tạo ra, mặc dù họ đã được báo trước sẽ có các hình ảnh và video deepfake trong đó. Nghĩa là, khi không được cảnh báo, mức độ bị deepfake đánh lừa có thể còn cao hơn.

Các nhà nghiên cứu cảnh báo deepfake sẽ sớm tiến đến ngưỡng chỉ những chuyên gia được đào tạo bài bản nhất mới có thể phát hiện.

Tác giả

(Visited 104 times, 24 visits today)