Vatican bảo vệ kho báu dữ liệu bằng AI

Hơn 80.000 ấn bản cổ và các kiệt tác nghệ thuật của Thư viện Apostolic Vatican, một trong những thư viện lâu đời bậc nhất thế giới, đã phải nhờ cậy đến AI để có thể ngăn chặn các cuộc tấn công của tin tặc mà vẫn đảm bảo quyền truy cập mở cho bất cứ ai trên khắp thế giới.


Thái tử Charles (giữa) và bà Camilla, nữ công tước xứ Cornwall, đọc những cuốn sách tại Thư viện Vatican Library trong chuyến thăm vào năm 2017. Nguồn: Alessandro Bianchi/Reuters.

Rủi ro trong thời đại số

 

Thông thường, người ta không thể nghĩ là Vatican có thể cùng chung cảnh ngộ như những công ty công nghệ lớn như eBay, T-Mobile, hay Samsung nhưng trên thực tế Thư viện Apostolic Vatican, vẫn được biết đến với tên gọi Thư viện Vatican hoặc đơn giản là Vat, nơi có tuổi đời hơn 500 năm, hiện tại lại sử dụng “lá chắn” bằng công nghệ AI như các công ty này để bảo vệ thư viện số của mình. Vậy hãy hình dung là chỉ cần có kết nối internet là bạn có thể “lọt vào” kho báu của Thư viện Vatican.

Thư viện của Tòa thánh Vatican này được Giáo hoàng Nicholas V thành lập chính thức vào năm 1475 (có thể nó có từ trước đó khá lâu) và đến năm 1481 thì kho tàng này có nhiều sách hơn bất cứ nơi nào trong thế giới phương Tây. Điểm đặc biệt của thư viện này là lưu giữ rất nhiều văn bản lịch sử vô giá như bản chép tay Kinh Thánh cổ nhất với tuổi đời 1.600 năm, thư trao đổi của những nhân vật nổi tiếng trong lịch sử, các bức họa và thủ bút của Michelangelo, Galileo, Sandro Botticelli… cùng nhiều món quà đáng giá của những nhân vật hoàng gia như Maximilian I – Tuyển hầu xứ Bavaria, các tuyển hầu Urbino, nữ hoàng Christina Thụy Điển (thật may mắn là Giáo hoàng Alexander VIII đã kịp thời mua lại bộ sưu tập sách của nữ hoàng Christina sau khi bà qua đời bởi nếu còn ở lại Thư viện hoàng gia Thụy Điển, chúng có thể vĩnh viễn mất đi sau một trận hỏa hoạn cực lớn sau gần 10 năm)… Ngoài sách vở tài liệu, thư viện còn có các bộ sưu tập tiền đúc và huy chương, huân chương cổ.

Những rủi ro có thể xảy ra với một kho lưu trữ toàn cổ vật như Thư viện Vatican khiến những người làm công tác quản trị ở đây hết sức cẩn trọng. Do đó, họ đã bắt kịp làn sóng số hóa ở ngoài xã hội rộng lớn bằng việc lên kế hoạch số hóa toàn bộ kho tàng quý báu này và sẵn sàng cho truy cập mở. Trong thập kỷ qua, thư viện này đã số hóa toàn bộ bộ sưu tập sáng giá của mình, phần lớn là các văn bản, kinh kệ mà trong đó có khoảng 40 triệu bức hình nhằm mục tiêu “bảo tồn nội dung của các báu vật cổ xưa mà không làm ảnh hưởng đến các nguyên tác vốn rất mỏng manh”, theo giải thích của Manlio Miceli, giám đốc công nghệ thông tin của Thư viện. Dự kiến, dự án sẽ phải mất ít nhất 15 năm để hoàn thành với kinh phí khoảng 63 triệu USD và cuối cùng sẽ đem lại cho thế giới 43 petabyte dữ liệu đặc biệt.

Phiên bản số hóa của Thư viện Vatican mang tên Vergilius Vaticanus (https://digi.vatlib.it/) chính thức được ra mắt vào năm 2016. Một trong số ít bản thảo có minh họa còn sót lại của văn học kinh điển là những trang rời rạc Aeneid của Virgil, một áng sử thi bằng thơ miêu tả chi tiết chuyến đi của một người thành Troy tên là Aeneas và sự hình thành thành Rome. Văn bản cổ xưa này – được một bậc thầy chép lại và ba họa sĩ minh họa vào quãng năm 400 sau Công nguyên  – vẫn còn nguyên vẹn những bức họa sống động và dòng chữ mạ vàng.

Mặc dù bắt đầu từ gần 10 năm trước với “những tài liệu độc đáo nhất, nổi tiếng nhất và mỏng manh nhất” nhưng đến nay mới chỉ có khoảng 25% tài liệu trong thư viện được số hóa, Miceli nói và cho biết thêm  “dự án này còn hơn cả những bảo vệ vật lý thông thường khác”. Những tài liệu ẩn giấu những vòng xoáy lịch sử, trước đây chỉ thi thoảng lọt vào mắt công chúng qua những cuộc trưng bày và chỉ được những đôi tay đeo găng trắng của các nhà sử học chạm vào, ngày nay được hiển hiện trước mắt mọi người nhờ kết nối internet. “Đây là bước tiến lớn của sự bình đẳng trong giáo dục”.

Tuy nhiên mọi chuyện cũng bắt đầu từ đây. Nếu không kể đến những thách thức mà những người quản lý thư viện phải đối mặt khi số hóa kho báu thì có lẽ, sau khi họ có được trong tay phiên bản số của nó, mọi rủi ro trong thời đại chuyển đổi số mới thực sự bắt đầu. Trung bình mỗi tháng, thư viện phải đối mặt với hơn 100 mối đe dọa, kể từ khi chính thức số hóa kho báu từ năm 2012. “Chúng tôi không thể làm ngơ một việc là cấu trúc số hóa của chúng tôi thu hút sự quan tâm của tin tặc. Có thể là một cuộc tấn công thành công sẽ dẫn đến hậu quả là đánh cắp bộ sưu tập, thao túng sửa chữa hoặc thậm chí là xóa sổ nó”, Miceli nói với Observer.


Một bức minh họa từ “Aeneid” của Virgil trong bộ sưu tập của Thư viện Vatican. Nguồn: Dea Picture Library/De Agostini/Getty Images

Các cuộc tấn công mạng ngày một gia tăng chứ không giảm đi, ông cho biết thêm. “Tin tặc sẽ luôn cố gắng chui vào mạng lưới tổ chức để đánh cắp thông tin, tống tiền hoặc phá hoại”.

Tính chất của các cuộc tấn công cũng khác nhau. “Không hoàn toàn giống như các bộ phim Hollywood nhưng các cuộc tấn công này đều đáng lo ngại, ví dụ như dùng mã độc tống tiền (ransomware) khi xâm nhập vào thư viện số – một cách làm phổ biến với việc xâm nhập vào các công ty một cách lén lút và sau đó khóa tất cả các tệp thông tin một cách nhanh chóng cho đến khi bạn trả một số tiền lớn. Mã độc tống tiền ngày nay được thực hiện với tốc độ cực nhanh, vượt khỏi năng lực ngăn chặn và phát hiện của con người”, Micelli lí giải.

Trong thời đại ngày nay, thông tin trở thành món hàng quý giá. “Ở thời đại của tin giả (fake news), các bộ sưu tập này đóng một vai trò quan trọng trong cuộc chiến với thông tin sai lệch (misinformation) và do đó cần bảo vệ chúng khỏi những hành động ‘đánh cắp niềm tin’ nghiêm trọng”, Miceli nói thêm. “Trong khi những hư hại vật lý thường rất rõ ràng và tức thì, một cuộc tấn công kiểu này rất khác biệt, vì nó có khả năng gây hại lâu dài, không chỉ cho thư viện mà còn cho với cả ký ức lịch sử của nhân loại”.

Với những người chăm lo đến giá trị của kho báu mà Vatican đang nắm giữ, mức độ nghiêm trọng của các cuộc tấn công thật khủng khiếp. “Chúng có tiềm năng làm ảnh hưởng đến danh tiếng của Thư viện Vatican – một trong những bảo vật mà Vatican dùng hết mọi nỗ lực để duy trì hàng trăm năm qua – và còn có thể làm phân tán nguồn lực tài chính mà chúng tôi dành để số hóa toàn bộ các bản thảo còn lại”.

Thư viện Vatican không phải là nơi duy nhất của Tòa thánh Vatican bị xâm nhập. Vào tháng 7/2020, New York Times đưa tin, tin tặc còn xâm nhập vào hệ thống máy tính ở đây trước thời điểm sẽ diễn ra một cuộc đàm phán quốc tế quan trọng.

 

AI thành “người giữ đền”

 

Đây là lúc thư viện Vatican nhờ cậy đến các nhà chuyên nghiệp, công ty Darktrace. Được các nhà toán học trường Đại học Cambride (Anh) thành lập vào năm 2013, Darktrace là một công ty sử dụng công nghệ AI được phát triển riêng để đối đầu với các cuộc tấn công mạng và đã tạo ra công nghệ phản hồi tự động (Autonomous Response technology) – khi đó AI có thể dò tìm và phản hồi các mối nguy hiểm trên mạng trước lúc thảm họa có thể xảy ra. Lấy ý tưởng từ hệ miễn dịch con người, Darktrace đã tạo ra công nghệ phản hồi tự động như một “kháng thể số” trước các mối đe dọa từ người truy cập hoặc thiết bị cài đặt, vô hiệu hóa các cuộc tấn công kiểu virus xâm nhập tế bào vật chủ và đem lại cho đội ngũ an ninh mạng cơ hội quý báu về thời gian để kịp thời ứng phó. Bởi theo quan điểm của họ, mạng như cơ thể con người, cần chấp nhận sự thật là anh sẽ bị nhiễm virus nhưng điều quan trọng là hệ miễn dịch của anh sẽ dò được mối nguy đó để chiến đấu lại nó và giảm thiểu nguy hại.

Trước khi Vatican gõ cửa, Darktrace đã có tới hơn 4.000 khách hàng là các tổ chức trên khắp thế giới, xử lý các vấn đề liên quan đến đám mây lưu trữ dữ liệu, email, IoT, các mạng lưới và các hệ thống sản xuất công nghiệp… Ngoài các chuyên gia toán và khoa học máy tính, công ty này còn tuyển cả những chuyên gia tình báo và mở nhiều văn phòng trên khắp thế giới. Một trong những chiến công huy hoàng của nó là tham gia xử lý vụ dùng mã độc tống tiền nổi tiếng WannaCry vào năm 2017.


Một ấn bản cổ quý giá ở Thư viện Vatican. Nguồn: www.pbs.org

Lý giải về lý do chọn giải pháp của Darktrace, Miceli nói: “Anh không thể hoàn toàn dùng con người vào giải quyết vấn đề này – anh cần tăng cường sức mạnh của công nghệ và những người có thể hiểu được những vùng xám bên trong các hệ thống vô cùng phức tạp và phòng vệ với tốc độ máy móc”.

Ưu điểm của AI là “không bao giờ ngủ lịm, không bao giờ nghỉ giải lao và có thể điểm ra và điều tra rất nhiều mối nguy hiểm hơn bất cứ đội chuyên nghiệp nào. Nó ra quyết định chỉ trong vài giây khi điều bất thường bắt đầu, cho dù thoạt tiên hoạt động đó có vẻ vô hại”, Micelli nói.

Có nhiều điểm để Thư viện Vatican có thể tự tin vào lựa chọn đối tác của mình. Dave Palmer, giám đốc công nghệ tại Darktrace, nói họ quá hiểu tội phạm mạng – những kẻ không ngừng tìm đủ cách “để kiếm tiền một cách nhanh chóng hoặc trở thành nguyên nhân gây ra hoảng loạn trên quy mô toàn cầu”. Với kinh nghiệm của mình, ông cho biết thêm “nhiều tổ chức như Thư viện Vatican đã chấp nhận thực tại này. Với sự hỗ trợ của hệ AI, họ có thể khám phá ra hành động bất thường và tinh vi của kẻ tấn công trước khi tạo ra một cuộc tấn công toàn diện. Do đó, họ cần phải tin AI để thay mặt con người nhận diện hiểm nguy trước khi mọi chuyện thực sự diễn ra”.

Khi cài đặt công nghệ “miễn dịch” của Darktrace, Thư viện Vatican có thể tạm yên tâm trước những cuộc tấn công tiềm năng trong tương lai làm ảnh hưởng đến các văn bản và tranh ảnh vô giá của mình. Tuy không công bố nhiều trong thông cáo báo chí nhân sự kiện hợp tác, Darktrace chỉ cho biết sẽ phát triển hệ AI để chúng hiểu được những hoạt động “bình thường” trong hệ thống số hóa của Thư viện, sau đó những thay đổi đáng chú ý có thể chỉ dấu ra sự xuất hiện của một mối đe dọa mạng. Trung bình, mỗi tháng thì hệ AI này của Darktrace có thể “chống cự” lại được khoảng 100 vụ nguy hiểm tại Thư viện, điểm ra những mối đe dọa thực sự trước khi nó leo thang thành khủng hoảng.

Micelli cảm thấy tạm hài lòng “AI của Darktrace AI vô cùng quan trọng với những bộ sưu tập của chúng tôi bởi chúng liên tục tiến hóa và tự tái huấn luyện để nhận biết đâu là hoạt động tra cứu bình thường trong hệ thống thư viện số của chúng tôi và hiểu được cái gì là bất bình thường. Điều này có nghĩa là nó có thể bắt kịp với những thay đổi trong môi trường số của chúng tôi và những thay đổi trong bối cảnh nguy hiểm nữa”.

Công ty Darktrace cũng xác nhận điều này. “Những gì chúng tôi làm là học hỏi mọi điều theo mẫu hình của cuộc sống bên trong các mạng lưới số của Thư viện Vatican hay nói cách khác là cơ sở hạ tầng số hóa của họ. Nếu chúng tôi biết mẫu hình thực là gì thì chúng tôi có thể dễ dàng nhìn thấy bất cứ thay đổi nào diễn ra trong bất kỳ thời gian nào, và điều đó cho phép chúng tôi có thể nhanh chóng thấy được những cuộc tấn công ở giai đoạn đầu, khi đó chúng tôi có thể ngăn cản được chúng trước khi chúng gây ra những cuộc khủng hoảng”, Palmer hứa hẹn.

Tuy nhiên, Micelli và những người ở bộ phận của anh thì thận trọng hơn bởi ông cho rằng không thể ngăn nổi 100% các cuộc tấn công. “Trong bối cảnh hiện nay, chỉ có một cách để khiến cho một tổ chức hoàn toàn an toàn là cắt đứt kết nối internet. Sứ mệnh của chúng tôi là đem Thư viện Vatican vào thế kỷ 21 – với ‘lưng vốn’ hơn 500 năm – vì vậy chúng tôi sẽ không làm điều đó mà sớm đưa thư viện số đến với công chúng và các học giả, những người cần tra cứu, tìm hiểu và nghiên cứu tư liệu”.□    

 

Tô Vân tổng hợp

Nguồn: https://www.theguardian.com/world/2020/nov/08/vatican-enlists-bots-to-protect-library-from-onslaught-of-hackers

https://www.theguardian.com/world/2020/nov/08/vatican-enlists-bots-to-protect-library-from-onslaught-of-hackers

https://www.darktrace.com/en/press/2020/334/

Tác giả

(Visited 10 times, 1 visits today)