Khi ứng dụng toán học chưa tính đến khía cạnh con người
LTS: Giải Abel 2021 vừa qua, được trao cho hai nhà toán học Lásaló Lovász và Avi Wigderson vì những nghiên cứu thuộc về ranh giới giữa toán học thuần túy và toán học ứng dụng. Lásaló Lovász chia sẻ trên tạp chí Nature rằng, lằn ranh giữa hai lĩnh vực ngày càng mờ nhạt là một điều tốt. Có thật thế không? GS. Neal Koblitz, một nhà toán học mà lý thuyết của ông về sau trở thành công nghệ cốt lõi trong bảo mật trên internet lại không hoàn toàn nghĩ như vậy. Những định lý toán học thuần túy khi được kéo vào thực tế có thể ẩn chứa những nguy cơ nếu không tính đến những đa dạng chính trị, kinh tế, sắc tộc, văn hóa, định kiến, cảm xúc của con người trong đời sống.
Lásaló Lovász, đồng chủ nhân của giải Abel 2021 chia sẻ rằng lằn ranh giữa toán học thuần túy và toán học ứng dụng ngày càng mờ đi là một điều tốt.
Ảnh: Mandiner.hu
Khi tôi nhận bằng Tiến sĩ về toán học thuần túy vào năm 1974, tôi chắc rằng những gì mình sẽ làm trong sự nghiệp chẳng đem lại một giá trị thực tiễn nào. Giống như một sử gia thời Trung Cổ, tôi sẽ đóng góp theo một cách khiêm nhường nào đó vào tri thức của nhân loại, nhưng không phải theo cách tạo ra ảnh hưởng đến đời sống hằng ngày của con người.
Nửa thế kỉ trước, ai cũng nghĩ rằng toán học thuần túy và toán học ứng dụng là hai hướng nghiên cứu hoàn toàn tách biệt. Có những khi những nhà toán học thuần túy coi thường những nhà làm toán ứng dụng, như một nhà thơ coi thường những biên kịch của các show truyền hình quần chúng. Vào năm 1940, nhà lý thuyết số người Anh G. H. Hardy viết về toán học của ông rằng “khoảng cách của nó với các hoạt động tầm thường của loài người khiến nó quý phái và thuần khiết”. Một nhà toán học người Mỹ tên là Halmos thậm chí còn đặt tiêu đề cho một bài báo của ông là “Toán ứng dụng là một loại toán tồi”.
Nhưng ngay cả thế, thì nửa thế kỉ trước cũng có nhiều ví dụ cho thấy toán lý thuyết đã bất ngờ đem lại những công cụ mạnh mẽ để giải quyết những vấn đề trong cuộc sống. Chẳng hạn, lý thuyết nhóm được phát triển vào đầu những năm 1800 với mục tiêu chứng minh rằng không có công thức tổng quát để giải phương trình đa thức từ bậc 5 trở lên. Lúc đó, chẳng ai hứng thú với câu hỏi này ngoài giới toán học lý thuyết. Nhưng hàng thập kỉ và thế kỉ sau đó, lý thuyết nhóm đã đem đến một cách nghiên cứu những đặc trưng phức tạp của các dạng đối xứng khác nhau – vẫn đang được ứng dụng để giải quyết những câu hỏi quan trọng trong vật lý, hóa học, mật mã học và thậm chí cả âm nhạc.
Đường cong Elliptic
Một trong những đề tài mà tôi nghiên cứu khi viết luận văn tiến sĩ là lý thuyết số học của các đường cong elliptic, điều mà vào thời điểm đó ai cũng nghĩ rằng chẳng có một ứng dụng thực tiễn gì. Kinh ngạc thay, 10 năm sau đó, tôi (và một nhà lý thuyết số độc lập nữa cũng được đào tạo trong lĩnh vực toán lý thuyết) khám phá ra rằng những đường cong elliptic có thể được sử dụng để tăng độ bảo mật của các mật mã hóa khóa công khai. Mật mã hóa khóa công khai là một nhánh mới trong ngành mật mã học và nó đóng vai trò trung tâm trong bảo mật của internet, thương mại điện tử, tiền mã hóa, truy vết Covid-19 và những ứng dụng khác. Khi tôi bắt đầu nghiên cứu về mật mã đường cong elliptic, tôi đã rời toán lý thuyết để trở thành một nhà toán học ứng dụng. Nó giống như là một ai đó vốn nghĩ mình là nhà thơ (mà tác phẩm của anh ta chỉ dành cho một số ít người đọc) bỗng nhiên được đề nghị viết kịch bản cho các show truyền hình (mà hàng triệu người sẽ xem trên TV).
Giờ đây chỉ một số rất ít nhà toán học có góc nhìn tiêu cực về toán ứng dụng. Đa số đều công nhận mối tương tác gần gũi giữa toán học thuần túy và toán ứng dụng. Những người được nhận giải thưởng cao quý Abel năm 2021 – Lásaló Lovász và Avi Wigderson – được vinh danh vì những nghiên cứu ở ranh giới giữa toán học thuần túy và toán ứng dụng. Theo Lovász, giáo sư tại Đại học Eötvös Loránd, ở Budapest, “Ngày nay, càng ngày càng khó phân biệt giữa toán học thuần túy và toán ứng dụng và tôi nghĩ đó là một bước tiến tốt”.
Không còn “quý phái và thuần khiết”
Thế giới của toán học thuần túy, như từ “thuần túy” gợi ra, hoàn toàn “thuần túy” theo cách tách biệt khỏi những thách thức và sự mơ hồ của việc nghiên cứu những vấn đề của con người. Tuy nhiên, khi những ý tưởng của toán học thuần túy bị kéo vào các lĩnh vực ứng dụng, những vấn đề sẽ nảy sinh. Bỗng nhiên lợi ích chính trị và tài chính được đặt lên bàn cân. Bởi vì toán học không mô hình hóa thực tế một cách hoàn hảo, người ta phải đưa ra các giả thiết – những giả thiết có thể không phản ánh đầy đủ những khía cạnh con người trong các vấn đề hoặc có lẽ đã vô tình phản ánh thiên kiến và định kiến văn hóa của nhà nghiên cứu.
Một trong những nguy cơ rõ ràng nhất là sự thổi phồng (hay sự phóng đại). Bởi vì mối quan tâm của công chúng và số tiền đầu tư cho toán ứng dụng lớn hơn rất nhiều đối với toán học thuần túy, những người làm trong các lĩnh vực ứng dụng thường đề cao quá mức thành công của mình. Ví dụ, thuật ngữ “Trí tuệ nhân tạo” thật dễ gây hiểu nhầm. Thuật ngữ này ra đời vào giữa thế kỉ trước nhưng kể cả đến tận bây giờ, với tất cả những tiến bộ kĩ thuật qua bao thập kỉ, máy tính vẫn không thể nào bắt chước được những phần cốt lõi của trí tuệ con người. Những xe tự hành không thể triển khai trong hầu hết các loại môi trường vì những máy tính lái chúng không đủ tin cậy để xử lý đúng những tình huống mới và không ngờ. Và kể cả với sự trợ giúp của thứ gọi là “máy học” (cũng là một lựa chọn từ ngữ sai lầm vì nó quá sơ khai với cách mà con người học), người ta cũng chưa thể vượt qua những giới hạn trên.
Một ví dụ khác về cách dùng từ dễ gây hiểu nhầm là khái niệm bảo mật chứng minh được (provable security) trong ngành mật mã học, mà chút nữa tôi sẽ nói.
Máy tính lượng tử
Trong khoảng 20 năm trở lại đây, đã có những nỗ lực khổng lồ cho việc phát triển máy tính lượng tử. Sự tiến triển vẫn hết sức chậm chạp và người ta cần phải vượt qua những trở ngại to lớn về cả lý thuyết lẫn thực tế trước khi đưa ra bất kì một ứng dụng đời sống nào. Chẳng có gì đảm bảo rằng ngày nào đó người ta sẽ xây dựng được một máy tính lượng tử giải quyết những vấn đề thực tế, và, nếu người ta có thể xây dựng được đi chăng nữa, thì cũng không ai biết được đó là khi nào.
Tính toán lượng tử cần sử dụng nhiều toán trong không gian Hilbert và các toán tử trên những không gian đó. Những “không gian” này hoàn toàn khác với không gian ba chiều trong trực giác của chúng ta. Nó là những công cụ lý thuyết dùng để phân tích các hệ thống lượng tử với kích thước khổng lồ. Với một máy tính lượng tử đủ để phá khóa thuật toán mã hóa khóa công khai RSA, kích thước của không gian giả định này sẽ vào khoảng 24000 (Trong khi số nguyên tử của toàn bộ vũ trụ này còn ít hơn 2150).
Chẳng có gì đảm bảo rằng ngày nào đó người ta sẽ xây dựng được một máy tính lượng tử giải quyết những vấn đề thực tế. Sudar Pichai, CEO của Alphabet (tập đoàn sở hữu Google) và chip tính toán lượng tử của Google, Sycamore. Ảnh: The New York Times.
Ví dụ rõ nhất của một vấn đề thực tiễn mà máy tính lượng tử có thể giải quyết nhanh hơn rất nhiều so với máy tính truyền thống là bài toán phân tích số nguyên (phân tách một hợp số thành tích của nhiều số nguyên nhỏ hơn). Cách làm này được Peter Shor đưa ra vào năm 1994; thuật toán của ông sẽ hoàn toàn phá khóa mật mã khóa công khai RSA và ECC, là hai loại mã hóa khóa công khai đang phổ biến nhất trên thế giới. Nhưng để làm được điều đó thì cần một máy lượng tử có kích thước khổng lồ. Một người nhiệt thành với tính toán lượng tử từng tính ra rằng, tạo ra chiếc máy tính đó tốn khoảng một tỉ USD và cần riêng một nhà máy điện nguyên tử để cung cấp năng lượng.
Khi chúng ta tìm kiếm những vấn đề quan trọng khác trong thực tiễn mà máy tính lượng tử có thể giải quyết hiệu quả hơn nhiều so với máy tính truyền thống, một trở ngại mà chưa ai biết phải vượt qua thế nào là làm sao để đưa một lượng dữ liệu khổng lồ – hoặc thực ra là bất kì dữ liệu nào – vào một máy tính lượng tử. Đối với thuật toán của Shor, dữ liệu cần nhập vào máy tính chỉ là một số nguyên. Nhưng để làm được điều đó, người ta mới chỉ biết duy nhất một cách: đó là phải thông qua một máy tính truyền thống để sắp xếp lại mạch điện của chiếc máy tính lượng tử sao cho ăn khớp với từng bit mà con số đó biểu thị trên máy tính truyền thống.
Thế mà, với từng đó thách thức, người ta vẫn thổi phồng ý nghĩa của máy tính lượng tử lên tận mây xanh. Theo một thông cáo báo chí của IBM: “Một ngày nào đó các máy tính lượng tử sẽ đem đến các đột phá trong vô vàn lĩnh vực của đời sống, như vật liệu và các loại thuốc mới, tối ưu hóa những hệ thống phức tạp và trí tuệ nhân tạo”. Microsoft cũng đồng ý với điều này: “Tính toán lượng tử đã tạo ra một bước nhảy vọt…sẽ thay đổi nền kinh tế, nền công nghiệp, học thuật và nền tảng xã hội của chúng ta…Nó có tiềm năng ứng dụng trong những nghiên cứu về y tế, năng lượng, môi trường, các vật liệu thông minh, và hơn nữa.” Ôi, tất cả đều chỉ là bánh vẽ!
Bảo mật chứng minh được
Bên cạnh sự phóng đại, một vấn đề khác trong cách toán học thuần túy đi vào khoa học máy tính đó là các nhà nghiên cứu lại thường cho rằng những hứa hẹn về công nghệ đó đều được khẳng định thông qua việc chứng minh các định lý toán học. Khái niệm “bảo mật chứng minh được” trong mật mã học rất dễ gây hiểu nhầm, bởi vì việc chứng minh rằng một hệ thống mật mã không thể nào bị bẻ khóa luôn là điều bất khả.
Thực sự là, những định lý mà các nhà mật mã học chứng minh đều có nhiều giới hạn. Nó là các định lý có điều kiện chứ không phải là định lý tuyệt đối. Nó thường có dạng “Nếu P đúng thì Q đúng.” Trong đó, điều kiện P có dạng là nếu kẻ tấn công không thể thực hiện một nhiệm vụ tính toán (chẳng hạn như phân tích một số nguyên cực lớn) trong một khoảng thời gian chấp nhận được. Và kết luận Q có dạng là kẻ tấn công đó sẽ không thể bẻ khóa hệ thống mã hóa trong một khoảng thời gian chấp nhận được.
Đôi khi các nhà nghiên cứu hàng đầu trong lĩnh vực mật mã cũng không muốn thừa nhận sự khác biệt giữa việc chứng minh một định lý có điều kiện với việc chứng minh một định lý tuyệt đối. Chẳng hạn, rất nhiều người lầm tưởng về khái niệm thuật toán không đồng nhất.
Loại thuật toán thông thường của máy tính được gọi là thuật toán đồng nhất. Ngược lại “không đồng nhất” nghĩa là khi giải một bài toán, chúng ta được trợ giúp từ một “chuỗi ký tự hướng dẫn” (advice string), nhưng không tính đến việc mất bao lâu để tìm ra được chuỗi kí tự hướng dẫn đó. Những thuật toán không đồng nhất là một ý tưởng thú vị và quan trọng trong ngành khoa học máy tính lý thuyết. Nhưng từ góc độ thực tiễn thì thuật toán không đồng nhất không hẳn là một thuật toán bởi nó dựa trên một chuỗi ký tự hướng dẫn mà không ai biết làm thế nào để tìm ra nó.
Hai nhà nghiên cứu mật mã học hàng đầu thế giới viết trong bài giảng một khóa học tại MIT: “Rõ ràng, kẻ tấn công không đồng nhất thì mạnh hơn kẻ tấn công đồng nhất. Bởi vậy, một chứng minh một cái gì đó được bảo mật kể cả khi chịu một cuộc tấn công không đồng nhất thì tốt hơn là một chứng minh nó chỉ được bảo mật với một cuộc tấn công đồng nhất”.
Đó là một nhận định hoàn toàn sai lầm. Dẫu rằng câu đầu tiên thì đúng – kẻ tấn công không đồng nhất có thể sẽ sử dụng chuỗi ký tự hướng dẫn, trong khi kẻ tấn công đồng nhất (tấn công thông thường) thì không. Tuy nhiên, nó không khiến cho định lý mạnh hơn. Bởi kết luận của nó mạnh hơn nhưng giả thuyết nó đưa ra cũng mạnh hơn. Thay vì chứng minh “Nếu P xảy ra thì Q xảy ra”, anh lại chứng minh “Nếu R xảy ra thì S xảy ra” khi R mạnh hơn P và S là kết quả mạnh hơn Q. Định lý này không mạnh hơn (hay yếu hơn) định lý trước. Định lý “Nếu P xảy ra thì Q xảy ra” không thể so sánh mạnh yếu được với định lý “Nếu R xảy ra thì S xảy ra”. Đó hoàn toàn là logic thông thường.
Sự hiểu nhầm này đã dẫn tới việc một trong những nhà nghiên cứu đưa ra nhận định trên đã gây ra một lỗi cơ bản nghiêm trọng trong một bài báo được chấp nhận tại hội nghị Crypto (hội nghị mật mã thường niên danh giá nhất) vào năm 2005. Người ta không hề phát hiện ra lỗi này cho đến bảy năm sau.
Truy vết tiếp xúc Covid-19
Có lẽ nguy hiểm lớn nhất trong ứng dụng toán học vào các vấn đề thực tế đó là yếu tố con người của vấn đề không hề được chú ý đúng mức. Tôi sẽ đưa ra hai ví dụ, đều liên quan đến đại dịch Covid-19.
Các nhà nghiên cứu đã phát triển nhiều ứng dụng điện thoại để truy vết tự động. Ưu tiên hàng đầu của họ trong các nghiên cứu này là sử dụng mật mã để bảo vệ quyền riêng tư, nghĩa là bảo đảm rằng không ai ngoài những nhân viên y tế được ủy quyền có thể biết được ai dương tính với virus hay những ai đã tiếp xúc với những người dương tính với virus.
Susan Landau là chuyên gia hàng đầu về quyền riêng tư trên mạng, và bà đã chỉ trích việc tập trung quá mức vào bảo vệ quyền riêng tư trong khi bỏ qua nhiều vấn đề cấp bách hơn về sự công bằng. Bà viết một cuốn sách với tiêu đề: “Nghĩ đến yếu tố con người: các ứng dụng truy vết tiếp xúc và y tế công cộng”, trong đó bà thảo luận về những gì mà việc triển khai ứng dụng truy vết tiếp xúc thiếu cẩn thận có thể gây ra rất nhiều khó khăn, đặc biệt là đối với những người nghèo hay những chủng tộc thiểu số ở Mỹ. Luận điểm của bà là:
– “Một trong những hạn chế của các ứng dụng truy vết tiếp xúc đó là các tín hiệu Bluetooth có thể đi xuyên qua tường hay sàn nhà.” Bởi vậy, ứng dụng sẽ ghi nhận một người là tiếp xúc với ca dương tính cho dù họ ngồi cách người dương tính đó qua một bức tường. Người ta gọi đây là hiện tượng dương tính giả (false positive).
– Ở Mỹ, chủ yếu là những người thu nhập thấp hoặc các cộng đồng dân tộc/chủng tộc thiểu số mới sống gần nhau trong những khu nhà tập thể xập xệ hoặc chen chúc trong một nhà.
– Chủ yếu là những người thu nhập thấp hoặc các cộng đồng dân tộc/chủng tộc thiểu số mới phải làm việc trong các lĩnh vực mà họ không thể làm việc tại nhà và tiếp xúc rất gần với đồng nghiệp (thu ngân, y tá, công nhân trong các công xưởng…). Trong đại dịch, những người cùng làm việc với nhau thường được phân tách bằng các tấm chắn – nhưng những tấm chắn cũng không ngăn sóng Bluetooth đưa ra những trường hợp dương tính giả.
– Bởi vậy, các ứng dụng truy vết tiếp xúc sẽ ghi nhận ra những trường hợp dương tính giả đối với họ nhiều hơn là với những người da trắng giàu có.
– Dương tính giả có thể đồng nghĩa với việc những người đó sẽ phải bỏ dở công việc (mà họ vốn đã chỉ sống với đồng lương tối thiểu), và ở Mỹ điều đó sẽ dẫn đến mất việc, bị đuổi khỏi nơi ở và sự xáo động lớn trong đời sống của họ.
Đã có rất nhiều bài báo viết về đại dịch Covid-19 ảnh hưởng một cách thiên lệch lên đời sống của những người nghèo và các cộng đồng chủng tộc thiểu số. Sách của Landau chỉ bổ sung thêm điều này đối với việc truy vết tự động.
Tìm đường cong khớp cho Covid-19
Một trường hợp mà toán ứng dụng có những sai lầm trong ứng phó với đại dịch diễn ra ngay tại trường tôi, Đại học Washington, tại Viện Đo lường và Đánh giá Y tế (IHME). Trong những ngày vô cùng quan trọng là lúc mới xảy ra dịch bệnh – thời điểm mà người Mỹ cần nhận thức được sự nghiêm trọng của nguy cơ dịch bệnh và có những hành động mạnh mẽ – thì IHME trở nên nổi tiếng vì những tính toán vô cùng lạc quan. IHME dự báo rằng tổng số người Mỹ tử vong trong đại dịch sẽ chỉ vào khoảng 60.000 người, tương đương với số lượng người chết trong mùa cúm năm 2017-2018. Trên thực tế, số người tử vong hiện tại đã vượt qua con số 500 nghìn người và khả năng sẽ tăng tới con số gấp 10 lần mà IHME đã dự báo.
Tại sao IHME lại đưa ra một kết quả tồi đến như vậy? Mô hình của họ, được viết bởi các nhà toán học không có hoặc có rất ít kinh nghiệm trong lĩnh vực dịch tễ học, dựa trên phần lớn cái được gọi là “tìm đường cong khớp”. Họ lấy những đường cong về số ca nhiễm và số người tử vong (theo thời gian) ở Vũ Hán và đơn giản là áp vào dữ liệu ở Mỹ. Họ giả thiết rằng, ở Vũ Hán, giữa tháng một và tháng ba năm 2020, số ca nhiễm sẽ tăng nhanh rồi hầu như giữ nguyên và cuối cùng là giảm mạnh trong vòng từ một đến ba tháng. Phương pháp của họ giả định rằng người Mỹ sẽ đối phó với khủng hoảng gần như y hệt người Trung Quốc.
Rốt cục, đó là một giả định ngây thơ. Chính trị và văn hóa của Mỹ rất khác với Trung Quốc. Vào thời điểm đó Mỹ có một Tổng thống phủ nhận hoàn toàn các thực tế khoa học và phản đối việc đeo khẩu trang. Người Mỹ cũng không có kỷ luật như người Trung Quốc, như một phóng viên New York Times đã bình luận, “Người Mỹ không thích bị nói phải làm gì”.
Những mô hình toán học khác chính xác hơn nhiều so với IHME. Trong gần như cùng thời điểm với IHME đưa ra dự báo về 60 nghìn ca tử vong, một nhóm nghiên cứu tại Đại học Hoàng gia London (Imperial College London) dự báo rằng số ca tử vong của Mỹ sẽ đạt tới 480.000, một dự báo được đăng trên trang nhất của tờ New York Times. Nhưng dự báo của IHME mới được nội các của Trump tóm lấy để biện minh cho sự phủ nhận của họ đối với tính nghiêm trọng của đại dịch hay cho việc không thực hiện các biện pháp thích đáng.
Đạo đức toán học
Vậy IHME phản ứng thế nào với việc người ta sử dụng công trình của họ một cách sai lệch? Họ có lên tiếng phản đối và nói rằng dự báo đó sẽ không có ý nghĩa gì nếu giả định của nó bị thay đổi, tức là nếu Mỹ ứng phó với đại dịch bằng cách trì hoãn và phủ nhận việc đeo khẩu trang và giãn cách xã hội? Không, họ không hề phản đối; họ đơn giản chìm đắm trong hào quang của việc được liên tục trích dẫn trong các buổi họp báo của Nhà Trắng.
Nghề y có những quy tắc đạo đức từ thời La Mã cổ đại. Nguyên tắc trung tâm của những nguyên tắc đạo đức này được thể hiện trong lời thề Hippocrates: Đầu tiên là không làm hại ai (First do no harm). Khi những nhà toán học mạo hiểm tham gia vào các ứng dụng sẽ ảnh hưởng đến hàng triệu người, họ cũng nên có một lời thề Hippocrates của riêng mình. □
Bài viết được GS. Neal Koblitz viết riêng cho Tia Sáng
Hảo Linh dịch