Người mở đường ngành xác suất hiện đại
Nếu hai nhà thống kê lạc mất nhau trong một khu rừng vô hạn, trước tiên họ sẽ uống cho say. Khi đó, có thể nói là họ sẽ đi một cách ngẫu nhiên và việc này sẽ mang lại cơ hội tốt nhất để họ gặp lại nhau. Tuy nhiên, các nhà thống kê nên tỉnh táo nếu họ muốn đi hái nấm. Say rượu đi lung tung không mục đích sẽ thu hẹp phạm vi khám phá, và khả năng cao là họ sẽ quay trở lại vị trí cũ, nơi nấm đã bị hái hết rồi.
Kolmogorov (bìa phải) và hai người bạn, các nhà toán học nổi tiếng thời bấy giờ, Lev Pontryagin (bìa trái) và Pavel Alexandrov (ngồi giữa)
Những cách tư duy như vậy thuộc về các lý thuyết thống kê về “bước đi ngẫu nhiên” hay “bước đi của người say”, trong đó tương lai chỉ phụ thuộc vào hiện tại chứ không phải quá khứ. Ngày nay, bước đi ngẫu nhiên được sử dụng để mô hình hóa các hiện tượng như xu hướng giá cổ phiếu, khuếch tán phân tử, hoạt động thần kinh, biến động dân số, v.v. Người ta cho rằng cũng có thể sử dụng nó để mô tả “xu hướng di truyền” của một gene cụ thể – ví dụ như màu mắt xanh – trở nên phổ biến trong một nhóm dân cư. Một cách trớ trêu, lý thuyết với đặc trưng bỏ qua quá khứ này lại có một bề dày lịch sử khá phong phú. Nó là một trong nhiều đột phá tri thức được xây dựng bởi Andrei Kolmogorov, một nhà toán học với hiểu biết sâu rộng và khả năng đáng kinh ngạc, người đã cách mạng hóa vai trò của tính không dự đoán được trong toán học, trong khi bản thân ông vẫn cẩn trọng ứng đối với những biến động của đời sống chính trị và hàn lâm ở nước Nga Xô viết.
Khi còn trẻ, Kolmogorov đã được nuôi dưỡng bởi không khí tri thức sôi động của Moskva hậu cách mạng, tràn ngập các thử nghiệm văn chương, những xu hướng tiên phong trong nghệ thuật, và các ý tưởng khoa học mới mẻ. Ở những năm đầu thập niên 1920, khi là một sinh viên lịch sử ở tuổi 17, ông đã trình bày một bài báo trước các bạn học tại Đại học Moskva, đưa ra một phân tích thống kê khác thường về đời sống của người Nga thời Trung cổ, trong đó cho thấy thuế khóa đánh trên cả làng thường là số nguyên, trong khi thuế trên từng hộ dân lại được biểu diễn bởi một phân số. Bài báo kết luận – đầy tranh cãi vào thời điểm đó – rằng thuế trước đây được thu theo làng và phân bổ đến từng hộ, thay vì thu theo từng hộ rồi gộp tổng lại cho cả làng. Thầy của ông đã nhận xét gay gắt rằng “cậu chỉ mới tìm thấy một bằng chứng mà thôi, như vậy là không đủ với một nhà sử học. Cậu cần ít nhất năm bằng chứng.” Lúc đó, Kolmogorov đã quyết định chuyển sang nghiên cứu toán học, nơi chỉ một chứng minh là đủ.
Điều hợp lý một cách kỳ lạ là một sự kiện ngẫu nhiên như vậy đã dẫn dắt Kolmogorov vào lãnh địa của lý thuyết xác suất, khi đó chỉ là một nhánh nhỏ bị xem thường của toán học. Các xã hội tiền hiện đại thường nhìn nhận các sự kiện ngẫu nhiên như một biểu thị cho ý chí của thần thánh; ở Ai Cập và Hy Lạp Cổ đại, việc tung súc sắc được nhìn nhận là một công cụ cho việc tiên tri hay bói toán. Cho đến đầu thế kỷ 19, các nhà toán học châu Âu đã phát triển các kỹ thuật để tính toán các tỉ lệ cược, và định nghĩa xác suất như là tỉ lệ của số những trường hợp muốn có trên số tất cả các trường hợp đồng xác suất. Nhưng cách tiếp cận này lại vướng vào lập luận vòng quanh – xác suất được định nghĩa theo số các khả năng đồng xác suất – và chỉ có hiệu lực với những hệ có hữu hạn khả năng. Nó không thích hợp với những đại lượng vô hạn đếm được (như trò chơi với súc sắc có vô hạn mặt) hay không đếm được (như trò chơi với súc sắc hình cầu mà mỗi điểm trên mặt cầu là một khả năng). Những nỗ lực xử lý các tình huống như vậy chỉ mang lại những kết quả mâu thuẫn và tạo ra một hình ảnh xấu về lý thuyết xác suất.
Uy tín và thanh danh là những phẩm chất được Kolmogorov coi trọng. Sau khi chuyển ngành học, ban đầu Kolmogorov gia nhập nhóm toán của Nikolai Luzin, một giảng viên nổi tiếng đầy sức cuốn hút ở Đại học Moskva. Những học trò của Luzin đặt tên cho nhóm là “Luzitania,” một cách chơi chữ theo tên giáo sư của họ và con tàu của Anh bị chìm trong Thế chiến thứ nhất. Họ được thống nhất bởi một “nhịp đập của các con tim”, như Kolmogorov từng mô tả, tập hợp nhau lại sau giờ học để bàn luận chuyên sâu về những phát kiến mới trong toán học. Họ nhại partial differential equation (các phương trình đạo hàm riêng) thành partial irreverential equations (các phương trình bất kính riêng) và finite difference (sai phân hữu hạn) thành fine night differences (những khác biệt trong đêm vui vẻ). Lý thuyết xác suất, thiếu cơ sở lý thuyết chắc chắn và bị vướng vào các nghịch lý, đã bị đùa cợt thành “lý thuyết của sự không may”.
Cũng bởi Luzitania mà cách nhìn nhận của Kolmogorov về lý thuyết xác suất có thêm một bước chuyển mang tính cá nhân. Cho tới thập niên 30 thế kỷ trước dưới thời Stalin, bất kỳ ai cũng có thể bị công an mật gõ cửa ban đêm và sự may rủi quyết định cuộc sống của mọi người. Bị tê liệt bởi sợ hãi, rất nhiều người Nga cảm thấy bắt buộc phải tham gia vào việc tố giác, với hi vọng có thể tăng thêm cơ hội sống sót của mình. Một số người Bolshevik trong cộng đồng toán học, bao gồm cả những học trò cũ của Luzin, đã gán cho Luzin tội phản bội và phê phán ông gay gắt vì đã công bố công trình ở các tạp chí của nước ngoài. Bản thân Kolmogorov lúc ấy cũng có công bố ở nước ngoài nên có thể đã nhận thấy khả năng mình bị tố giác. Ông đã biểu lộ sự sẵn sàng thỏa hiệp về mặt chính trị vì lợi ích sự nghiệp của mình, chấp nhận một vị trí giám đốc viện nghiên cứu khi người tiền nhiệm của ông vì ủng hộ tự do tôn giáo mà bị chế độ Stalin bỏ tù. Bấy giờ, Kolmogorov tham gia phê bình và quay lưng lại với Luzin. Luzin đã trở thành đối tượng một buổi xét xử bởi Viện Hàn lâm Khoa học và mất tất cả các vị trí chính thức, nhưng đã thoát khỏi sự bắt giam và xử bắn bởi chính quyền Nga một cách ngạc nhiên. Luzitania cũng tan rã, bị đánh chìm bởi chính thủy thủ đoàn của nó.
Không bàn đến khía cạnh đạo đức trong quyết định của ông, Kolmogorov đã đặt cược thành công và nhận lại sự tự do để tiếp tục nghiên cứu. Trái ngược với sự phục tùng của mình trong chính trị, trong lý thuyết xác suất, Kolmogorov đã đưa ra một sửa đổi cấp tiến căn bản và thực sự là nền tảng của lĩnh vực này. Ông dựa vào lý thuyết độ đo, một lý thuyết thời thượng, mới được du nhập vào Nga từ Pháp. Lý thuyết độ đo là sự tổng quát hóa của các khái niệm “độ dài”, “diện tích” hay “thể tích”, cho phép đo đạc nhiều đối tượng toán học rắc rối nằm ngoài khả năng của các phương pháp thông thường. Chẳng hạn, nó có thể giúp tính diện tích của một hình vuông với vô hạn các lỗ ở bên trong, chia nó thành vô hạn các mảnh nhỏ, phân tán trên một mặt phẳng vô hạn. Trong lý thuyết độ đo, người ta vẫn có thể nói về “diện tích” (độ đo) của vật thể bị phân tán như thế.
Kolmogorov mô tả những tương tự giữa lý thuyết xác suất và lý thuyết độ đo, thể hiện trong năm tiên đề, ngày nay thường được phát biểu thành sáu mệnh đề, đưa xác suất trở thành một lĩnh vực được tôn trọng của giải tích toán học. Khái niệm căn bản nhất trong lý thuyết của Kolmogorov là “biến cố cơ bản,” kết quả của một phép thử đơn lẻ, như tung một đồng xu. Tất cả các biến cố cơ bản lập thành “không gian mẫu”, tập hợp của tất cả các kết quả khả dĩ. Chẳng hạn như với các cú sét đánh ở Massachusetts, không gian mẫu sẽ bao gồm tất cả các điểm trong bang mà sét có thể đánh vào. Một biến cố ngẫu nhiên sẽ được định nghĩa là một “tập đo được” trong một không gian mẫu, và xác suất của một biến cố ngẫu nhiên là “độ đo” của tập đó. Ví dụ xác suất sét đánh trúng Boston sẽ phụ thuộc vào diện tích (“độ đo”) của thành phố này. Hai biến cố xảy ra đồng thời có thể được biểu diễn bởi giao của các độ đo của chúng; xác suất có điều kiện được biểu diễn bởi thương các độ đo; và xác suất mà một trong hai biến cố không phụ thuộc vào nhau xảy ra được tính bằng cách cộng các độ đo (ví dụ như, xác suất hoặc Boston hoặc Cambridge sẽ bị sét đánh được tính bằng tổng diện tích của chúng).
Nghịch lý Đường tròn lớn là một câu đố toán học quan trọng mà khái niệm xác suất của Kolmogorov cuối cùng đã giải được. Giả sử rằng người ngoài hành tinh hạ cánh ngẫu nhiên trên một hành tinh hình cầu hoàn hảo và xác suất điểm hạ cánh được phân bố đều. Như vậy có phải họ sẽ hạ cánh với xác suất như nhau ở bất kỳ nơi nào dọc theo bất kỳ đường tròn nào chia mặt cầu thành hai bán cầu bằng nhau, hay còn gọi là “đường tròn lớn”? Hóa ra xác suất hạ cánh được phân bố đều dọc theo đường xích đạo, nhưng phân bố không đều trên các đường kinh tuyến, với xác suất tăng dần khi tới gần đường xích đạo và giảm ở các cực. Nói cách khác, người ngoài hành tinh có xu hướng hạ cánh ở những vùng có khí hậu nóng hơn. Có thể giải thích kết quả lạ lùng này bằng hình ảnh các đường tròn vĩ tuyến lớn dần khi chúng tiến dần tới xích đạo – nhưng kết quả này nghe có vẻ thật vô lý, bởi vì chúng ta có thể quay đường tròn và biến đường xích đạo thành một đường kinh tuyến. Kolmogorov đã chỉ ra rằng đường tròn lớn có độ đo bằng không, bởi vì nó là một đoạn thẳng và có diện tích bằng không. Điều này lý giải sự mâu thuẫn hiển nhiên trong các xác suất có điều kiện của việc hạ cánh tồn tại bởi không thể tính toán một cách nghiêm túc những xác suất như vậy.
Tưởng có thể gác qua một bên thế giới thực với những thanh trừng theo kiểu Stalin để bước vào thế giới phù du của những xác suất có điều kiện với độ đo-không, nhưng Kolmogorov đã sớm phải quay về với hiện thực. Trong Thế chiến thứ hai, Chính phủ Nga yêu cầu Kolmogorov phát triển các phương pháp giúp tăng tính hiệu quả của pháo binh. Ông đã chỉ ra rằng thay vì cố gắng tối đa xác suất mỗi phát bắn trúng đích, trong một số trường hợp cụ thể sẽ tốt hơn nếu bắn một loạt đạn có độ lệch nhỏ so một phát ngắm chuẩn xác, một chiến thuật được biết đến dưới tên gọi “phân tán nhân tạo”. Bộ môn Lý thuyết xác suất của Đại học Moskva mà Kolmogorov là tổ trưởng, cũng đã tính toán các bảng đạn đạo cho những pha ném bom tầm thấp, vận tốc nhỏ. Vào năm 1944 và 1945, chính phủ đã trao thưởng cho Kolmogorov hai Huân chương Lenin cho những đóng góp của ông trong thời chiến và sau cuộc chiến ông làm việc với tư cách cố vấn toán học cho chương trình vũ khí nhiệt hạch.
Nhưng những mối quan tâm của Kolmogorov vẫn hướng ông tới những hướng nghiên cứu có tính triết lý hơn. Toán học đã dẫn ông tới niềm tin rằng thế giới được dẫn dắt bởi tính ngẫu nhiên và cơ bản được sắp đặt dựa trên các định luật xác suất. Ông thường chỉ ra vai trò của tính không dự đoán được trong những mối quan hệ của con người. Cuộc gặp gỡ tình cờ của Kolmogorov với nhà toán học cùng thời Pavel Alexandrov trong một buổi chèo thuyền năm 1929 đã khởi đầu cho một tình bạn thân thiết suốt đời. Trong một lá thư dài mà họ thẳng thắn trao đổi, Alexandrov đã phê phán Kolmogorov vì ý thích nói chuyện với người lạ trên tàu, ngụ ý rằng những gặp gỡ như vậy quá hời hợt, không giúp nhận diện tính cách thực của một con người. Kolmogorov phản đối, ông đưa ra quan điểm xác suất rất cấp tiến về những tương tác xã hội trong đó mỗi người hành động như những mẫu thống kê đại diện cho các nhóm lớn hơn. Ông viết hồi âm cho Alexandrov rằng “một cá nhân sẽ có xu hướng hấp thu tinh thần xung quanh, và thể hiện với bất kỳ ai quanh mình, không chỉ với một người bạn nhất định, về phong cách sống và thế giới quan mà họ hấp thu được”.
Kolmogorov quan tâm sâu sắc tới âm nhạc, văn chương và ông tin rằng mình có thể phân tích chúng dưới khía cạnh xác suất để thu được những hiểu biết sâu sắc về cách tư duy bên trong trí óc con người. Ông là người tin vào tính thứ bậc trong văn học nghệ thuật. Ở đỉnh tháp là các tác phẩm của Goethe, Pushkin, và Thomas Mann cùng với những sáng tác của Bach, Vivaldi, Mozart và Beethoven, những công trình có giá trị trường tồn tương tự như những chân lý toán học vĩnh cửu. Kolmogorov nhấn mạnh rằng mỗi công trình nghệ thuật đích thực là một sáng tạo độc nhất, thứ gì đó không dự đoán được, nằm ngoài địa hạt của những chuẩn mực thống kê đơn giản. “Liệu có thể xếp một cách hợp lý tác phẩm Chiến tranh và Hòa bình của Tolstoy vào chung trong một tập hợp của ‘tất cả những tiểu thuyết có thể sinh ra trên đời’, và hơn nữa là thiết lập một phân bố xác suất nào đó cho các phần tử trong tập hợp này hay không?”, ông hỏi đùa trong một bài báo in năm 1965.
Dù vậy, ông vẫn khao khát hiểu bản chất của sáng tạo nghệ thuật. Năm 1960, Kolmogorov tổ chức một nhóm các nhà nghiên cứu với những máy tính cơ điện và giao cho họ nhiệm vụ tính toán cấu trúc nhịp điệu của thơ ca Nga. Kolmogorov đặc biệt quan tâm tới độ lệch của nhịp điệu các bài thơ trong thực tế so với những vần luật cổ điển. Trong thơ ca truyền thống, vần luật kiểu iamb là một nhịp điệu bao gồm một âm tiết không nhấn theo sau một âm tiết nhấn. Nhưng trong thực tế, người ta hiếm khi tuân thủ quy tắc này. Trong tác phẩm Evegnhi Onhegin của Pushkin, bài thơ iamb cổ điển nổi tiếng nhất bằng tiếng Nga, gần như ba phần tư trong 5300 dòng của nó vi phạm quy tắc vần luật iamb, và hơn một phần năm của tất cả những âm tiết chẵn là không nhấn. Kolmogorov tin rằng tần suất sai lệch này cho thấy một “chân dung thống kê” khách quan về mỗi nhà thơ. Ông cho rằng, một mẫu hình nhấn trọng âm bất thường là chỉ dấu cho tính sáng tạo và biểu đạt nghệ thuật. Nghiên cứu Pushkin, Pasternak và những nhà thơ Nga khác, Kolmogorov lập luận rằng họ đã biến tấu các vần luật để tạo ra “sắc thái tổng thể” cho bài thơ hay đoạn văn của mình.
Để đo giá trị nghệ thuật của văn bản, Kolmogorov còn sử dụng một phương pháp đoán chữ để đánh giá entropy của một ngôn ngữ tự nhiên. Trong lý thuyết thông tin, entropy là một thước đo tính bất định hoặc tính không dự đoán được, tương ứng với nội dung thông tin của một thông điệp: thông điệp càng không thể dự đoán được thì thông tin mà nó hàm chứa càng nhiều. Kolmogorov đưa entropy thành một thước đo của tính độc đáo trong nghệ thuật. Nhóm của ông đã sắp đặt một chuỗi các phép thử, trong đó các tình nguyện viên được xem một trích đoạn văn xuôi hoặc thơ ca Nga, rồi yêu cầu họ đoán chữ cái tiếp theo, tiếp theo nữa, rồi cứ tiếp tục như vậy. Kolmogorov ngầm nhận xét rằng, từ góc nhìn của lý thuyết thông tin, các tờ báo Xô viết thường ít thông tin hơn thơ ca, bởi vì các bài diễn thuyết chính trị thường sử dụng nhiều những cụm từ có tính khuôn sáo và nội dung của chúng rất dễ đoán trước. Trái lại, các bài thơ của những nhà thơ vĩ đại lại khó đoán hơn rất nhiều, mặc dù chúng phải tuân thủ những quy phạm rất chặt chẽ theo thể thơ. Theo Kolmogorov, đây là một biểu hiện của tính độc đáo. Nghệ thuật đích thực thì không đoán trước được, nhưng phẩm chất đó lại có thể được đo lường bởi một lý thuyết xác suất có chất lượng cao.
Kolmogorov không thể chấp nhận việc coi Chiến tranh và Hòa bình như một phần tử nằm chung trong một tập hợp của tất cả mọi tiểu thuyết – nhưng ông có thể biểu đạt tính không thể dự đoán của nó bằng cách tính toán độ phức tạp của nó. Kolmogorov coi độ phức tạp của một đối tượng chính là độ dài của mô tả ngắn nhất về nó, hoặc là độ dài của thuật toán tạo ra đối tượng. Những đối tượng tất định đều đơn giản theo nghĩa rằng chúng có thể được sinh ra từ những thuật toán ngắn như một chuỗi tuần hoàn các số 0 và 1. Những đối tượng thực sự ngẫu nhiên, không thể dự đoán được thì đều phức tạp, bởi bất kỳ thuật toán nào sinh ra chúng cũng phải dài như chính bản thân chúng vậy. Ví dụ, những số vô tỷ – những con số không thể viết dưới dạng phân số – dãy chữ số đằng sau dấu thập phân xuất hiện ngẫu nhiên và hầu như không hề có một quy luật nào. Bởi vậy, hầu hết các số vô tỷ đều là các đối tượng phức tạp bởi vì chúng chỉ có thể được ghi lại bằng cách viết ra toàn bộ dãy các chữ số. Cách hiểu về độ phức tạp này phù hợp với ý niệm trực quan rằng không có phương pháp hay thuật toán nào có thể dự đoán các đối tượng ngẫu nhiên. Khái niệm này ngày nay rất quan trọng trong vai trò thước đo các tài nguyên tính toán cần có để biểu đạt một đối tượng, đồng thời có nhiều ứng dụng trong định tuyến mạng hiện đại, các thuật toán sắp xếp và nén dữ liệu.
Có thể nói Kolmogorov có một cuộc đời phức tạp, nếu ta căn cứ theo phương thức đo mà bản thân ông tạo ra. Cho tới lúc mất năm 1987 ở tuổi 84, ông đã không chỉ trải qua một cuộc cách mạng, hai lần Thế chiến và Chiến tranh lạnh, mà sự sáng tạo của ông đã chạm tới hầu hết các địa hạt trong toán học, vươn xa khỏi biên giới của khoa học hàn lâm. Dù chúng ta coi những bước đi ngẫu nhiên của ông trong cuộc đời là của người say hay của người nhặt nấm, thì những khúc rẽ và bước ngoặt của chặng đường ấy đều không dự đoán được và cũng không thể dễ dàng mô tả. Thành công của ông trong việc nắm bắt và áp dụng tính không dự đoán được đã làm hồi sinh lý thuyết xác suất, và đã tạo ra một miền đất cho vô hạn các dự án khoa học và kỹ thuật. Nhưng lý thuyết của ông cũng khuếch đại sự căng thẳng, giữa một bên là trực giác của con người về tính không thể dự đoán được, và bên kia là sức mạnh hiển nhiên của công cụ toán học để mô tả nó.
Với Kolmogorov, những ý tưởng của ông không loại bỏ tính ngẫu nhiên mà cũng không khẳng định một bản tính bất định căn bản về thế giới của chúng ta; chúng chỉ cung cấp một ngôn ngữ đủ chặt chẽ để nói về những gì không thể biết chắc chắn. Ông từng nói, khái niệm “ngẫu nhiên tuyệt đối” cũng chẳng hợp lý hơn khái niệm “tất định tuyệt đối”, và kết luận: “chúng ta không thể có những hiểu biết xác thực về sự tồn tại của những gì không thể biết.” Nhưng, dẫu sao thì nhờ có Kolmogorov, chúng ta có thể giải thích khi nào và tại sao lại có sự không thể đó.
Hoàng Mai dịch từ bài viết The Man Who Invented Modern Probability của Slava Gerovitch đăng trên trang Nautilus,
Phùng Hồ Hải hiệu đính
Nguồn: http://nautil.us/issue/4/the-unlikely/the-man-who-invented-modern-probability
* Trên phiên bản báo in số 20.8.2016, có hình minh họa một cuốn sách của Kolmogorow xuất bản năm 1970 có dịch là “Nhập môn về phương pháp phân tích”. Tia Sáng xin đính chính lại tên sách là “Nhập môn về giải tích thực”.