Bóng dáng lý thuyết trò chơi trong tâm trí Sherlock Holmes

Những câu chuyện về vị thám tử tài ba và kẻ đối đầu kiệt xuất, giáo sư James Moriarty trong Bộ tuyển tập truyện Sherlock Holmes của Arthur Conan Doyle, quá hấp dẫn nhà toán học John von Neumann và nhà kinh tế Oskar Morgenstern đến mức chúng đóng vai trò quan trọng trong việc hình thành nên lý thuyết trò chơi vào đầu thế kỷ 20.

CSA-Printstock/Getty Images.

Ngành toán học này khám phá các chiến thuật để giải quyết các vấn đề ra quyết định khác nhau. Hãy xét ví dụ kinh điển là “bài toán bánh ngọt”, vốn mặc định rằng cách công bằng nhất để hai người chia một cái bánh ngọt mà ai cũng có thể được phần nhiều nhất có thể, đó là một người cố gắng cắt chiếc bánh thành hai phần bằng nhau và người còn lại được quyền chọn một miếng. Morgenstern và von Neumann đã không nghĩ ra lời giải này (người ta đã biết đến nó từ thời cổ đại), nhưng đây là một ví dụ minh họa điển hình cho cách các nhà lý thuyết trò chơi đưa ra các chiến lược tối ưu.

Người ta đặc biệt thấy cuốn hút trước cặp đôi này nhờ một bối cảnh được Doyle mô tả trong truyện ngắn “Vấn đề cuối cùng”, trong đó Moriarty truy đuổi Holmes đến một sân ga Victoria, London. Tại đó, Moriarty nhìn thấy Holmes nhảy lên một chuyến tàu đến Dover. Moriarty không thể lên tàu nữa. Vì vậy, anh ta thuê một toa tàu hỏa chạy bằng động cơ để truy đuổi. Tuy nhiên, tàu của Holmes không đi thẳng đến Dover mà dừng lại ở Canterbury trên đường đi. Vì vậy, Moriarty phải đưa ra quyết định: Nên dừng lại ở Canterbury, với hy vọng Holmes sẽ xuống tàu ở đó, hay đi thẳng đến Dover? Holmes cũng phải cân nhắc lựa chọn của mình. Từ Dover, anh ta có thể chạy trốn đến châu Âu. Tuy nhiên, anh ta biết rằng Moriarty có thể đã lường trước được kết cục này và đợi anh ta ở đó, vì vậy có lẽ Holmes nên xuống tàu ở Canterbury. Nhưng nếu đó chính xác là điều Moriarty muốn Holmes nghĩ thì sao?

Bối cảnh này đã lôi cuốn Morgenstern và von Neumann, và cuối cùng họ cũng đi đến kết luận trong cuốn sách nền tảng của họ, xuất bản năm 1944, rằng “48% là Sherlock Holmes đã chết từ khi lên tàu rời ga Victoria”. Nhưng làm thế nào họ có thể đưa ra một con số chính xác như vậy? Và Holmes nên hành động như thế nào để thoát khỏi kẻ thù của mình? Tất cả những điều này có thể được giải đáp với sự trợ giúp của lý thuyết trò chơi.

ĐẤU TRÍ 

Điều đầu tiên cần cân nhắc là Holmes và Moriarty đều thông minh và có khả năng đoán được người kia đang nghĩ gì. (“Nếu anh ta nghĩ rằng tôi nghĩ rằng anh ta nghĩ….”) Những suy xét này có thể dễ dàng đưa Holmes vào một vòng lặp logic vô tận không lối thoát.

Shelock Holmes (do diễn viên Benedict Cumberbatch đóng) và James Moriarty (do diễn viên Andrew Scott đóng) trong series phim truyền hình Shelocks.

Bởi vậy, Holmes nên giả định rằng Moriarty sẽ lường trước được quyết định của mình trong cả hai trường hợp và hạn chế thiệt hại tương ứng. Nói cách khác, trong tâm trí, vị thám tử nên tối ưu hóa quyết định của mình với những giả định bi quan nhất. Chiến lược này được von Neumann công bố ngay từ năm 1928, và đã được sử dụng để chứng minh rằng người chơi lãi lớn nhất khi anh ta giả định rằng đối thủ của mình có ý định gây ra thiệt hại lớn nhất có thể. 

Không giống như trong bài toán chiếc bánh, không có chiến lược chiến thắng rõ ràng nào cả, chỉ có may rủi mới có thể giúp ích. Hãy nghĩ tới các trò chơi như oẳn tù tì: ngay khi người chơi này lặp lại một kiểu giơ tay, đối thủ có thể lợi dụng nó để chiến thắng. Do đó, chiến lược tốt nhất là chọn kéo, búa, bao một cách cân bằng, với xác suất mỗi loại là một phần ba. Xét trung bình, cả hai bên sẽ thắng và thua với tần suất bằng nhau, giảm thiểu thiệt hại.

Trường hợp của Holmes và Moriarty phức tạp hơn một chút. Để hiểu được điểm này, cần xem xét từng kịch bản có thể xảy ra và cân nhắc chúng bằng các con số, như von Neumann và Morgenstern đã làm, sẽ rất hữu ích. Hai nhà toán học quyết định sử dụng các giá trị từ -100 đến 100, với giá trị cao tượng trưng cho một tình huống đặc biệt có lợi cho một người nhất định. Các giá trị số chính xác (còn được gọi là phần thưởng) được chọn cho mỗi tình huống là chủ quan, nhưng sau đó ta có thể sử dụng trọng số chủ quan này để đưa ra quyết định tối ưu từ góc nhìn khách quan.

Morgenstern và von Neumann xác định rằng, cuối cùng, có bốn tình huống khác nhau có thể xảy ra. Thứ nhất, Moriarty và Holmes đều có thể đến Dover, nơi Moriarty sẽ ám sát vị thám tử. Đối với Moriarty, điều này là tối ưu, vì vậy nó tương ứng với phần thưởng là 100. Mặt khác, đối với Holmes, đó là một kết quả thảm họa -100.

Thứ hai, Moriarty có thể xuống tàu ở Canterbury trong khi Holmes đi đến Dover. Đây là tin xấu cho Moriarty vì Holmes có thể trốn sang lục địa châu Âu, khiến việc lùng bắt anh ta càng khó khăn hơn. Do đó, tình huống này được đánh giá là -50 cho Moriarty. Mặt khác, đối với Holmes, đây là một kết quả tích cực, vì vậy von Neumann và Morgenstern gán cho nó giá trị là 50.

Trong kịch bản thứ ba, Moriarty đi đến Dover, nhưng Holmes đã xuống tàu ở Canterbury. Điều này không tốt cho Moriarty nhưng ít nhất vẫn tốt hơn trường hợp được mô tả ở trên. Do đó, tình huống này có thể được đánh giá là 0 cho anh ta; điều tương tự cũng áp dụng cho Holmes, người vẫn đang mắc kẹt ở Anh.

Trong trường hợp cuối cùng, cả Moriarty và Holmes đều xuống tàu ở Canterbury. Điều này sẽ là tối ưu cho Moriarty, với kết quả rõ ràng là 100, và đồng nghĩa với cái chết cho Holmes, người có kết quả là -100.

Ai cũng hướng tới việc đạt hiệu quả tối đa. Tuy nhiên, do không có quyết định tối ưu rõ ràng, Holmes và Moriarty buộc phải dựa vào may rủi. Tại đây, mọi chuyện trở nên thú vị hơn. Chẳng hạn, họ có thể tung đồng xu để quyết định xem mình sẽ xuống tàu ở Canterbury hay Dover. Nếu Moriarty dừng lại ở Canterbury, giá trị kết quả kỳ vọng của Holmes là: 0,5 × 50 – 0,5 × 100 = –25. Mặt khác, nếu Holmes xuống tàu ở Canterbury, giá trị kỳ vọng của Holmes là –0,5 × 100 + 0,5 × 0 = –50. Tổng cộng, kết quả kỳ vọng của Holmes là –0,5 × 25 – 0,5 × 50 = –37,5. Kết quả của Moriarty có cùng độ lớn nhưng ngược dấu.

Thậm chí còn tệ hơn: Trong một kịch bản mà quyết định của họ phụ thuộc vào việc tung đồng xu, Holmes sẽ chết với xác suất 50%. Đó là bởi vì Moriarty sẽ giết thám tử nếu cả hai người cùng xuống một chỗ, với xác suất là 0,5 trong mỗi kịch bản. Điều này dẫn đến xác suất chết là 0,5 × 0,5 + 0,5 × 0,5 = 50%.

CHƠI VỚI XÁC SUẤT 

Về mặt thống kê, Holmes có cơ hội lớn hơn nếu anh theo một phân phối xác suất khác – chẳng hạn, nếu anh tung một đồng xu mà xác suất mặt sấp hoặc ngửa không bằng nhau. Giả sử Holmes chọn Dover với xác suất p và Moriarty cũng chọn với xác suất q (hai người cùng tới Canterbury với các xác suất 1 – p và 1 – q, tương ứng). Nếu Moriarty đi đến Dover, kết quả kỳ vọng của Holmes là: -100 × p + 0 x (1 – p) = -100p. Mặt khác, nếu Moriarty xuống tàu tại Canterbury, kết quả kỳ vọng của Holmes là: 50 x p – 100 x (1 – p) = 150p – 100.
Trong trường hợp đầu tiên (nếu Moriarty đi đến Dover), kết quả kỳ vọng của Holmes giảm khi p tăng; trong trường hợp thứ hai, nó tăng. Để chuẩn bị cho tình huống xấu nhất, Holmes nên chọn p sao cho kết quả kỳ vọng bằng nhau – bất kể quyết định của Moriarty là gì. Để làm được điều này, cả hai giá trị kỳ vọng phải bằng nhau: 150p – 100 = -100p. Nếu giải phương trình để tìm p, bạn sẽ nhận được giá trị 0,4. Điều này có nghĩa là Holmes nên đi đến Dover với xác suất 40% và xuống tàu tại Canterbury với xác suất 60%.

Nhân tiện, ta cũng có thể lập luận như vậy với Moriarty. Nếu tính toán, tương tự ta cũng có q = 0,6. Điều này có nghĩa là Moriarty nên đi đến Dover với một xác suất là 60%. Do đó, cơ hội sống sót chung của Holmes trong tình huống này là: (xác suất Holmes ở Dover) x (xác suất Moriarty ở Canterbury) + (xác suất Holmes ở Canterbury) x (xác suất Moriarty ở Dover) = 52%, cao hơn một chút so với việc cả hai cùng tung đồng xu.

Theo cách này, von Neumann và Morgenstern đã giải quyết được tình thế tiến thoái lưỡng nan mà Holmes phải đối mặt, ít nhất là từ góc độ toán học. Nhưng điều gì xảy ra trong truyện ngắn này?

Holmes và Moriarty không mang theo bất cứ đồng xu lởm hay máy tạo số ngẫu nhiên nào. Tuy nhiên, họ vẫn hành động theo các quy luật của lý thuyết trò chơi. Holmes xuống tàu ở Canterbury và nhìn Moriarty vui vẻ đi về Dover trên chiếc tàu một toa, không hề nhận ra Holmes đã vượt mặt mình.

Việc Doyle chọn phiên bản này càng đáng chú ý hơn khi xét đến việc lý thuyết trò chơi vẫn chưa ra đời, và ông không thể nào biết đây là một giải pháp tối ưu. Có thể đó chỉ là sự trùng hợp ngẫu nhiên – hoặc có thể ông đã có trực giác tốt. Dù sao đi nữa, đây cũng là lời nhắc để tôi sớm đọc lại tác phẩm của ông.□

Tuệ Tâm dịch

Nguồn: https://www.scientificamerican.com/article/the-hidden-game-theory-of-sherlock-holmes/

Bài đăng Tia Sáng số 16/2025

Tác giả

(Visited 41 times, 41 visits today)