AI tìm nhà vô địch EURO 2024
Khi trái bóng khai cuộc bắt đầu lăn trên sân Allianz Arena, Munich, hàng loạt các dự báo tiên tri về nhà vô địch EURO 2024 bắt đầu được đưa ra. Vậy đâu là đội tuyển xứng đáng với ngôi vương năm nay?
Nhìn vào lịch sử giải vô địch bóng đá châu Âu (EURO), kể từ khi được bắt đầu tổ chức vào năm 1960 cho đến nay, có 10 đội tuyển quốc gia giành 16 ngôi vô địch, trong đó nhiều nhất là Đức và Tây Ban Nha ba lần, Ý và Pháp hai lần, còn lại Xô viết, Czechoslovakia, Hà Lan, Đan Mạch, Hy Lạp, Bồ Đào Nha một lần. Sự khắc nghiệt của trái bóng còn ở chỗ, trong lịch sử EURO, Tây Ban Nha là đội tuyển duy nhất bảo vệ được ngôi vương, nghĩa là giành ngôi vô địch hai kỳ liên tiếp, năm 2008 và năm 2012.
Các trận đấu luôn đi kèm với bất ngờ, đó là vẻ đẹp của trái bóng tròn. Thông thường, người ta không thể dựa vào kinh nghiệm hay sức mạnh truyền thống của hai đội tuyển để nói chắc như đinh đóng cột về một kết quả nào đó, khi tiếng còi mãn cuộc của trọng tài chưa cất lên. Đó là một phần lý do vì sao, xung quanh các giải bóng đá như World Cup hay EURO thường có những màn tranh luận, dự đoán sôi nổi về việc đội tuyển giành thắng lợi ở vòng bảng đến tứ kết, bán kết và chung kết. Nhận định và phân tích của các chuyên gia bóng đá không phải lúc nào cũng đúng cả do những thiên kiến và ảnh hưởng của cảm xúc yêu ghét cá nhân. Nếu quá khó để dự đoán, người ta thường nghĩ đến nhiều cách khác, không chỉ ý kiến của các chuyên gia phân tích bóng đá mà còn nhờ cậy đến cả “những nhà tiên tri” của thế giới tự nhiên như bạch tuộc, voi, vẹt, tinh tinh…, trong đó chú bạch tuộc mang tên Paul ở Trung tâm Đời sống đại dương, Oberhausen, Đức đã dự đoán đúng 8/8 trận đấu thuộc vòng chung kết World Cup 2010. Nhìn chung, dẫu độ chính xác của dự đoán dạng này còn là vấn đề may rủi nhưng chắc chắn nó khiến cho các kỳ EURO trở nên thú vị hơn.
Theo thời gian, ngoài những cách thức quen thuộc này, thế giới hiện đại đã trao cho những người mê bóng đá và những người thích dự đoán kết quả một trận đấu, một mùa giải một cách thức gợi ý mới từ các công cụ tiên tiến của học máy, AI, các mạng thần kinh, các mô phỏng trên siêu máy tính… Tại sao các công cụ này lại có thể dự đoán được kết quả bóng đá? Trong thế giới thực, bóng đá là một trong những môn thể thao có thể tự tạo ra được một lượng dữ liệu thống kê khổng lồ về cá nhân các cầu thủ đến các trận đấu giữa các câu lạc bộ, các đội tuyển quốc gia, môi trường mà các trận đấu diễn ra. Nhờ vậy, vô số thuật toán có thể sử dụng dữ liệu thống kê này để dự đoán về vô số thông tin liên quan đến một trận bóng cụ thể, khả năng chấn thương của một cầu thủ, hiệu suất thi đấu hay điểm mặt những tài năng trẻ…
Đó cũng là một cơ hội cho các nhà khoa học máy tính trên khắp hành tinh huấn luyện và thử nghiệm các thuật toán của mình, mặc dù họ biết rằng sự phức tạp trong dự đoán các kết quả bóng đá đều bắt nguồn từ việc có quá nhiều biến số trong một trận đấu mà các thuật toán có thể không tính được hết, bao gồm động lực của đội bóng, hình thể cầu thủ, hiệu suất thi đấu trong lịch sử, các yếu tố tình huống như địa điểm thi đấu và sự ủng hộ của khán giả.
Vào tháng 3/2024, tại hội thảo khoa học Các ngành khoa học sự sống, kỹ thuật, kiến trúc và toán học quốc tế lần thứ 16 ở Istanbul, nhóm các nhà nghiên cứu ở trường Đại học Kỹ thuật Gebze, Thổ Nhĩ Kỳ, Semih Göksu, Bülent Sezen và Yavuz Selim Balcıoğlu đã đưa ra một cách tiếp cận dự đoán nhà vô địch EURO 2024 bằng các mạng thần kinh nhân tạo (ANN), một mô hình được xây dựng dựa vào cấu trúc và chức năng của các mạng thần kinh sinh học thuộc bộ não động vật. Trong báo cáo của mình, họ cho rằng có những giới hạn của nhiều mô hình dự đoán truyền thống nên họ đã sử dụng một cách tiếp cận mới bằng việc sử dụng mạng thần kinh nhân tạo để xây dựng một mô hình dự đoán không chỉ tích hợp dữ liệu hiệu suất lịch sử mà còn đánh giá được một cách linh hoạt động lực của các đội tuyển. “Mạng thần kinh nhân tạo rất thành thạo trong việc nhận diện các mối quan hệ phức hợp, phi tuyến tính bên trong các bộ dữ liệu lớn, khiến cho nó trở thành một công cụ lý tưởng nắm bắt bản chất đa diện của các kết quả trận đấu bóng đá”, họ viết trong báo cáo.
Bộ dữ liệu mà các nhà nghiên cứu Thổ Nhĩ Kỳ sử dụng để huấn luyện cho các mạng thần kinh đã được xây dựng từ nhiều nguồn khác nhau, ví dụ như các thống kê chính thức của Liên đoàn bóng đá châu Âu (UEFA), các nền tảng phân tích bóng đá nổi tiếng, cơ sở dữ liệu thi đấu trong lịch sử. Một phần quan trọng của dữ liệu từ các vòng chung kết EURO, bao gồm những đội tuyển vượt qua vòng loại trên trang web chính thức của UEFA. Thu thập từ mùa giải 2016-2017 đến nay, bộ dữ liệu này tập trung cụ thể vào các giải đấu và trận đấu quốc tế mà các đội tuyển quốc gia châu Âu tham dự, như các vòng chung kết EURO, các vòng loại và vòng chung kết World Cup và các trận đấu giao hữu quốc tế. Mỗi hồ sơ trong bộ dữ liệu này liên quan đến một trận đấu, với hơn 200 trận đấu được phân tích, mỗi trận đấu được miêu tả bằng khoảng xấp xỉ 70 thuộc tính.
Họ tuyên bố, công cụ mạng thần kinh nhân tạo mà họ xây dựng tập trung vào tối ưu vô số siêu tham số để có thể đạt được mức dự đoán có độ chính xác cao nhất, vượt qua được các phương pháp thống kê truyền thống và các mô hình học máy cơ bản. “Năng lực của mạng thần kinh nhân tạo trong xử lý và học hỏi từ một phạm vi rộng lớn các điểm dữ liệu, từ thống kê hiệu suất thi đấu của cầu thủ đến động lực học đội tuyển, các xu hướng lịch sử, đã chứng tỏ các kết quả hứa hẹn trong phân tích thể thao”, họ nhấn mạnh đến hiệu quả của sản phẩm nghiên cứu.
Sportradar AG, một tập đoàn đa quốc gia chuyên về thu thập và phân tích dữ liệu thể thao cho các nhà cái cá cược, các liên đoàn thể thao quốc gia và nhiều công ty truyền thông, đã phát triển một hệ AI quyền lực, sử dụng khoảng 10.000 mô phỏng trận đấu trên siêu máy tính để dự đoán EURO 2024. Hệ AI này cho rằng, đội tuyển xứng đáng giành ngôi vô địch không phải ai khác là đội tuyển Anh với 24% cơ hội chiến thắng, nghĩa là trong số 10.000 kịch bản thì họ vượt qua được con số 2.400 kịch bản. Đội bóng của cựu danh thủ Gareth Southgate vượt lên trên đội tuyển Pháp 18,6%, đội tuyển Đức 15,18%, Bồ Đào Nha 10,47% và Tây Ban Nha 9,27%.
Tuy nhiên, những người xây dựng hệ AI này thừa nhận, có vô số thách thức về những nhân tố không thể dự đoán được như chấn thương của cầu thủ, tâm lý của cầu thủ, động lực thi đấu của đội tuyển và những quyết định mang tính chiến lược theo thời gian thực của các huấn luyện viên. Bên cạnh đó, các thuật toán AI cũng bị nghi ngờ về những thiên kiến của bộ dữ liệu và các tham số mà chúng sử dụng.
Dĩ nhiên là những thuật toán và dữ liệu huấn luyện khác nhau khiến các công cụ AI khác nhau đưa ra những kết quả không hề trùng khớp với nhau. Một nhóm chuyên gia từ trường Đại học Innsbruck, Luxembourg, trường Đại học Các khoa học ứng dụng Molden và các trường Đại học Kỹ thuật ở Dortmund và Munich có một kết quả khác. Họ kết hợp nhiều mô hình thống kê trong hai bước: bước thứ nhất, ba mô hình thống kê phức hợp xác định sức mạnh của các đội tuyển và cầu thủ bằng thông tin khác nhau – bao gồm sức mạnh của đội tuyển ở những trận đấu trước đó, một mô hình nhà cái cá cược dựa trên tỉ lệ đánh cược và các xếp hạng của từng cầu thủ; bước thứ hai, một bộ các thuật toán học máy quyết định dựa trên việc kết hợp ba mô hình với thông tin khác của các đội tuyển. Các yếu tố như giá trị thị trường, số cầu thủ của giải đấu và GDP như một nhân tố kinh tế xã hội của từng quốc gia cũng đóng một vai trò nhất định.
Bằng việc ước tính số lượng bàn thắng ở các trận đấu có thể xảy ra, mô hình đã sự đoán xác suất thắng, hòa, thua cho mỗi trận đấu thông qua phân phối hai biến kết hợp, một phân phối xác suất mang tên nhà toán học Pháp Siméon-Denis Poisson nhằm tính xác suất xảy ra một số lượng sự kiện trong một khoảng thời gian nhất định không đổi và với một tỷ lệ trung bình cho trước. Cách tiếp cận này cho phép mô phỏng toàn bộ các bảng, nhận diện các đội tuyển sẽ giành thắng lợi ở vòng đối đầu trực tiếp và cuối cùng là đội vô địch. Các nhà nghiên cứu đã thực hiện mô phỏng EURO 2024 đúng 100.000 lần và tính toán tỉ lệ chiến thắng cho từng đội tuyển trong toàn giải. “Với sự hỗ trợ của mô hình mà chúng tôi xây dựng, chúng tôi có thể khám phá ra diễn biến có thể xảy ra của EURO thông qua mô phỏng. Dĩ nhiên không thể không nói rằng đây chỉ là các xác suất thôi và nó có bất định về kết quả”, TS. Achim Zeileis của trường Đại học Innsbruck nói.
Có lẽ, họ muốn chỉ ra kết quả dự đoán của các thuật toán có thể có sai lầm, mặc dù hiện giờ nó cũng có sức thuyết phục của riêng mình: mô hình tính toán nhận diện đội tuyển Pháp là ứng cử viên số một của ngôi vô địch với tỉ lệ giành chiến thắng 19,2%, tiếp theo là Anh với 16,7%, và chủ nhà Đức là 13,7%.
Trong khi ngưỡng mộ khả năng dự đoán của AI, những người yêu bóng đá không thể quên được sự tồn tại của bất ngờ trong lịch sử bóng đá, điều đã từng xảy ra ở vòng chung kết EURO 1992 và EURO 2004, dẫn đến màn đăng quang của Đan Mạch và Hy Lạp. Cho đến nay, người ta vẫn nhắc lại EURO 2004 như một vòng chung kết giàu cảm xúc và sự thăng giáng khó hình dung: các đội tuyển giàu truyền thống như Đức, Tây Ban Nha, Ý đều bị loại ở vòng bảng trong khi nhà vô địch Pháp bị Hy Lạp loại ở tứ kết. Bồ Đào Nha từng đánh bại Hy Lạp ở trận mở màn, loại Anh và Hà Lan để rồi gặp lại Hy Lạp ở chung kết – một trận đấu lịch sử với hai đội lần lượt gặp nhau ở trận mở màn và ở trận khép lại giải đấu. Cuối cùng, Hy Lạp đã đánh bại Bồ Đào Nha.
Nếu đưa các dữ liệu quá khứ của Hy Lạp cho một thuật toán AI và những mô phỏng nào đó thì chắc hẳn họ không được chúng xét vào vị trí số một, ví dụ chỉ hai lần vượt qua vòng loại EURO 1980, giải đấu chỉ đem lại cho họ một điểm, và World Cup 1994, nơi họ thua trắng cả ba trận.
Xét cho cùng, chất thơ của bóng đá chính là sự bất ngờ và yếu tố tình huống. Điều đó vượt lên trên tất cả mọi thuật toán và dữ liệu.□
————-
Những kết quả dự đoán của AI có thể trùng khớp với dự đoán của nhiều chuyên gia, tuy nhiên, chúng ta không thể bỏ qua một số giới hạn của các thuật toán thông minh, đó là AI không am hiểu một cách đầy đủ tính bất định của thể thao và có thể để lỡ những sắc thái quan trọng của bối cảnh; việc dựa dẫm vào AI có thể dẫn đến việc để lỡ dự đoán dựa trên phân tích và trực giác của các chuyên gia bóng đá bằng xương bằng thịt; AI có thể làm mất đi sự hấp dẫn của bản chất không thể dự báo ở các sự kiện thể thao, đặc biệt là bóng đá.
—————
Tài liệu tham khảo:
“Predicting the UEFA EURO 2024 winner: an artificial neural network approach”. 16th international İstanbul Scientific research congress on life, engineering, architechture, and mathematical sciemces proceedings book.
“Artificial Intelligence Predicts England as Front-Runner for UEFA EURO 2024”. https://elblog.pl/
“France is the sta-tis-ti-cal favourite for the EURO 2024”. https://www.uibk.ac.at/
Bài đăng Tia Sáng số 12/2024