Прогнозування матчів плей-офф чемпіонату світу: чи так сильно відрізняються рівні різних ШІ?

robot
Генерація анотацій у процесі

Оригінал | Odaily Planet Daily (@OdailyChina)

Автор: Asher (@Asher 0210)_

Перед кожним матчем чемпіонату світу я прошу AI зробити прогноз, і майже кожна модель говорить переконливо, з безліччю деталей.

Одні говорять про вартість команд, інші розбирають дані групового етапу, треті аналізують травми та тактику, а деякі прямо дають сценарії рахунку, додаткового часу та пенальті. На перший погляд, ChatGPT, Grok, Qianwen, DeepSeek, Gemini, Claude — всі добре розуміються на футболі.

Але як користувач ринку прогнозів, мене насправді хвилює не те, яка модель говорить повніше, а яка варта більшої довіри.

Оскільки чемпіонат світу перейшов до стадії плей-оф, Odaily Planet Daily починаючи з першого матчу, перед грою ставила по можливості однакові запитання різним моделям AI, а після матчу порівнювала з реальними результатами — які моделі просто виглядають переконливо, а які дійсно заздалегідь вловили хід гри.

Наразі в плей-оф чемпіонату світу, які вже завершилися, Канада з рахунком 1:0 вирвала перемогу у Південно-Африканської Республіки, Бразилія 2:1 ледве перемогла Японію, Німеччина вилетіла після серії пенальті з Парагваєм, Нідерланди також впали під пенальті від Марокко. А матч Бельгія — Сенегал перетворився на 2:2 з камбеком у додатковий час, що прямо підкреслило невизначеність плей-оф.

DeepSeek та Gemini передбаченням матчу з Марокко здобули славу

Найбільш пам'ятним наразі є прогноз DeepSeek та Gemini на матч Нідерланди проти Марокко. Перед грою легко було помилитися з вибором — Нідерланди мали сильніший склад на папері, повніший склад, багато моделей знали, що Марокко буде непросто, але все ж більше вірили, що Нідерланди пройдуть.

Сильна сторона DeepSeek та Gemini в тому, що вони не зупинилися на стадії "цей матч буде напруженим", а написали подальший сценарій. Gemini прямо перед грою дав рахунок 1:1 в основний час, перемогу Марокко по пенальті. В результаті матч дійсно закінчився 1:1, і Марокко по пенальті 3:2 вибили Нідерланди. Вони не просто вгадали напрямок, а й те, як гра дійде до пенальті і хто врешті переможе, майже збіглося.

Прогноз Gemini на матч Нідерланди — Марокко

DeepSeek також був близьким. Він визначив, що основний час, ймовірно, закінчиться 1:1 або 0:0, гра може затягнутися до додаткового часу і навіть пенальті, і схилявся до того, що Марокко за рахунок оборони та контратак здійснить сенсацію і вийде далі.

Прогноз Deepseek на матч Нідерланди — Марокко

Після цього матчу присутність DeepSeek та Gemini значно зросла. Особливо Gemini — цього разу він не схожий на передматчевий прогноз, а більше на те, ніби заздалегідь подивився сценарій гри.

Grok та Qianwen послідовно вгадують конкретні рахунки, стабільність вища, ніж очікувалося

Окрім DeepSeek та Gemini, які сяяли в матчі з Марокко, Grok та Qianwen також не залишилися непоміченими. Їхня найяскравіша риса — в деяких матчах, де напрямок перемоги був відносно зрозумілим, вони не лише правильно визначили команду, яка проходить далі, але й дали досить близький до кінцевого результату конкретний рахунок.

Матч Південно-Африканська Республіка — Канада є прикладом. Перед грою більшість моделей AI вважали фаворитом Канаду, але розбіжності були в тому, чи легко виграє Канада. Grok перед грою дав прогноз 1:0 на користь Канади, Qianwen також давав перемогу в один м'яч. Зрештою Канада дійсно пройшла лише з одним забитим голом, не перетворивши гру на велику перемогу, як дехто очікував.

Прогноз Qianwen на матч Південно-Африканська Республіка — Канада

Матч Бразилія — Японія був схожим. Більшість моделей AI вважали Бразилію сильнішою, але ключовим було те, чи зможе Японія тримати гру в напрузі. Grok та Qianwen передбачили рахунок 2:1, і гра дійсно закінчилася перемогою Бразилії 2:1. Вони правильно визначили не просто "Бразилія виграє", а те, що Японія зможе створити Бразилії достатньо проблем.

Матч Кот-д'Івуар — Норвегія також обидва вгадали досить точно. У Норвегії є Голанн, напрямок проходу неважко зрозуміти, але фізична сила та флангові атаки Кот-д'Івуару не дозволять грі стати односторонньою. Grok та Qianwen передбачили перемогу Норвегії 2:1, і кінцевий рахунок точно вклався в цей "сценарій".

Прогноз Grok на матч Кот-д'Івуар — Норвегія

Перевага Grok та Qianwen — вони більш детально аналізують матчі з фаворитами. Вони не написали заздалегідь великий сценарій з вильотом Нідерландів від Марокко, але в матчах Канади, Бразилії, Норвегії, Франції вони досить точно дали напрямок перемоги та рахунок. Іншими словами, вони не обов'язково найкраще ловлять сенсації, але добре визначають, чи фаворит пройде з розгромом, чи ледве переможе.

ChatGPT не має багато точних рахунків, але аналіз перебігу матчів досить точний

ChatGPT не передбачив заздалегідь, як Марокко виб'є Нідерланди по пенальті, як Gemini, і не вгадав кілька конкретних рахунків, як Grok та Qianwen. Але його перевага — у багатьох матчах, які на перший погляд виглядають як перевага сильнішої команди, ChatGPT більш чітко нагадує, що гра може бути не такою легкою.

Приклад — матч Бразилія — Японія. ChatGPT передбачив прохід Бразилії, але не описав гру як легку перемогу Бразилії, а зазначив, що пресинг, рух та дисципліна Японії зроблять гру незручною для Бразилії, і вони навіть можуть забити першими або зрівняти рахунок. Матч Кот-д'Івуар — Норвегія також: ChatGPT передбачив прохід Норвегії, але заздалегідь сказав, що це не легка гра, фізична сила, флангові атаки та переходи Кот-д'Івуару створять проблеми.

Крім того, у матчі плей-оф Англія — Демократична Республіка Конго ChatGPT не просто написав про велику перемогу Англії, а вважав, що гра може бути досить нудною, ДР Конго за допомогою низької оборони затягне темп. Зрештою Англія пройшла, але не легко.

Прогноз ChatGPT на матч Англія — Демократична Республіка Конго

Сильна сторона ChatGPT — не в тому, що він щоразу точно прогнозує рахунок, а в тому, що часто заздалегідь може сказати, де будуть труднощі в матчі. Він добре підходить для розуміння гри, але не для того, щоб дивитися лише на кінцевий рахунок. Він може досить точно описати процес, але коли треба дійсно написати про велику сенсацію, йому бракує рішучості.

Виліт Німеччини став колективним провалом моделей AI

Якщо попередні матчі ще можна було побачити сильні сторони різних моделей, то матч Німеччина — Парагвай став колективним провалом.

Перед грою всі моделі AI були на боці Німеччини. ChatGPT, Grok, Qianwen, Gemini, Claude — всі були за Німеччину, прогнози рахунку в основному зводилися до 2:0, 3:0 або 3:1. Аргументи були однакові: всі вважали, що Німеччина сильніша на папері, має кращу глибину складу, більше атакуючої потужності.

Але результат виявився проблемним. Моделі AI недооцінили здатність Парагваю затягнути гру в болото, Німеччина не змогла вирішити питання в основний час, не змогла зламати глухий кут у додатковий час і врешті-решт програла Парагваю по пенальті та вилетіла.

Хто зараз найточніший?

Якщо дивитися на вже завершені матчі плей-оф, стають помітні особливості різних моделей.

DeepSeek та Gemini мають найбільш яскраві моменти. Вони не лише можуть передбачити прохід таких фаворитів, як Бразилія, Франція, але й у складніших для прогнозування сенсаційних матчах дали дуже цінні відповіді. У матчі Нідерланди — Марокко їхня ключова перевага полягала в тому, що вони наважилися заздалегідь написати сценарій сенсації Марокко та серії пенальті. Особливо Gemini, який прямо передбачив прохід Марокко по пенальті — цей матч дійсно вражає.

Grok та Qianwen більше схожі на "гравців за рахунком". Вони вгадали багато конкретних рахунків, особливо добре проявили себе в матчах Канади, Бразилії, Норвегії, Франції. Але проблема в тому, що при зустрічі з такими традиційними сильними командами, як Німеччина, Нідерланди, вони в кінцевому підсумку схилялися до фаворита.

ChatGPT та Claude більше схожі на "аналітиків". Вони пишуть повні аргументи, напрямок здебільшого не помиляється, також можуть попередити про ризик додаткового часу. Але проблема в тому, що вони часто бачать, що матч буде важким, але не наважуються зробити висновок на користь сенсації. Матч Нідерланди — Марокко саме такий: вони вже бачили ризик додаткового часу та пенальті, але все ж більше вірили в Нідерланди.

Отже, замість того, щоб поспішно питати, яка модель найкраще розуміється на футболі, краще подивитися, для яких сценаріїв кожна з них підходить.

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріплено