Previziunea Euro 2025 a femeilor UEFA cu învățare statistică îmbunătățită

URMĂREȘTE-NE
16,065FaniÎmi place
1,142CititoriConectați-vă

(Acest articol a fost publicat pentru prima dată pe Ahim zeileisși a contribuit cu drag la R-Bloggers). (Puteți raporta problema despre conținutul de pe această pagină aici)


Doriți să vă împărtășiți conținutul pe R-Bloggers? Faceți clic aici dacă aveți un blog sau aici dacă nu.

Prognozele probabilistice pentru Euro 2025 pentru femei UEFA sunt obținute prin utilizarea unui ansamblu de învățare automată care combină caracteristici îmbunătățite statistic și alte informații despre echipe. Favoritul este Spania, urmată de Germania, Franța și Anglia.

Euro 2025 pentru femei UEFA va începe mâine, găzduit de Elveția. Un număr tot mai mare de fani de fotbal din întreaga lume nu urmează doar turneele pentru bărbați, ci și femei. Ei așteaptă cu nerăbdare să vadă cum 16 dintre cele mai bune echipe europene concurează între 2 și 27 iulie pentru a determina noul campion european. În așteptarea turneului, marea întrebare este cine dintre echipe va reuși, cine va renunța și cine va predomina în cele din urmă. În timp ce, desigur, nu este încă posibil să dați definitiv Răspunsuri la aceste întrebări, suntem capabili să oferim probabilistic Previziuni pentru toate meciurile posibile bazate pe o combinație de învățare automată, statistici și calcul. Acest lucru ne permite să explorăm cursul probabil al turneului prin simulare.

Logo -ul UEFA pentru femei 2025

Probabilități câștigătoare

Prognoza se bazează pe un ansamblu de cursanți de mașini care îmbină trei surse principale de informații: o estimare a abilității pentru fiecare echipă bazată pe meciuri istorice; o estimare a abilității pentru fiecare echipă bazată pe cote de la 24 de case de pariuri; și alte caracteristici ale echipei și ale country (de exemplu, rang FIFA sau PIB). Un ansamblu de studenți de mașini este instruit cu privire la rezultatele turneelor ​​Euro pentru femei UEFA din 2013 până în 2022 și apoi aplicat pentru a obține o prognoză pentru UEFA Euro 2025. Mai precis, ansamblul estimează numărul prevăzut de obiective pentru toate meciurile posibile între toate cele 16 echipe din turneu. Pe baza obiectivelor prezise probabilitățile pentru un câştiga, remizăsau pierderi În fiecare dintre aceste meciuri pot fi calculate dintr -o distribuție bivariată Poisson. Acest lucru ne permite să simulăm toate meciurile din faza de grup și care echipe merg la faza de eliminare și care în cele din urmă câștigă turneul. Repetarea simulării de 100.000 de ori produce probabilități de câștig pentru fiecare echipă. Rezultatele arată că campionul mondial al Spaniei, este, de asemenea, favoritul titlului european, cu o probabilitate câștigătoare de 27,2%, urmată de câștigătorul de opt ori Germania cu 23,0%, Franța cu 17,6%și apărarea campionului Anglia cu 17,2%. Probabilitățile câștigătoare pentru toate echipele sunt afișate în Barchart de mai jos, cu mai multe informații legate în versiunea interactivă cu lățime completă.

Grafic interactiv cu lățime completă

Barchart: probabilități de câștigBarchart: probabilități de câștig

Metodologia acestui studiu a fost dezvoltată de o colaborare internațională a echipelor din jurul Andreas Groll (Tu Dortmund), Christophe Ley (Universitatea din Luxemburg), Gunther Schauberger (Tu München), Achim zeileis (Universität Innsbruck). În acest an, Marjan Farahani și Rouven Michels au contribuit și la studiu.

Ideea de bază a prognozei este de a continua în doi pași. În primul pas, sunt folosite două modele statistice sofisticate pentru a determina punctele forte ale tuturor echipelor folosind seturi de informații disparate. În a doua etapă, un ansamblu de învățători de mașini decide cum să combine cel mai bine estimările de forță cu alte informații despre echipe.

  • Abilități istorice de potrivire:
    O estimare a abilității este obținută pentru fiecare echipă bazată pe date „retrospective”, și anume toate meciurile naționale istorice din ultimii 8 ani. O Modelul bivariat Poisson Cu efectele fixe specifice echipei este adaptat la numărul de goluri marcate de ambele echipe din fiecare meci. Cu toate acestea, mai degrabă decât ponderea în mod egal pentru toate meciurile de obținut medie Abilitățile echipei (sau punctele forte ale echipei) pe întreaga perioadă de istorie, se folosește o schemă de ponderare exponențială. Aceasta atribuie mai multă greutate rezultate mai recente și astfel produce o estimare a actual Abilități de echipă. Mai multe detalii pot fi găsite în Ley, Van de Wiele, Van Eetvelde (2019).

  • Abilități de consens de pariuri:
    O altă estimare a abilității pentru fiecare echipă este obținută pe baza datelor „prospective”, și anume șansele a 24 de case de pariuri internaționale care reflectă așteptările lor de experți pentru turneu. Folosind Modelul de consens de pariuri de pariuri Din Leitner, Zeileis, Hornik (2010), cotele de pariuri sunt ajustate mai întâi pentru marjele de profit ale casei de pariuri („în curs de desfășurare”) și apoi medie (pe scară de logit) pentru a obține un consens pentru probabilitatea câștigătoare a fiecărei echipe. Pentru a ajusta efectele tragerii la traseu (acest lucru ar fi putut duce la grupuri mai ușoare sau mai grele pentru unele echipe), o abordare de simulare „inversă” este folosită pentru a deduce ce abilități ale echipei sunt cel mai probabil să conducă la probabilitățile de câștigare a consensului.

  • Ansamblu de învățare automată:
    În cele din urmă, un ansamblu de învățare automată, o așa-numită pădure aleatorie, este utilizată pentru a combina aceste variabile extrem de agregate și informative de mai sus, împreună cu diverse variabile relevante suplimentare, obținând prognoze probabilistice rafinate pentru fiecare meci. O astfel de abordare a fost sugerată pentru prima dată de Groll, Ley, Schauberger, Van Eetvelde (2019) și ulterior îmbunătățită în colaborare. Ansamblul de învățare automată este instruit pentru a decide cum să amestece diferitele estimări ale abilității cu caracteristici specifice echipei, care sunt de obicei mai puțin informative, dar încă suficient de puternice pentru a îmbunătăți prognozele. Caracteristicile considerate cuprind detalii specifice echipei și country (de exemplu, rangul FIFA, numărul de jucători ai Ligii Campionilor și PIB pe cap de locuitor). Combinând un ansamblu mare de cursanți de mașini, fiecare dintre acestea folosind informațiile disponibile oarecum diferit, importurile relative ale tuturor covariatelor pot fi deduse automat. Numărul prevăzut de goluri pentru fiecare echipă poate fi apoi utilizat în cele din urmă pentru a simula întregul turneu de 100.000 de ori.

Se potrivesc cu probabilitățile

Utilizarea prognozelor din ansamblul de învățare automată produce numărul prevăzut de obiective pentru ambele echipe din fiecare meci posibil. Informațiile explicative utilizate pentru aceasta este diferența dintre cele două echipe din fiecare dintre variabilele enumerate mai sus, adică diferența de abilități istorice de potrivire (la scară de jurnal), diferența de abilități de consens de carte de pariuri (din nou pe o scară de jurnal), diferența în evaluările medii ale jucătorilor din echipele, etc. câştigaa remizăsau a pierderi. Același lucru poate fi repetat în orele suplimentare, dacă este necesar, ajustarea pentru intervalul de timp mai scurt de 30 de minute și, în cele din urmă, se folosește un flip de monedă pentru a decide penalități, dacă este necesar.

Următoarea foaie de căldură arată pentru fiecare posibilă combinație de echipe probabilitatea ca o echipă să bată cealaltă echipă într -un meci de eliminare. Schema de culori folosește verde vs. violet pentru a semnala probabilitățile de mai sus față de sub 50%, respectiv. Schimbările de instrumente pentru fiecare potrivire din versiunea interactivă a graficului imprimă, de asemenea, probabilitățile pentru ca potrivirea să se încheie într -un câştiga, remizăsau pierderi după timpul normal.

Grafic interactiv cu lățime completă

Heatmap: probabilități de potrivireHeatmap: probabilități de potrivire

Performanță pe tot parcursul turneului

Întrucât fiecare meci poate fi simulat cu probabilitățile în perechi de mai sus, este, de asemenea, o pădure dreaptă să simuleze întregul turneu (aici: de 100.000 de ori) oferind probabilități de „supraviețuire” pentru fiecare echipă în diferite etape.

Grafic interactiv cu lățime completă

Linia complot: Probabilități de supraviețuireLinia complot: Probabilități de supraviețuire

Mărunţişuri

Toate prognozele noastre sunt probabilistice, în mod clar sub 100%și, în niciun caz, sigure. Astfel, deși putem cuantifica această incertitudine în ceea ce privește probabilitățile dintr -un ansamblu de turnee potențiale, este departe de a fi predeterminată care dintre aceste turnee potențiale vom vedea în cele din urmă în timpul turneului propriu -zis.

Cu toate acestea, viziunea probabilistică ne oferă câteva idei interesante: de exemplu, în timp ce majoritatea caselor de pariuri favorizează clar Spania peste Germania, Franța și Anglia, diferențele sunt mult mai mici în modelul nostru. Într-un meci dintre Spania și oricare dintre celelalte trei co-favorite, probabilitatea de a câștiga sau de a pierde este foarte aproape de o flip de monedă corectă. Acest lucru arată că principalul motiv al probabilității de câștigare a Spaniei pentru turneu nu este atât de mult încât sunt atât de mai puternici decât co-favoritele lor, ci că au fost ceva mai norocoși în remiza turneului. Spania începe în grupul B oarecum mai slab și va trece foarte probabil la sferturile de finală și va face față unei echipe din cel mai slab grup A, inclusiv Elveția gazdă. Astfel, cursul preconizat al turneului este foarte diferit de cel al co-favoritelor Franța și Anglia, care au fost atrași împreună în cel mai dur grup D, incluzând și fostul campion european Olanda.

Cele patru echipe de top sunt, de asemenea, cel mai probabil concurenții din semifinale. Cu toate acestea, probabilitatea prevăzută de a ajunge la semifinala pentru Elveția gazdă este, de asemenea, moderat ridicată (39,3%). Acest lucru reflectă faptul că au șanse foarte bune de a trece la stadiul de eliminare și cu un pic de noroc ar putea fi bun pentru o surpriză, chiar dacă probabilitatea de a merge până la capăt și de a câștiga titlul este destul de scăzută (3,4%).

În orice caz, toate acestea înseamnă că prognozele probabilistice lasă mult loc pentru surprize și emoții în timpul UEFA Women’s Euro 2025. Dar ceea ce este absolut sigur este că așteptăm cu nerăbdare un turneu distractiv ca fani ai fotbalului (mult mai mult decât ca predatori profesioniști).

Dominic Botezariu
Dominic Botezariuhttps://www.noobz.ro/
Creator de site și redactor-șef.

Cele mai noi știri

Pe același subiect

LĂSAȚI UN MESAJ

Vă rugăm să introduceți comentariul dvs.!
Introduceți aici numele dvs.