Forecasting English Premier League season outcomes using expected goals-based Monte Carlo simulation
Peltola, Eetu (2024)
Kandidaatintyö
Peltola, Eetu
2024
School of Engineering Science, Laskennallinen tekniikka
Kaikki oikeudet pidätetään.
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi-fe2024051530945
https://urn.fi/URN:NBN:fi-fe2024051530945
Tiivistelmä
The result of a football match can be challenging to predict due to the uncertainty regarding the match result. This makes forecasting match results an academically interesting problem. Forecasting has been done using statistical models, machine learning, time series models, and many other methods.
The objective of this thesis is to create a statistical model and use probabilistic simulation to predict the English Premier League outcomes of the season 2023–24. Linear regression analysis is done on the promoted teams to approximate their performance in a new league.
Only quantitative factors are taken into account in this research. The model calculates the expected goals for the home and away teams. The calculations take into consideration the team’s attacking strength, the opponent’s defending strength, and the home advantage in the Premier League. The samples for the Monte Carlo simulation are taken from the Poisson distribution, with the calculated expected goals as the value of λ. The simulation is done 100,000 times and the probabilities for each team’s the final position
for the 2023–24 season is calculated.
The simulation indicates that the teams that had notably good or bad performance in the 2022–23 season have more precise simulation results. For the other teams, the simulation gave a widely spread distribution and only a directional prediction can be made. Jalkapallo-ottelun tulos voi olla vaikea ennustaa ottelun tulokseen liittyvän epävarmuuden
vuoksi. Tämä tekee jalkapallotulosten ennustamisesta akateemisesti mielenkiintoisen ongelman. Ennustamista on tehty käyttäen tilastollisia malleja, koneoppimista, aikasarjamalleja ja monia muita menetelmiä.
Tämän opinnäytetyön tavoitteena on luoda tilastollinen malli ja käyttää tilastollista simulointia ennustaakseen Englannin Valioliigan tuloksia kaudelle 2023–24. Lineaarinen regressioanalyysi tehdään nousevien joukkueiden suorituksen arvioimiseksi uudessa sarjassa. Tässä tutkimuksessa otetaan huomioon vain kvantitatiiviset tekijät.
Malli laskee maaliodottaman koti- ja vierasjoukkueille. Laskelmissa otetaan huomioon joukkueen hyökkäysvoima, vastustajan puolustusvoima ja kotiedun vaikutus Valioliigassa. Otokset Monte Carlo -simulaatiota varten otetaan Poissonin jakaumasta, jossa lasketut maaliodottamat ovat λ:n arvoja. Simulaatio suoritetaan 100 000 kertaa, ja jokaisen joukkueen lopullisen sijoituksen todennäköisyydet kaudelle 2023–24 lasketaan.
Simulaatio osoittaa, että joukkueet, jotka suoriutuivat merkittävän hyvin tai huonosti kaudella 2022–23, saavat tarkempia simulaatiotuloksia. Muille joukkueille simulaatio antoi hyvin leveän jakautuman, miksi vain suuntaa antava ennuste voidaan tehdä.
The objective of this thesis is to create a statistical model and use probabilistic simulation to predict the English Premier League outcomes of the season 2023–24. Linear regression analysis is done on the promoted teams to approximate their performance in a new league.
Only quantitative factors are taken into account in this research. The model calculates the expected goals for the home and away teams. The calculations take into consideration the team’s attacking strength, the opponent’s defending strength, and the home advantage in the Premier League. The samples for the Monte Carlo simulation are taken from the Poisson distribution, with the calculated expected goals as the value of λ. The simulation is done 100,000 times and the probabilities for each team’s the final position
for the 2023–24 season is calculated.
The simulation indicates that the teams that had notably good or bad performance in the 2022–23 season have more precise simulation results. For the other teams, the simulation gave a widely spread distribution and only a directional prediction can be made.
vuoksi. Tämä tekee jalkapallotulosten ennustamisesta akateemisesti mielenkiintoisen ongelman. Ennustamista on tehty käyttäen tilastollisia malleja, koneoppimista, aikasarjamalleja ja monia muita menetelmiä.
Tämän opinnäytetyön tavoitteena on luoda tilastollinen malli ja käyttää tilastollista simulointia ennustaakseen Englannin Valioliigan tuloksia kaudelle 2023–24. Lineaarinen regressioanalyysi tehdään nousevien joukkueiden suorituksen arvioimiseksi uudessa sarjassa. Tässä tutkimuksessa otetaan huomioon vain kvantitatiiviset tekijät.
Malli laskee maaliodottaman koti- ja vierasjoukkueille. Laskelmissa otetaan huomioon joukkueen hyökkäysvoima, vastustajan puolustusvoima ja kotiedun vaikutus Valioliigassa. Otokset Monte Carlo -simulaatiota varten otetaan Poissonin jakaumasta, jossa lasketut maaliodottamat ovat λ:n arvoja. Simulaatio suoritetaan 100 000 kertaa, ja jokaisen joukkueen lopullisen sijoituksen todennäköisyydet kaudelle 2023–24 lasketaan.
Simulaatio osoittaa, että joukkueet, jotka suoriutuivat merkittävän hyvin tai huonosti kaudella 2022–23, saavat tarkempia simulaatiotuloksia. Muille joukkueille simulaatio antoi hyvin leveän jakautuman, miksi vain suuntaa antava ennuste voidaan tehdä.
