Network demand forecasting with data science
Juvonen, Joonas (2022)
Pro gradu -tutkielma
Juvonen, Joonas
2022
School of Business and Management, Kauppatieteet
Kaikki oikeudet pidätetään.
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi-fe2022050231886
https://urn.fi/URN:NBN:fi-fe2022050231886
Tiivistelmä
During 2020-2022 the aviation market has experienced the biggest demand disruption in its history. The global pandemic and traveling restrictions have seriously disrupted the seasonal and steadily growing aviation travel market.
The purpose of this thesis is to study the data science methods for forecasting networked aviation passenger demand under stable and disruptive conditions. Appropriate forecasting methods can improve profitability and sustainability of aviation operations in all conditions. During increased volatility, accurate demand forecasting can also enable dynamic responses to reduce losses and grasp new emerging business opportunities.
The research studied feasible forecasting methods for seasonal and non-stationary passenger demand. As a result, it was discovered that time series forecasting models such as exponential smoothing, autoregressive integrated moving average, neural networks, and linear regression models were suitable for this research. The performance of these methods changes significantly when compared between stable and disruptive conditions.
Under stable conditions, the forecasting methods that utilize the seasonality nature of the data have the best relative performance and were significantly more accurate than the standard seasonal naïve forecast that was used as a benchmark method. The forecasting performance of the linear regression and other explanatory variable models were proven to be dependent on the quality of the explanatory data and the relationship between the regression variables.
In disruptive conditions, the performance of all studied forecasting models deteriorates. However, the performance differences between the methods increase and quickly adapting models are more capable to operate under volatile conditions. This finding indicates that the different robustness characteristics of each forecasting method should be accounted when selecting appropriate model for time series forecasting. Vuosina 2020–2022 ilmailutoimiala on kohdannut historiansa suurimman kysyntäshokin. Globaali pandemia ja matkustusrajoitukset ovat merkittävästi häirinneet normaalisti hyvin kausiluonteista ja vakaasti kasvavaa matkustajaliikennemarkkinaa.
Tämän opinnäytetyön tarkoituksena on tutkia matkustajaliikenteen kysynnän ennustamiseen tarkoitettuja datatieteen menetelmiä sekä stabiileissa että nopeasti muuttuvissa olosuhteissa. Tarkoituksenmukaiset ennustemenetelmät voivat parantaa lentoliikenteen kannattavuutta ja ympäristöystävällisyyttä kaikissa olosuhteissa. Tämän lisäksi nopeasti muuttuvissa olosuhteissa tarkka kysynnän ennustaminen mahdollistaa nopeat sopeutustoimet ja reagoinnin uusiin nouseviin liiketoimintamahdollisuuksiin.
Tutkimus perehtyi kausiluontaisen ja ajan myötä muuttuvan matkustajakysynnän ennustemenetelmiin. Tutkimuksen tuloksena huomattiin, että aikasarja ennustemenetelmät kuten eksponentiaalinen tasoitus, integroitu autoregressiivinen liikkuva keskiarvo, neuroverkko ja lineaarinen regressio olivat tarkoituksenmukaisia tässä tutkimuksessa. Näiden menetelmien ennustetarkkuus muuttuu merkittävästi siirryttäessä vakaasta toimintaympäristöstä nopeasti muuttuviin olosuhteisiin.
Vakaan kysynnän ympäristössä parhaan ennustetarkkuuden saavuttavat menetelmät, jotka hyödyntävät matkustajakysynnän kausiluontaista vaihtelua. Nämä menetelmät saavuttivat huomattavasti korkeamman tarkkuuden kuin tässä tutkimuksessa referenssimenetelmänä käytetty kausiluonteinen naiivi ennuste. Lineaarisen regressiomallin sekä muiden selittäviä muuttuja hyödyntävien mallien tapauksessa havaittiin, että ennustemallien suorituskyky riippui vahvasti muuttujadatan laadusta ja muuttujien välisestä suhteesta.
Nopeasti muuttuvissa olosuhteissa kaikkien tarkasteltujen ennustemallien suorituskyky heikkeni. Tutkimuksessa havaittiin, että mallien suorituskykyerot kasvavat ja osa malleista kykenee sopeutumaan paremmin muuttuvien olosuhteiden kysynnän ennustamiseen. Tämä havainto osoittaa, että ennustemallia valittaessa on syytä huomioida myös mallin mukautumiskyky ja luotettavuus nopeasti muuttuvissa olosuhteissa.
The purpose of this thesis is to study the data science methods for forecasting networked aviation passenger demand under stable and disruptive conditions. Appropriate forecasting methods can improve profitability and sustainability of aviation operations in all conditions. During increased volatility, accurate demand forecasting can also enable dynamic responses to reduce losses and grasp new emerging business opportunities.
The research studied feasible forecasting methods for seasonal and non-stationary passenger demand. As a result, it was discovered that time series forecasting models such as exponential smoothing, autoregressive integrated moving average, neural networks, and linear regression models were suitable for this research. The performance of these methods changes significantly when compared between stable and disruptive conditions.
Under stable conditions, the forecasting methods that utilize the seasonality nature of the data have the best relative performance and were significantly more accurate than the standard seasonal naïve forecast that was used as a benchmark method. The forecasting performance of the linear regression and other explanatory variable models were proven to be dependent on the quality of the explanatory data and the relationship between the regression variables.
In disruptive conditions, the performance of all studied forecasting models deteriorates. However, the performance differences between the methods increase and quickly adapting models are more capable to operate under volatile conditions. This finding indicates that the different robustness characteristics of each forecasting method should be accounted when selecting appropriate model for time series forecasting.
Tämän opinnäytetyön tarkoituksena on tutkia matkustajaliikenteen kysynnän ennustamiseen tarkoitettuja datatieteen menetelmiä sekä stabiileissa että nopeasti muuttuvissa olosuhteissa. Tarkoituksenmukaiset ennustemenetelmät voivat parantaa lentoliikenteen kannattavuutta ja ympäristöystävällisyyttä kaikissa olosuhteissa. Tämän lisäksi nopeasti muuttuvissa olosuhteissa tarkka kysynnän ennustaminen mahdollistaa nopeat sopeutustoimet ja reagoinnin uusiin nouseviin liiketoimintamahdollisuuksiin.
Tutkimus perehtyi kausiluontaisen ja ajan myötä muuttuvan matkustajakysynnän ennustemenetelmiin. Tutkimuksen tuloksena huomattiin, että aikasarja ennustemenetelmät kuten eksponentiaalinen tasoitus, integroitu autoregressiivinen liikkuva keskiarvo, neuroverkko ja lineaarinen regressio olivat tarkoituksenmukaisia tässä tutkimuksessa. Näiden menetelmien ennustetarkkuus muuttuu merkittävästi siirryttäessä vakaasta toimintaympäristöstä nopeasti muuttuviin olosuhteisiin.
Vakaan kysynnän ympäristössä parhaan ennustetarkkuuden saavuttavat menetelmät, jotka hyödyntävät matkustajakysynnän kausiluontaista vaihtelua. Nämä menetelmät saavuttivat huomattavasti korkeamman tarkkuuden kuin tässä tutkimuksessa referenssimenetelmänä käytetty kausiluonteinen naiivi ennuste. Lineaarisen regressiomallin sekä muiden selittäviä muuttuja hyödyntävien mallien tapauksessa havaittiin, että ennustemallien suorituskyky riippui vahvasti muuttujadatan laadusta ja muuttujien välisestä suhteesta.
Nopeasti muuttuvissa olosuhteissa kaikkien tarkasteltujen ennustemallien suorituskyky heikkeni. Tutkimuksessa havaittiin, että mallien suorituskykyerot kasvavat ja osa malleista kykenee sopeutumaan paremmin muuttuvien olosuhteiden kysynnän ennustamiseen. Tämä havainto osoittaa, että ennustemallia valittaessa on syytä huomioida myös mallin mukautumiskyky ja luotettavuus nopeasti muuttuvissa olosuhteissa.