Forecasting seasonal demand in the chemicals industry
Eskelinen, Petra (2022)
Pro gradu -tutkielma
Eskelinen, Petra
2022
School of Business and Management, Kauppatieteet
Kaikki oikeudet pidätetään.
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi-fe2022050332340
https://urn.fi/URN:NBN:fi-fe2022050332340
Tiivistelmä
Forecasting literature has mostly used statistical methods for predicting seasonal demand, but machine learning (ML) and ensemble methods have increased their popularity in recent years. Although ML methods tend to outperform statistical methods, ML methods do not come without their own issues. The most accurate complex ML methods tend to require high computing power and more data than single models. Single ML methods on the other hand have been outperformed by single statistical models and ensemble methods. Companies should therefore use statistical methods to first benchmark the models and then consider if more complex models are needed. This thesis aims to assess the usability of single statistical models (seasonal naïve, exponential smoothing and SARIMA) and an ensemble method (bagging) on a limited data set of three years. The results display that the single statistical models outperform the ensemble method, although the ensemble method is more consistent with its accuracy scores. The results also indicate that in cases when more complex ML cannot be used, multiple statistical models can be used separately on specific seasons to forecast demand. This research also provides recommendations for the case company operating in the chemicals industry on how the forecasting model should be implemented and how the forecasting process in the company should be developed in the future. Ennustamisen kirjallisuus on pääosin käyttänyt tilastollisia malleja kausittaisen kysynnän ennustamiseen, mutta koneoppimisen ja yhteisoppimisen mallit ovat nostaneet suosiotaan viime vuosina. Vaikka koneoppimisen mallit suoriutuvat yleensä paremmin kuin tilastolliset mallit, niissä on ongelmia. Kaikista tarkimmat ja monimutkaisimmat koneoppimisen mallit vaativat paljon laskuvoimaa ja enemmän dataa kuin yksittäiset ennustamisenmallit. Yksittäiset koneoppimisen mallit eivät kuitenkaan aina ole tarkempia kuin tilastolliset mallit ja yhteisoppimisen mallit. Yritysten täytyisi siis ensiksi hyödyntää tilastollisia malleja tilanteen arvioimiseen ja sitten päättää tarvitseeko monimutkaisempia koneoppimisen malleja ottaa käyttöön. Tämä tutkielma arvioi yksittäisten tilastollisten mallien (kausittainen naiivi, exponential smoothing ja SARIMA) ja yhteisoppimisen (bagging) suoriutumista rajoitetun kolmen vuoden datasetin avulla ennustamisesta. Tulokset näyttävät, että yksittäiset tilastolliset mallit voivat ennustaa tarkemmin kuin yhteisoppimisen malli, vaikka yhteisoppimisen malli on johdonmukaisempi sen tarkkuustuloksissa. Tulokset indikoivat myös, että silloin kuin monimutkaisempia koneoppimisen malleja ei voi käyttää, useampaa tilastollista voi käyttää erikseen tietyillä kausilla kysynnän ennustamiseen. Lisäksi tämä tutkielma antaa suosituksia yritykselle, joka operoi kemikaalialalla miten ennustamisenmalli tulisi implementoida ja kuinka ennustamisen prosessia voidaan kehittää yrityksessä jatkossa.