Time series forecasting for Patria Aviation HR dataset
Salmela, Iiro (2021)
Pro gradu -tutkielma
Salmela, Iiro
2021
School of Business and Management, Kauppatieteet
Kaikki oikeudet pidätetään.
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi-fe2021051129600
https://urn.fi/URN:NBN:fi-fe2021051129600
Tiivistelmä
When forecasting the future values for a time series, ARIMA and SARIMA models are commonly used in getting the forecasts. The purpose of this research is to forecast different Human Resource datasets form Patria Aviation, using ARIMA and SARIMA models. The dataset has six different variables: Sick leave absence, Flex hours, Overtime work 50%, Overtime work 100%, Holidays and Extra holidays. The evaluation of these different models is done by using Mean Absolute Percentage Error and with a visual representation. In addition to ARIMA and SARIMA models a Grangers Causality matrix is built and if the different HR datasets have enough causality in explaining each other, a Vector Autoregressive model is used in forecasting the values of the dataset. In this research I am trying to find out how accurately these different variables can be forecasted and which of the used models has the best performance. Ennustettaessa tulevia arvoja aikasarjoissa, ARIMA ja SARIMA mallit ovat yleisesti käytettyjä ennusteiden saamisessa. Tämän tutkimuksen tarkoitus on ennustaa erilaisia henkilöstö datasettien muuttujia Patria Aviation yhtiön datasta, käyttäen ARIMA ja SARIMA malleja. Dataseteissä on kuusi erilaista muuttujaa, joita ennustetaan malleilla. Mallien arviointi tapahtuu käyttäen keskimääräistä prosentuaalista virhettä ja avuksi käyttäen myös visuaalista arviota mallien toiminnasta. ARIMA ja SARIMA mallien lisäksy Grangers Causality matriisi rakennetaan ja jos tämän matriisin perusteella muuttujilla on tarpeeksi korrelaatiota toisiinsa nähden, VAR malli otetaan myös käyttöön ennustuksissa. Tässä tutkimuksessa pyrin selvittämään kuinka tarkasti erilaisia muuttujia datasetista voidaan ennustaa ja mitkä malleista antavat parhaan ennustetarkkuuden.