Predicting short-term traffic speed : a model assessment using spatiotemporal variables
Mankinen, Teemu
Pro gradu -tutkielma
Mankinen, Teemu
School of Business and Management, Kauppatieteet
Kaikki oikeudet pidätetään.
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi-fe2019050915017
https://urn.fi/URN:NBN:fi-fe2019050915017
Tiivistelmä
The focus of the thesis is to examine different machine learning models’ ability to predict short-term traffic speed. An autoregressive model, ARIMA model, Linear Regression, K-Nearest Neighbor and Extreme Gradient Boosted Tree are used to predict short-term traffic speed for 5, 10 and 15 minutes forward. Models are compared using root mean squared error (RMSE) and mean absolute percentage error (MAPE) performance measures. Models’ performance is also tested with different speed drop levels. Finally, the decision tree algorithm is used to test how well the model is able to classify, if the speed drops below 40 km/h. The results indicated that XGBoost outperforms all the other models in every measurement point and prediction period. The speed drop comparison indicated that the models perform well when the drop is minor but when the magnitude of the drop is large none of the models captures the speed variation desirably. Achieved sensitivity and specificity levels of the decision tree for the 5-, 10- and 15-minute predictions are 0.988, 0.991, 0.995 and 0.524, 0.287, 0.170, respectively. Area Under Curve (AUC) values using the same forecasting periods are 0.962, 0,833 and 0.778. Tutkielmassa tarkastellaan eri koneoppimisen algortimien suoriutumista lyhyen aikavälin nopeuden ennustamiseen. Ennustushorsontti on 5, 10 ja 15 minuuttia käyttäen autoregressiivistä mallia, ARIMA mallia, Lineaarista regressiota, KNN menetelmää ja XGBoost algortimia. Mallien arviointi toteutetaan RMSE ja MAPE suoritusmittareita hyödyntämällä. Valittujen mallien suoritumista testataan myös eri suuruisissa nopeuden pudotuksissa. Lopuksi, päätöspuu algortimilla testataan kuinka hyvin malli kykenee luokittelemaan tilanteita, joissa nopeus putoaa alle 40 km/h. Tuloksien perusteella XGBoost algoritmi pärjää parhaiten jokaisella havaintopisteellä ja ennustehorisontilla. Nopeuden pudotuksien tarkastelussa jokainen malli suoriutuu kiitettävästi tilanteessa, jossa nopeuden pudoitus on pieni. Kun pudotuksen suuruutta kasvatetaan, mikään valituista malleista ei kykene ennustamaan pudotuksia kiitettävästi. Päätöspuun saavuttamamat sensitiivisyys ja spesifisyys tasot 5, 10 ja 15 minuutilla ovat 0.988, 0.991, 0.995 ja 0.524, 0.287, 0.170. AUC arvoiksi samoilla ennustehorisonteilla saadaan 0.962, 0,833 ja 0.778.