Modelling of stock returns in market crash and recovery period using stock- and firm level characteristics : case of Covid-19 and financial crisis
Halkola, Petrus (2021)
Pro gradu -tutkielma
Halkola, Petrus
2021
School of Business and Management, Kauppatieteet
Kaikki oikeudet pidätetään.
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi-fe2021120859572
https://urn.fi/URN:NBN:fi-fe2021120859572
Tiivistelmä
This thesis studies cross-sectional stock returns in market crash and recovery periods. Modelling is performed by using stock- and firm level characteristics and three modelling approaches: linear regression, random forest and support vector regression. The aim is to examine which characteristics are important determinants of the returns and whether machine learning algorithms can add value to modelling accuracy. Data over Covid-19 and financial crisis periods from Nordic markets is employed. These two periods are modelled individually but financial crisis models are also tested on Covid data.
The results differ between the two periods. Better modelling accuracy is documented for financial crisis data but applying financial crisis -based models on Covid data does not appear useful. In financial crisis, dividend yield, earnings yield and share turnover were the most important drivers of returns, whereas in Covid crash, they were operating leverage, volatility and share turnover. Machine learning methods outperform linear regression, but the advantage is minor. If an investor had followed the models, total returns of up to 75-96% could have been achieved, while market returns were 0%. There are similarities in important characteristics found in this study with the presented previous research, but the results are not a repetition of previous studies. This indicates that important characteristics vary over time and context of the crash. Tämä tutkielma tarkastelee osakkeiden poikkileikkaustuottoja markkinoiden romahdus- toipumisjaksoilla. Mallinnuksessa käytetään osake- ja yrityskohtaisia tunnuslukuja sekä kolmea mallinnustapaa: lineaarista regressiota, random forest -menetelmää ja tukivektoriregressiota. Tavoitteena oli selvittää, mitkä tunnusluvut ovat tuottojen mallinnuksessa tärkeitä ja voivatko koneoppimismenetelmät tuoda lisäarvoa mallinnustarkkuuteen. Tutkimuksessa käytettiin dataa Covid-19 romahduksesta sekä finanssikriisistä pohjoismaisilla markkinoilla. Näitä kahta ajanjaksoa mallinnettiin erikseen, mutta finanssikriisipohjaisia malleja testattiin myös Covid-romahduksen datalla.
Tulokset eri ajanjaksoille eroavat toisistaan ja parempi mallinnustarkkuus saavutettiin finanssikriisidatalla, mutta finanssikriisipohjaisten mallien soveltaminen Covid-dataan ei vaikuta hyödylliseltä. Finanssikriisissä osinkotuotto, tulostuotto ja osakkeen kiertonopeus olivat tärkeitä tunnuslukuja mallinnuksen kannalta. Covid-datassa taas operatiivinen velkaantuneisuus, volatiliteetti ja osakkeen kiertonopeus olivat tärkeitä. Koneoppimismenetelmät toimivat lineaarista regressiota paremmin, mutta hyöty on vähäistä. Jos tutkimuksen malleja olisi hyödyntänyt näillä periodeilla, olisi voitu saavuttaa jopa 75-96% kokonaistuottoja, markkinatuoton ollessa 0%. Tässä tutkimuksessa löydetyissä tärkeissä tunnusluvuissa on yhtäläisyyksiä aikaisempaan tutkimukseen, mutta tulokset eivät ole toisintoa aikaisemmista tutkimuksista. Tämän perusteella tärkeät tunnusluvut vaikuttavat vaihtelevan ajan ja romahduksen kontekstin mukaan.
The results differ between the two periods. Better modelling accuracy is documented for financial crisis data but applying financial crisis -based models on Covid data does not appear useful. In financial crisis, dividend yield, earnings yield and share turnover were the most important drivers of returns, whereas in Covid crash, they were operating leverage, volatility and share turnover. Machine learning methods outperform linear regression, but the advantage is minor. If an investor had followed the models, total returns of up to 75-96% could have been achieved, while market returns were 0%. There are similarities in important characteristics found in this study with the presented previous research, but the results are not a repetition of previous studies. This indicates that important characteristics vary over time and context of the crash.
Tulokset eri ajanjaksoille eroavat toisistaan ja parempi mallinnustarkkuus saavutettiin finanssikriisidatalla, mutta finanssikriisipohjaisten mallien soveltaminen Covid-dataan ei vaikuta hyödylliseltä. Finanssikriisissä osinkotuotto, tulostuotto ja osakkeen kiertonopeus olivat tärkeitä tunnuslukuja mallinnuksen kannalta. Covid-datassa taas operatiivinen velkaantuneisuus, volatiliteetti ja osakkeen kiertonopeus olivat tärkeitä. Koneoppimismenetelmät toimivat lineaarista regressiota paremmin, mutta hyöty on vähäistä. Jos tutkimuksen malleja olisi hyödyntänyt näillä periodeilla, olisi voitu saavuttaa jopa 75-96% kokonaistuottoja, markkinatuoton ollessa 0%. Tässä tutkimuksessa löydetyissä tärkeissä tunnusluvuissa on yhtäläisyyksiä aikaisempaan tutkimukseen, mutta tulokset eivät ole toisintoa aikaisemmista tutkimuksista. Tämän perusteella tärkeät tunnusluvut vaikuttavat vaihtelevan ajan ja romahduksen kontekstin mukaan.