Relation between financial ratios and stock returns : machine learning approach
Metsomäki, Jussi (2020)
Pro gradu -tutkielma
Metsomäki, Jussi
2020
School of Business and Management, Kauppatieteet
Kaikki oikeudet pidätetään.
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi-fe2020052939694
https://urn.fi/URN:NBN:fi-fe2020052939694
Tiivistelmä
The purpose of the thesis is to identify the association of the financial ratios with stock returns in the Finnish market from 2014 to 2018. It studies the literature related to financial ratios in financial performance prediction, and machine learning in the context of stock market prediction is covered. Additionally, the objective is to build machine learning models for stock return prediction using a bunch of financial ratios as inputs in the model.
The raw data is gathered from Nasdaq Helsinki, cleaned, and manipulated in excel before switching to the python programming language. In the quantitative section, the dataset is divided into training and test sets using a stratified sampling method. The exploratory data analysis discovered due to correlation analysis that feature scaling and data standardization is appropriate to apply on model building pipeline. Furthermore, eight established machine learning algorithms are applied and fine-tuned using hyperparameter optimization to estimate the feature importance scores of the financial ratios, and the performance of the models is assessed using root mean square error and cross-validation.
The results indicate that the profitability ratios and market value ratios seem to have the strongest association with stock returns. Moreover, the Return on Assets and Dividend Yield ratios have the highest and positive association with the stock returns in the Finnish stock market. The results of the model prediction accuracy suggest that the accuracy differences among the models are marginal. However, it seems that the tree-based machine learning models are slightly performing better than the linear models.
Overall, this thesis shows the suitability of the machine learning methods to assess the financial ratios' association with the stock returns on the Finnish market. The results presenting the useful financial ratios support the findings from the literature. However, the thesis demonstrates that the models are not unanimous in their predictions. Even so, the study succeeds in deciphering the financial ratios in which to pay closer attention in investing. Tutkimuksessa käsitellään taloudellisten tunnuslukujen ja osaketuoton välistä yhteyttä Helsingin pörssiyhtiöissä vuosina 2014–2018 käyttämällä koneoppimisen malleja. Tutkimuksessa selvitetään kirjallisuutta koskien taloudellisten tunnuslukujen käyttöä taloudellisissa ennusteissa. Lisäksi kirjallisuudessa perehdytään koneoppimiseen ja sen käyttöön osakemarkkinoiden ennustamisessa. Tämän ohella työn tarkoituksena on rakentaa toimivia koneoppimisen ennustemalleja osaketuoton määrittämiseen käyttäen ainoastaan taloudellisia tunnuslukuja datana.
Työssä käytetty aineisto on hankittu Helsingin pörssin nettisivuilta ja tunnusluvut on laskettu tilinpäätöksistä sekä puhdistettu excelissä, jonka jälkeen mallinnus on tehty python ohjelmointikielellä. Kvantitatiivisessa osiossa aineisto on jaettu opetus- ja testausjoukkoon käyttäen ositettua otantaa sekä aineiston standardioinnin tarvetta on selvitetty korrelaatioanalyysin avulla osana eksploratiivistä aineistoanalyysiä. Lisäksi kahdeksan vakiintunutta koneoppimisen algoritmia on hyperparametrisesti optimoiden käytetty mallintamaan tunnuslukujen ja osaketuottojen välistä yhteyttä. Mallien suoriutumista on mitattu keskineliövirheen neliöjuurella ja ristiinvalidoinnilla.
Tulokset esittävät kannattavuuden -ja pörssitunnuslukujen olevan voimakkaimmin yhteydessä osaketuottoihin. Tarkemmin sanoen koko pääoman tuottoasteella ja osinkotuotolla on voimakkain ja positiivinen yhteys osaketuottoon Helsingin pörssiyhtiöillä vuosien 2014 ja 2018 välillä. Koneoppimisen mallien suoriutumisessa ei löytynyt merkittäviä tarkkuuseroja, mutta päätöspuuperusteiset koneoppimisen mallit näyttäisivät suorituvan hivenen lineaarisia malleja paremmin.
Yhteenvetona Pro-gradu tutkielma esittää koneoppimisen mallien sopivuuden taloudellisten tunnuslukujen ja osaketuoton välisen suhteen mallintamiseen. Vaikka mallien haastena on saavuttaa tarkat osaketuottoennusteet, tutkielma onnistuu osoittamaan taloudelliset tunnusluvut, joihin on suositeltavaa paneutua sijoittaessa suomalaisiin listayhtiöihin.
The raw data is gathered from Nasdaq Helsinki, cleaned, and manipulated in excel before switching to the python programming language. In the quantitative section, the dataset is divided into training and test sets using a stratified sampling method. The exploratory data analysis discovered due to correlation analysis that feature scaling and data standardization is appropriate to apply on model building pipeline. Furthermore, eight established machine learning algorithms are applied and fine-tuned using hyperparameter optimization to estimate the feature importance scores of the financial ratios, and the performance of the models is assessed using root mean square error and cross-validation.
The results indicate that the profitability ratios and market value ratios seem to have the strongest association with stock returns. Moreover, the Return on Assets and Dividend Yield ratios have the highest and positive association with the stock returns in the Finnish stock market. The results of the model prediction accuracy suggest that the accuracy differences among the models are marginal. However, it seems that the tree-based machine learning models are slightly performing better than the linear models.
Overall, this thesis shows the suitability of the machine learning methods to assess the financial ratios' association with the stock returns on the Finnish market. The results presenting the useful financial ratios support the findings from the literature. However, the thesis demonstrates that the models are not unanimous in their predictions. Even so, the study succeeds in deciphering the financial ratios in which to pay closer attention in investing.
Työssä käytetty aineisto on hankittu Helsingin pörssin nettisivuilta ja tunnusluvut on laskettu tilinpäätöksistä sekä puhdistettu excelissä, jonka jälkeen mallinnus on tehty python ohjelmointikielellä. Kvantitatiivisessa osiossa aineisto on jaettu opetus- ja testausjoukkoon käyttäen ositettua otantaa sekä aineiston standardioinnin tarvetta on selvitetty korrelaatioanalyysin avulla osana eksploratiivistä aineistoanalyysiä. Lisäksi kahdeksan vakiintunutta koneoppimisen algoritmia on hyperparametrisesti optimoiden käytetty mallintamaan tunnuslukujen ja osaketuottojen välistä yhteyttä. Mallien suoriutumista on mitattu keskineliövirheen neliöjuurella ja ristiinvalidoinnilla.
Tulokset esittävät kannattavuuden -ja pörssitunnuslukujen olevan voimakkaimmin yhteydessä osaketuottoihin. Tarkemmin sanoen koko pääoman tuottoasteella ja osinkotuotolla on voimakkain ja positiivinen yhteys osaketuottoon Helsingin pörssiyhtiöillä vuosien 2014 ja 2018 välillä. Koneoppimisen mallien suoriutumisessa ei löytynyt merkittäviä tarkkuuseroja, mutta päätöspuuperusteiset koneoppimisen mallit näyttäisivät suorituvan hivenen lineaarisia malleja paremmin.
Yhteenvetona Pro-gradu tutkielma esittää koneoppimisen mallien sopivuuden taloudellisten tunnuslukujen ja osaketuoton välisen suhteen mallintamiseen. Vaikka mallien haastena on saavuttaa tarkat osaketuottoennusteet, tutkielma onnistuu osoittamaan taloudelliset tunnusluvut, joihin on suositeltavaa paneutua sijoittaessa suomalaisiin listayhtiöihin.