Neural network based binary and multi-class trading strategies using probability thresholds for trading actions on S&P 500 index
Soukko, Leo (2020)
Pro gradu -tutkielma
Soukko, Leo
2020
School of Business and Management, Kauppatieteet
Kaikki oikeudet pidätetään.
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi-fe2020081148352
https://urn.fi/URN:NBN:fi-fe2020081148352
Tiivistelmä
There have been many attempts to predict stock market returns using regression algorithms. However, from the viewpoint of an investor, the stock market can be interpreted as a classification problem with the decision to buy or short sell a stock market index or to remain market neutral. Most studies using classification models have used a binary target, either to buy or to sell the index based on the prediction of their classification model. These kinds of strategies are vulnerable to misclassification and high trading costs because they do not separate very low returns from very high ones, and therefore make trading actions frequently. In this thesis two different approaches are used to reduce the misclassification rate and overall costs. One approach is to use multiclass targets, where a buying or selling action is only triggered if the return is above or below some threshold. Another approach is to use the classification model probabilities to create a similar threshold. A trading action will only be made when the model is certain enough of its prediction.
The results of this thesis show that increasing probability thresholds for buying and selling actions on binary models increased gained profits, especially when medium or high transaction costs were used due to fewer transactions made and fewer incorrect short sales. Models predicting multiclass targets performed better than binary ones when adjusting probability threshold for decision making was not done. This was due to the same reasons as mentioned before. Osakemarkkinoita on usein yritetty ennustaa regressiomalleilla. Kuitenkin sijoittajan näkökulmasta osakemarkkinasijoittaminen on luokitteluongelma, ostaa vai myydä vaiko pysyä markkinaneutraalina. Useimmat tutkimukset, jotka ovat käyttäneet luokittelumalleja ovat ennustaneet binääristä muuttujaa, joko ostaa tai myydä. Tällaiset strategiat ovat haavoittuvaisia luokitteluvirheille sekä isoille kokonaiskustannuksille, koska ne eivät erottele matalia ja korkeita tuottoja toisistaan ja täten tekevät useita transaktioita. Tässä pro-gradussa käytetään kahta eri lähestymistapaa luokitteluvirheen ja transaktiokustannusten minimoiseksi. Ensimmäinen lähestymistapa on käyttää moniluokkamuuttujaa ennustamisessa, jossa myynti- tai ostopäätös tehdään vain, jos tuotto on jonkin raja-arvon ala- tai yläpuolella. Toinen lähestymistapa on käyttää luokittelumallin antamia todennäköisyyksiä samankaltaisen raja-arvon luomiseen. Myynti- tai ostopäätös tehdään vain, jos malli on tarpeeksi varma päätöksestään.
Tulokset osoittivat, että todennäköisyysrajan nostaminen myynti- tai ostopäätöksen tekemiseen binäärisillä malleilla kasvatti tuottoa, etenkin käytettäessä suuria tai keskisuuria transaktiokustannuksia. Tämä johtui pienemmästä määrästä transaktioita sekä harvemmin tehdyistä vääristä shorttaus-päätöksistä. Moniluokkamuuttujaa ennustavat mallit suoriutuivat paremmin kuin binääristä muuttujaa ennustavat mallit, kun todennäköisyys raja-arvoja ei muutettu, johtuen aiemmin mainituista syistä.
The results of this thesis show that increasing probability thresholds for buying and selling actions on binary models increased gained profits, especially when medium or high transaction costs were used due to fewer transactions made and fewer incorrect short sales. Models predicting multiclass targets performed better than binary ones when adjusting probability threshold for decision making was not done. This was due to the same reasons as mentioned before.
Tulokset osoittivat, että todennäköisyysrajan nostaminen myynti- tai ostopäätöksen tekemiseen binäärisillä malleilla kasvatti tuottoa, etenkin käytettäessä suuria tai keskisuuria transaktiokustannuksia. Tämä johtui pienemmästä määrästä transaktioita sekä harvemmin tehdyistä vääristä shorttaus-päätöksistä. Moniluokkamuuttujaa ennustavat mallit suoriutuivat paremmin kuin binääristä muuttujaa ennustavat mallit, kun todennäköisyys raja-arvoja ei muutettu, johtuen aiemmin mainituista syistä.