Using recurrent neural network models and financial news for predicting stock market movements
Suikkanen, Saku (2020)
Kandidaatintyö
Suikkanen, Saku
2020
School of Engineering Science, Tietotekniikka
Kaikki oikeudet pidätetään.
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi-fe202001303911
https://urn.fi/URN:NBN:fi-fe202001303911
Tiivistelmä
In this work, the utilization of financial news alongside machine learning for predicting stock market movements is examined. The news are handled with various natural language processing methods for finding correlation between the derived attributes and stock market movements. The novelty of this work lies in the application of BNS and LDA methods as well as 2-word combinations alongside with LSTM neural network. The main point of the work is to examine the usefulness of the results achieved with the formerly mentioned methods and neural networks as well as comparing the results with market efficiency. In the research it was concluded that the models containing 2-word combinations derived with the BNS-method, produced differing results to those models, where the 2-word combinations were not used. However, the overall results followed random patterns and thus reliable results were not achieved. For achieving more reliable results, better approach could be predicting intraday stock market movements per Efficient Market hypothesis. Used datasets were possibly also too concise for the complexity of the problem. Tässä työssä tarkastellaan talousuutisten hyödyntämistä yhdessä koneoppimisen kanssa osakemarkkinoiden ennustamiseen. Uutisia käsitellään tietyillä luonnollisen kielen käsittelyn menetelmillä ja niistä pyritään löytämään korrelaatiota osakkeen liikkeiden kanssa. Työn uutuusarvona ovat BNS- ja LDA-menetelmien, sekä 2 sanan kombinaatioiden käyttö LSTM-neuroverkon yhteydessä. Työn pääasiallisena tavoitteena on tarkastella edellä mainittujen menetelmien ja neuroverkkojen yhdessä tuottamien tulosten hyödyllisyyttä ja niiden vertautumista markkinoiden tehokkuuteen. Tutkimuksessa selvisi, että mallit, jotka sisältävät BNS-menetelmällä johdettuja 2 sanan kombinaatioita, tuottavat poikkeavia tuloksia niihin malleihin verrattuna, joissa niitä ei käytetä. Tulokset kuitenkin noudattivat kaiken kaikkiaan satunnaista vaihtelua ja luotettavia tuloksia ei täten saatu. Tulosten parantamiseksi, parempi lähtökohta voisi olla päivän sisäisten vaihtelujen ennustaminen, markkinoiden tehokkuuden hypoteesin mukaisesti. Käytetyt tietoaineistot olivat myös mahdollisesti liian suppeat kompleksisuudeltaan vaativalle ongelmalle.