The relationship between short-term stock movements and social media platform indicators : case StockTwits
Korhonen, Joose (2022)
Pro gradu -tutkielma
Korhonen, Joose
2022
School of Business and Management, Kauppatieteet
Kaikki oikeudet pidätetään.
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi-fe2022060141923
https://urn.fi/URN:NBN:fi-fe2022060141923
Tiivistelmä
The efficient market hypothesis clearly states that since the market prices reflect the available information and will rapidly adjust to any imbalances, it should not be possible to predict the stock market movements and outperform the rest of the market. However, the theorem of complete rationality of the markets has been diminished by numerous experts of the field, mainly due to the unexpected actions of the market agents. In accordance with this, many scholars have started to study, whether this irrationality offers possibilities to gain a financial benefit in the stock markets.
This Master’s Thesis takes a modern perspective around the same topic by analyzing the relationship between an investing-based social media platform indicators and actual stock movements. The purpose of the study is to see, whether the given sentiment of users and the amount of interest towards specific stocks correlate with the actual short-term stock actions, and if the future stock movements can be predicted more accurately by utilizing the online user data. The relationships are measured by employing three main methods: Granger causality tests, correlation tests and linear / classification-based machine learning models. For the first two methods, all the gathered and preprocessed data is utilized, however, to possibly increase the accuracy of the machine learning predictions, a smart-person identification method is formed and implemented. Overall, the results of the study imply that there is a two-way relationship between the indicators gathered from social media and corresponding stock market actions, and the online data does have predicative abilities for the short-term future of the stocks. Tehokkaiden markkinoiden hypoteesin mukaan markkinahinnat heijastavat kaikkea saatavilla olevaa informaatiota ja mukautuvat nopeasti mahdollisiin epätasapainoihin, eikä osakemarkkinoiden liikkeiden ennustamisen ja sen avulla ylimääräisten voittojen tekemisen pitäisi olla mahdollista. Täydellisen rationaalisuuden teoreema on kuitenkin osoitettu epärealistiseksi useiden asiantuntijoiden toimesta, johtuen pääosin odottamattomista markkinatoimijoiden liikkeistä. Tähän liittyen, monet tutkijat ovat alkaneet tarkastella, tarjoavatko nämä irrationaaliset toimet mahdollisuuksia saada taloudellista hyötyä osakemarkkinoilla.
Tämä tutkielma ottaa modernin lähestymistavan kyseiseen aiheeseen analysoimalla sijoittajille tarkoitetun sosiaalisen median alustan indikaattorien sekä todellisten osakeliikkeiden välistä suhdetta. Tutkimuksen tarkoituksena on selvittää, korreloivatko käyttäjien sentimentti sekä kiinnostuksen määrä valikoituja osakkeita kohtaan niiden lyhyen aikavälin muutosten kanssa, ja onko alustan käyttäjädataa mahdollista hyödyntää tulevien osakemuutosten ennustamistarkkuuden parantamiseksi. Muuttujien välisiä suhteita mitataan kolmella päämenetelmällä, Granger-kausaalisuustesteillä, korrelaatiotesteillä sekä lineaarisilla / luokittelupohjaisilla koneoppimismenetelmillä. Kahden ensimmäisen menetelmän kohdalla sovelletaan kaikkea kerättyä ja prosessoitua käyttäjädataa, kun taas koneoppimismallien ennustetarkkuuden parantamiseksi luodaan myös älykkäiden käyttäjien tunnistusmenetelmä. Tutkielman tulokset viittaavat siihen, että alustasta kerättyjen indikaattorien ja vastaavien osakemuutosten välillä on kaksisuuntainen suhde ja datan avulla on mahdollista parantaa lyhyen aikavälin kurssiliikkeiden ennustetarkkuutta.
This Master’s Thesis takes a modern perspective around the same topic by analyzing the relationship between an investing-based social media platform indicators and actual stock movements. The purpose of the study is to see, whether the given sentiment of users and the amount of interest towards specific stocks correlate with the actual short-term stock actions, and if the future stock movements can be predicted more accurately by utilizing the online user data. The relationships are measured by employing three main methods: Granger causality tests, correlation tests and linear / classification-based machine learning models. For the first two methods, all the gathered and preprocessed data is utilized, however, to possibly increase the accuracy of the machine learning predictions, a smart-person identification method is formed and implemented. Overall, the results of the study imply that there is a two-way relationship between the indicators gathered from social media and corresponding stock market actions, and the online data does have predicative abilities for the short-term future of the stocks.
Tämä tutkielma ottaa modernin lähestymistavan kyseiseen aiheeseen analysoimalla sijoittajille tarkoitetun sosiaalisen median alustan indikaattorien sekä todellisten osakeliikkeiden välistä suhdetta. Tutkimuksen tarkoituksena on selvittää, korreloivatko käyttäjien sentimentti sekä kiinnostuksen määrä valikoituja osakkeita kohtaan niiden lyhyen aikavälin muutosten kanssa, ja onko alustan käyttäjädataa mahdollista hyödyntää tulevien osakemuutosten ennustamistarkkuuden parantamiseksi. Muuttujien välisiä suhteita mitataan kolmella päämenetelmällä, Granger-kausaalisuustesteillä, korrelaatiotesteillä sekä lineaarisilla / luokittelupohjaisilla koneoppimismenetelmillä. Kahden ensimmäisen menetelmän kohdalla sovelletaan kaikkea kerättyä ja prosessoitua käyttäjädataa, kun taas koneoppimismallien ennustetarkkuuden parantamiseksi luodaan myös älykkäiden käyttäjien tunnistusmenetelmä. Tutkielman tulokset viittaavat siihen, että alustasta kerättyjen indikaattorien ja vastaavien osakemuutosten välillä on kaksisuuntainen suhde ja datan avulla on mahdollista parantaa lyhyen aikavälin kurssiliikkeiden ennustetarkkuutta.