Conventional vs. ESG ETFs : predicting return directions with machine learning
Ingelin, Neea (2025)
Pro gradu -tutkielma
Ingelin, Neea
2025
School of Business and Management, Kauppatieteet
Kaikki oikeudet pidätetään.
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi-fe20251011100978
https://urn.fi/URN:NBN:fi-fe20251011100978
Tiivistelmä
This thesis compares the predictability of conventional and ESG-focused Exchange-Traded Funds (ETFs) and explores whether machine learning (ML)-based investment strategies can outperform a traditional Buy-and-Hold (B&H) approach. The study employed three ML methods, Artificial Neural Networks (ANN), Random Forests (RF), and Support Vector Machines (SVM), to forecast the return directions of two portfolios: one consisting of conventional ETFs and the other of ESG ETFs. Predictions were generated for 5-, 10-, and 20-day horizons. Models were trained using walk-forward cross-validation and evaluated with several classification metrics.
The ESG portfolio often achieved more stable performance and a better balance between metrics, while both portfolios had instances of stronger overall performance. However, the differences in metrics were usually small and inconsistent. Class imbalance was a common challenge, inflating certain metrics and limiting the ability to detect negative returns. Feature importance analysis highlighted dividend yields, standard deviations, and volatilities as key predictors, with the ESG portfolio relying on a more diverse set of features. When applied to an investment strategy, ML-based strategies occasionally outperformed the B&H, but performance varied by model, portfolio type, and forecasting horizon. Overall, the results suggest that ESG ETFs may offer slight advantages in predictability and investment strategy performance, although further research is needed to confirm these findings. Tässä tutkielmassa vertaillaan perinteisten ja ESG-suuntautuneiden indeksiosuusrahastojen (ETF) tuottojen suuntien ennustettavuutta sekä arvioidaan, voivatko koneoppimiseen perustuvat sijoitusstrategiat päihittää osta-ja-pidä (Buy-and-Hold) -lähestymistavan. Analyysia varten muodostettiin kaksi portfoliota, joista toinen koostui perinteisistä ja toinen ESG-ETF:istä. Ennustamiseen käytettiin kolmea koneoppimismenetelmää, neuroverkkoja (ANN), satunnaismetsiä (RF) ja tukivektorikoneita (SVM). Mallit koulutettiin walk-forward-ristiinvalidoinnilla 5, 10 ja 20 päivän ennustehorisonteille, ja niiden suorituskykyä arvioitiin useilla luokittelumetriikoilla.
ESG-portfolio suoriutui usein vakaammin ja saavutti paremman tasapainon eri mittareiden välillä, kun taas molemmat portfoliot suoriutuivat ajoittain toisiaan paremmin kokonaiskuvassa. Erot olivat kuitenkin yleensä pieniä sekä epäjohdonmukaisia. Merkittävä haaste oli luokkien välinen epätasapaino, joka vääristi osaa mittareista ja heikensi negatiivisten tuottojen tunnistamista. Selittävien muuttujien analyysi nosti keskeisiksi ennustajiksi osinkotuotot, tuottojen keskihajonnan sekä volatiliteetit. Lisäksi ESG-portfolio hyödynsi monipuolisempaa muuttujajoukkoa. Kun ennusteita sovellettiin sijoitusstrategioihin, koneoppimismalleihin perustuvat lähestymistavat tuottivat ajoittain parempia tuloksia kuin osta-ja-pidä-strategia, mutta tulokset vaihtelivat mallin, portfoliotyypin ja ennustehorisontin mukaan. Kokonaisuudessaan ESG-ETF:t vaikuttavat tarjoavan pientä etua ennustettavuudessa sekä sijoitusstrategioiden tuottopotentiaalissa, mutta havaintojen vahvistamiseksi tarvitaan lisätutkimusta.
The ESG portfolio often achieved more stable performance and a better balance between metrics, while both portfolios had instances of stronger overall performance. However, the differences in metrics were usually small and inconsistent. Class imbalance was a common challenge, inflating certain metrics and limiting the ability to detect negative returns. Feature importance analysis highlighted dividend yields, standard deviations, and volatilities as key predictors, with the ESG portfolio relying on a more diverse set of features. When applied to an investment strategy, ML-based strategies occasionally outperformed the B&H, but performance varied by model, portfolio type, and forecasting horizon. Overall, the results suggest that ESG ETFs may offer slight advantages in predictability and investment strategy performance, although further research is needed to confirm these findings.
ESG-portfolio suoriutui usein vakaammin ja saavutti paremman tasapainon eri mittareiden välillä, kun taas molemmat portfoliot suoriutuivat ajoittain toisiaan paremmin kokonaiskuvassa. Erot olivat kuitenkin yleensä pieniä sekä epäjohdonmukaisia. Merkittävä haaste oli luokkien välinen epätasapaino, joka vääristi osaa mittareista ja heikensi negatiivisten tuottojen tunnistamista. Selittävien muuttujien analyysi nosti keskeisiksi ennustajiksi osinkotuotot, tuottojen keskihajonnan sekä volatiliteetit. Lisäksi ESG-portfolio hyödynsi monipuolisempaa muuttujajoukkoa. Kun ennusteita sovellettiin sijoitusstrategioihin, koneoppimismalleihin perustuvat lähestymistavat tuottivat ajoittain parempia tuloksia kuin osta-ja-pidä-strategia, mutta tulokset vaihtelivat mallin, portfoliotyypin ja ennustehorisontin mukaan. Kokonaisuudessaan ESG-ETF:t vaikuttavat tarjoavan pientä etua ennustettavuudessa sekä sijoitusstrategioiden tuottopotentiaalissa, mutta havaintojen vahvistamiseksi tarvitaan lisätutkimusta.
