The applicability of K-means clustering for the U.S. growth stock portfolio selection over the period 2012-2022
Anetjärvi, Petteri (2025)
Pro gradu -tutkielma
Anetjärvi, Petteri
2025
School of Business and Management, Kauppatieteet
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi-fe2025062472889
https://urn.fi/URN:NBN:fi-fe2025062472889
Tiivistelmä
The purpose of this study is to examine the efficacy of a clustering technique for the selection of growth stock portfolio. The employed clustering data consists of three valuation ratios (P/E, P/CF and P/B) of the S&P 500 constituent stocks. The methodology relies on combining the three valuation ratios vía K-means clustering. The K-means method generates five different clusters, from which the cluster with the the stocks with highest valuation ratios forms the growth portfolio. The performance of the growth portfolio is compared to the S&P 500 Growth Index.
During the sample period 2012–2022, the clustered growth portfolio was able to some extent challenge the S&P 500 Growth Index with an annual return of 9,47%, although the S&P 500 Growth Index’s return was slightly higher at 9,87% p.a. However, the impact of trading costs, which were not controlled in this thesis, would widen the real-world return difference in favor of the S&P 500 Growth Index portfolio. Tämän tutkielman tarkoituksena on tutkia klusterointitekniikan soveltuvuutta kasvuyhtiöistä koostuvan osakesalkun valintaan. K-means –klusterointi toteutetaan S&P 500-indeksiin kuuluvien osakkeiden kolmen arvostuskertoimen (P/E, P/CF ja P/B) perusteella. Menetelmä luo viisi arvostuskertoimiin perustuvaa klusteria, joista suhteellisesti korkeimmalle arvostetut osakkeet muodostavat kasvuosakeportfolion. Tämän portfolion tuottoa verrataan S&P 500 Growth Index’iin.
Tutkimusperiodilla 2012–2022 klusterointimenetelmään perustuva kasvuosakesalkku pystyi jossain määrin haastamaan S&P 500 Growth Indexin 9,47 %:n vuotuisella tuotollaan, vaikkakin S&P 500 Growth Indexin vuosituotto (9,87 %) oli hieman korkeampi. Kaupankäyntikulujen vaikutus, mitä ei tässä opinnäytetyössä kontrolloitu, kuitenkin leventäisi reaalimaailmassa tuottoeroa S&P 500 Growth Index -salkun eduksi.
During the sample period 2012–2022, the clustered growth portfolio was able to some extent challenge the S&P 500 Growth Index with an annual return of 9,47%, although the S&P 500 Growth Index’s return was slightly higher at 9,87% p.a. However, the impact of trading costs, which were not controlled in this thesis, would widen the real-world return difference in favor of the S&P 500 Growth Index portfolio.
Tutkimusperiodilla 2012–2022 klusterointimenetelmään perustuva kasvuosakesalkku pystyi jossain määrin haastamaan S&P 500 Growth Indexin 9,47 %:n vuotuisella tuotollaan, vaikkakin S&P 500 Growth Indexin vuosituotto (9,87 %) oli hieman korkeampi. Kaupankäyntikulujen vaikutus, mitä ei tässä opinnäytetyössä kontrolloitu, kuitenkin leventäisi reaalimaailmassa tuottoeroa S&P 500 Growth Index -salkun eduksi.