Implementation of k-means clustering for value portfolio selection : evidence from the U.S. stock market over the period 2003-2023
Eskola, Tuomas (2024)
Pro gradu -tutkielma
Eskola, Tuomas
2024
School of Business and Management, Kauppatieteet
Kaikki oikeudet pidätetään.
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi-fe2024040514805
https://urn.fi/URN:NBN:fi-fe2024040514805
Tiivistelmä
This thesis examines the performance of value investing strategies in the U.S. stock market over the period 2003–2023 by implementing the k-means clustering algorithm for combining several value indicators. The thesis examines how the portfolios formed on the basis of the clustering method performed in comparison with the market portfolio, as well as with the portfolios constructed by using the traditional combination method. For the sake of comparability, the thesis also examines the performance of similarly constructed growth stock portfolios. During the 20-year sample period, 12 style portfolios are constructed at a 5-year frequency. The sample data include the constituent stocks of the S&P 500 Index at each portfolio re-formation point. The portfolios are formed on the basis of a combination of three or six valuation ratios, which are P/E, P/B, P/CF, EV/EBITDA, P/S, and P/D. In addition, the added-value of the prior six-month return, indicating return momentum, for the 3-combination portfolio is tested as an auxiliary timing indicator. The performance of the portfolios is assessed in terms of both absolute returns and risk-adjusted returns.
The results show that over the 20-year sample period, the value stock portfolio formed on the basis of the clustering method relying on six value ratios performed best, although not significantly better than the market portfolio or the comparable growth portfolio. Generally, the performance of clustering-based portfolios differed only slightly from the performance of portfolios constructed using the traditional method. In addition, the relative performance varied strongly across the 5-year sub-periods. Tämä tutkielma tarkastelee arvosijoitusstrategian suoriutumista Yhdysvaltain osakemarkkinoilla vuosina 2003-2023 käyttämällä k-means-klusterointialgoritmia portfolioiden muodostukseen. Tutkielmassa selvitetään, kuinka klusterointimenetelmän avulla laaditut portfoliot suoriutuivat suhteessa sekä markkinaindeksiin että perinteisen menetelmän avulla muodostettuihin portfolioihin. Vertailun vuoksi tutkielmassa tarkastellaan myös vastaavilla menetelmillä laadittujen kasvuosakeportfolioiden suoriutumista. 20 vuoden tarkasteluperiodin aikana 12 sijoitusstrategiaspesifiä portfoliota muodostetaan viiden vuoden välein. Tutkielman aineisto koostuu niistä yhdysvaltalaisosakkeista, jotka kunakin portfolion muodostusajankohtana ovat kuuluneet S&P 500-indeksiin. Portfoliot muodostetaan kombinoimalla joko kolmea tai kuutta arvostuskerrointa, jotka ovat P/E, P/B, P/CF, EV/EBITDA, P/S ja P/D. Lisäksi testataan momentumia indikoivan edellisen kuuden kuukauden tuottohistorian mahdollista lisäarvoa 3-kombinaatiosalkulle. Muodostettavien portfolioiden suoriutumista analysoidaan sekä absoluuttisiin että riskikorjattuihin tuottoihin perustuen.
Tulokset osoittavat, että 20 vuoden tarkasteluperiodilla kuuteen arvostuskertoimeen perustuva klusterointimenetelmällä muodostettu arvo-osakeportfolio suoriutui parhaiten, joskaan ei tilastollisesti merkitsevästi paremmin kuin markkinaportfolio tai vastaava kasvuosakeportfolio. Yleisellä tasolla klusterointiin perustuvien portfolioiden suoriutuminen poikkesi vain vähän perinteisellä menetelmällä muodostetuista portfolioista. Lisäksi suhteellinen suoriutuminen 5-vuotisperiodien välillä vaihteli voimakkaasti.
The results show that over the 20-year sample period, the value stock portfolio formed on the basis of the clustering method relying on six value ratios performed best, although not significantly better than the market portfolio or the comparable growth portfolio. Generally, the performance of clustering-based portfolios differed only slightly from the performance of portfolios constructed using the traditional method. In addition, the relative performance varied strongly across the 5-year sub-periods.
Tulokset osoittavat, että 20 vuoden tarkasteluperiodilla kuuteen arvostuskertoimeen perustuva klusterointimenetelmällä muodostettu arvo-osakeportfolio suoriutui parhaiten, joskaan ei tilastollisesti merkitsevästi paremmin kuin markkinaportfolio tai vastaava kasvuosakeportfolio. Yleisellä tasolla klusterointiin perustuvien portfolioiden suoriutuminen poikkesi vain vähän perinteisellä menetelmällä muodostetuista portfolioista. Lisäksi suhteellinen suoriutuminen 5-vuotisperiodien välillä vaihteli voimakkaasti.
