Comparative analysis of machine learning algorithms in financial distress classification
Taskula, Jenni (2025)
Pro gradu -tutkielma
Taskula, Jenni
2025
School of Business and Management, Kauppatieteet
Kaikki oikeudet pidätetään.
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi-fe2025092998665
https://urn.fi/URN:NBN:fi-fe2025092998665
Tiivistelmä
Financial distress prediction is a critical area of study within financial risk management, influencing decision-making for various stakeholders, including financial institutions, regulators, investors, and corporate managers. Traditional models, such as logistic regression, have been widely used to assess financial distress, but recent advancements in machine learning offer promising improvements in predictive accuracy and model efficiency.
The research conducted evaluates multiple models, including logistic regression, K-nearest neighbors, decision trees, support vector machines, and neural networks. The results indicate that these models exhibit strong predictive capabilities, with all models achieving an accuracy exceeding 67%. Among the evaluated models, traditional logistic regression performed the weakest, highlighting the limitations of conventional statistical methods in handling complex financial data. KNN, while effective, exhibited marginally lower performance than the decision tree model. Neural networks emerged as the most effective model, achieving the highest accuracy and AUC. This underscores their superior predictive performance in financial distress forecasting. These findings reinforce the practical utility of machine learning in financial risk assessment. While neural networks demonstrate the highest predictive accuracy, their limited explainability raises concerns regarding the transparency of the model's decision-making process. In contrast, decision trees provide clearer reasoning behind predictions, making them valuable for stakeholders requiring transparent decision-making frameworks. Taloudellisen ahdingon ennustaminen on keskeinen tutkimusalue rahoitusriskien hallinnassa, ja se vaikuttaa monien sidosryhmien päätöksentekoon, kuten rahoituslaitosten, sääntelyviranomaisten, sijoittajien ja yritysjohtajien. Perinteisiä malleja, kuten logistista regressiota, on käytetty laajasti taloudellisen ahdingon arvioinnissa, mutta viimeaikaiset koneoppimisen edistysaskeleet tarjoavat lupaavia parannuksia ennustetarkkuudessa ja mallien tehokkuudessa.
Tässä tutkimuksessa arvioitiin useita malleja, mukaan lukien logistinen regressio, KNN, päätöspuut, SVM ja NN. Tulokset osoittavat, että näillä malleilla on vahva ennustekyky, ja kaikki mallit saavuttivat yli 67 %:n tarkkuuden. Arvioiduista malleista perinteinen logistinen regressio suoriutui heikoimmin, mikä korostaa perinteisten tilastollisten menetelmien rajoituksia monimutkaisen taloudellisen datan käsittelyssä. KNN malli oli tehokas, mutta sen suorituskyky jäi hieman päätöspuiden alapuolelle. NN osoittautui tehokkaimmiksi, saavuttaen parhaan tarkkuuden ja AUC:n, mikä korostaa niiden ylivoimaista ennustesuorituskykyä taloudellisen ahdingon ennustamisessa. Nämä havainnot vahvistavat koneoppimisen käytännön hyödyn rahoitusriskien arvioinnissa. Vaikka NN saavuttaa korkeimman ennustetarkkuuden, niiden rajallinen selitettävyys herättää huolta mallin päätöksenteon läpinäkyvyydestä. Sen sijaan päätöspuut tarjoavat selkeät perustelut ennusteilleen, mikä tekee niistä arvokkaita sidosryhmille, jotka tarvitsevat läpinäkyviä päätöksenteon välineitä.
The research conducted evaluates multiple models, including logistic regression, K-nearest neighbors, decision trees, support vector machines, and neural networks. The results indicate that these models exhibit strong predictive capabilities, with all models achieving an accuracy exceeding 67%. Among the evaluated models, traditional logistic regression performed the weakest, highlighting the limitations of conventional statistical methods in handling complex financial data. KNN, while effective, exhibited marginally lower performance than the decision tree model. Neural networks emerged as the most effective model, achieving the highest accuracy and AUC. This underscores their superior predictive performance in financial distress forecasting. These findings reinforce the practical utility of machine learning in financial risk assessment. While neural networks demonstrate the highest predictive accuracy, their limited explainability raises concerns regarding the transparency of the model's decision-making process. In contrast, decision trees provide clearer reasoning behind predictions, making them valuable for stakeholders requiring transparent decision-making frameworks.
Tässä tutkimuksessa arvioitiin useita malleja, mukaan lukien logistinen regressio, KNN, päätöspuut, SVM ja NN. Tulokset osoittavat, että näillä malleilla on vahva ennustekyky, ja kaikki mallit saavuttivat yli 67 %:n tarkkuuden. Arvioiduista malleista perinteinen logistinen regressio suoriutui heikoimmin, mikä korostaa perinteisten tilastollisten menetelmien rajoituksia monimutkaisen taloudellisen datan käsittelyssä. KNN malli oli tehokas, mutta sen suorituskyky jäi hieman päätöspuiden alapuolelle. NN osoittautui tehokkaimmiksi, saavuttaen parhaan tarkkuuden ja AUC:n, mikä korostaa niiden ylivoimaista ennustesuorituskykyä taloudellisen ahdingon ennustamisessa. Nämä havainnot vahvistavat koneoppimisen käytännön hyödyn rahoitusriskien arvioinnissa. Vaikka NN saavuttaa korkeimman ennustetarkkuuden, niiden rajallinen selitettävyys herättää huolta mallin päätöksenteon läpinäkyvyydestä. Sen sijaan päätöspuut tarjoavat selkeät perustelut ennusteilleen, mikä tekee niistä arvokkaita sidosryhmille, jotka tarvitsevat läpinäkyviä päätöksenteon välineitä.
