Analysing the causes of private debt restructuring with machine learning methods : case: analysis of eight macroeconomic variables in Finland 1996-2018
Holm, Niko (2024)
Pro gradu -tutkielma
Holm, Niko
2024
School of Business and Management, Kauppatieteet
Kaikki oikeudet pidätetään.
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi-fe2024100776216
https://urn.fi/URN:NBN:fi-fe2024100776216
Tiivistelmä
This study analyses the factors contributing to the amount of restructuring of private debts applications in Finland with the help of selected Machine Learning methods. The goal was to recognize factors that have a significant relationship with the total number of applications for private debt restructuring. In the literature review, the state-of-the-art applications of machine learning methods in similar studies were examined to identify the models to be used in this thesis. The review also addresses the most common reasons for personal bankruptcy, over-indebtedness and financial hardship. These reasons were then transformed into measurable variables and utilized in the empirical analysis of the given dataset of eight Finnish macroeconomic variables from 1996-2018.
The chosen machine learning models were Linear Regression, Ridge Regression, Lasso Regression, Elastic Net Regression, Principal Component Regression and the Random Forest. The analysis consisted of in-sample and out-of-sample analysis where Random Forest was found as the most accurate in the in-sample analysis and Linear Regression in the out-of-sample analysis.
The key findings of the thesis suggest that the loss of income and changes in household size were the most significant factor affecting private debt restructuring. Loss of income was the most significant factor in the literature. These results concur with the findings of the existing literature. However, with the Finnish dataset utilized, the effect of household size was found to be contradictory to previous reports, showing a positive impact according to the data. Tämä tutkimus analysoi tekijöitä, jotka vaikuttavat yksityishenkilöiden velkajärjestelyhakemusten määrään Suomessa valittujen koneoppimismenetelmien avulla. Tutkimuksen tavoitteena oli tunnistaa tekijät, joilla on merkittävä yhteys yksityishenkilöiden velkajärjestelyhakemusten kokonaismäärään. Kirjallisuuskatsauksessa tarkasteltiin koneoppimismenetelmien uusimpia sovelluksia vastaavissa tutkimuksissa tunnistaakseen tässä työssä käytettävät mallit. Kirjallisuuskatsaus käsittelee myös yleisimpiä syitä henkilökohtaisiin konkurssitilanteisiin, ylivelkaantumiseen ja taloudellisiin vaikeuksiin. Nämä syyt muunnettiin mitattaviksi muuttujiksi ja hyödynnettiin empiirisessä analyysissä, joka perustui kahdeksaan makrotaloudelliseen muuttujaan Suomesta vuosilta 1996–2018.
Valitut koneoppimismallit olivat Lineaarinen regressio, Ridge-regressio, Lasso-regressio, Elastic Net -regressio, Pääkomponenttiregressio ja Satunnaismetsä. Analyysi koostui sisäisestä ja ulkoisesta analyysistä, joissa Satunnaismetsä osoittautui tarkimmaksi sisäisessä analyysissä ja Lineaarinen regressio ulkoisessa analyysissä.
Työn keskeiset havainnot viittaavat siihen, että tulonmenetys ja muutokset kotitalouden koossa olivat merkittävimmät tekijät, jotka vaikuttivat yksityishenkilöiden velkajärjestelyihin. Tulonmenetys oli kirjallisuudessa merkittävin tekijä. Nämä tulokset ovat yhteneväisiä olemassa olevan kirjallisuuden kanssa. Kuitenkin suomalaisen aineiston perusteella kotitalouden koon vaikutus todettiin olevan ristiriidassa aiempien tutkimusten kanssa, osoittaen positiivista vaikutusta aineiston mukaan.
The chosen machine learning models were Linear Regression, Ridge Regression, Lasso Regression, Elastic Net Regression, Principal Component Regression and the Random Forest. The analysis consisted of in-sample and out-of-sample analysis where Random Forest was found as the most accurate in the in-sample analysis and Linear Regression in the out-of-sample analysis.
The key findings of the thesis suggest that the loss of income and changes in household size were the most significant factor affecting private debt restructuring. Loss of income was the most significant factor in the literature. These results concur with the findings of the existing literature. However, with the Finnish dataset utilized, the effect of household size was found to be contradictory to previous reports, showing a positive impact according to the data.
Valitut koneoppimismallit olivat Lineaarinen regressio, Ridge-regressio, Lasso-regressio, Elastic Net -regressio, Pääkomponenttiregressio ja Satunnaismetsä. Analyysi koostui sisäisestä ja ulkoisesta analyysistä, joissa Satunnaismetsä osoittautui tarkimmaksi sisäisessä analyysissä ja Lineaarinen regressio ulkoisessa analyysissä.
Työn keskeiset havainnot viittaavat siihen, että tulonmenetys ja muutokset kotitalouden koossa olivat merkittävimmät tekijät, jotka vaikuttivat yksityishenkilöiden velkajärjestelyihin. Tulonmenetys oli kirjallisuudessa merkittävin tekijä. Nämä tulokset ovat yhteneväisiä olemassa olevan kirjallisuuden kanssa. Kuitenkin suomalaisen aineiston perusteella kotitalouden koon vaikutus todettiin olevan ristiriidassa aiempien tutkimusten kanssa, osoittaen positiivista vaikutusta aineiston mukaan.
