Intelligent financial distress prediction : recent contributions and their response to the problems of classic prediction methodologies
Jaatinen, Lauri (2021)
Pro gradu -tutkielma
Jaatinen, Lauri
2021
School of Business and Management, Kauppatieteet
Kaikki oikeudet pidätetään.
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi-fe2021111855878
https://urn.fi/URN:NBN:fi-fe2021111855878
Tiivistelmä
This thesis examines current trends in the intelligent financial distress prediction field, and how recently published studies respond to the problems in classic financial distress prediction methodologies. Financial distress prediction is an extensively studied subject, where the goal is to find a classifier that describes whether a firm belongs to a non-distressed or distressed state in the future. Traditional statistical methods, like discriminant analysis and logistic regression, are commonly used to derive the optimal classification function. However, more and more models with intelligent methods are developed due to their higher predictive performance and flexibility. Intelligent methods have introduced novel and high-performing models, but they cannot solve all the problems in classic prediction methodologies by themselves. Indeed, most of the difficulties are not strictly dependent on the prediction model but on common practices and assumptions of the process. Therefore, the thesis analyses 36 peer-reviewed, intelligent financial distress prediction studies to see current trends in the field, and investigates whether the studies respond to the fundamental problems. In addition, improvements and suggestions for future research are given.
The results showed that the studies had various research areas and dispersed objectives, which indicates a certain level of complexity and multidimensionality around the subject. Multiple classifier systems, or ensemble methods, were the most popular and the highest performing methods. Imbalanced datasets were applied more often than balanced, but only a minority of the studies addressed the problems that arise due to this practice. Responses to the problems in classic prediction methodologies were somewhat insufficient. Although studies implemented dynamic properties and sophisticated techniques in the modelling phase, most of the problems remained unsolved. For the future, in-depth theoretical analysis is needed to find meaningful features and eliminate unsuitable practices in the process. Also, studies are encouraged to continue with imbalanced datasets and to implement dynamic modelling practices for a more realistic modelling framework. Comparative studies of ensemble methods and alternative features and feature types should be investigated further. Tämä tutkielma tarkastelee älykkään maksuvaikeuden ennustamisen nykyisiä trendejä ja viimeaikaisten akateemisten julkaisujen tarjoamia ratkaisumalleja klassisten ennustemenetelmien ongelmiin. Maksuvaikeuden ennustamisen tavoitteena on löytää luokittelukriteeristö, joka pystyisi mahdollisimman luotettavasti erottelemaan terveet yritykset lähitulevaisuudessa taloudellisiin vaikeuksiin ajautuvista kriisiyrityksistä. Perinteisiä tilastollisia menetelmiä, kuten erotteluanalyysia ja logistista regressiota, on tyypillisesti käytetty optimaalisen luokittelukriteeristön määrittämiseen. Luokittelukriteeristöjä kehitetään nykyisin yhä enemmän älykkäillä menetelmillä johtuen niiden paremmasta ennustetarkkuudesta ja joustavuudesta. Älykkäiden menetelmien soveltaminen on nostanut esiin uusia ja paremmin suoriutuvia ennustemalleja, jotka eivät kuitenkaan yksistään ratkaise klassisten ennustemenetelmien ongelmia, sillä monet näistä ongelmista eivät johdu suoraan käytettävästä ennustemallista, vaan yleisistä toimintatavoista ja oletuksista ennusteprosessissa.
Tämä tutkielma analysoi 36 vertaisarvioitua, älykkään maksuvaikeuden ennustamiseen keskittyvää tutkimusta. Tulokset osoittivat, että aihealueella on monia tutkimuskohteita ja -tavoitteita, mikä viittaa monimutkaiseen ja moniuloitteiseen ilmiöön. Meta-analyysin mukaan moniluokittelijajärjestelmiä on käytetty eniten ennustemalleina ja ne ovat myös yltäneet keskimäärin parhaaseen ennustetarkkuuteen. Tarkastelluissa tutkimuksissa on käytetty useammin epätasapainoista kuin tasapainoista dataa, mutta vain pieni osa tutkimuksista on pyrkinyt ratkaisemaan tästä metodivalinnasta johtuvia ongelmia. Klassisten ennustemenetelmien ongelmiin ratkaisut ovat osin puutteellisia. Vaikka tutkimuksissa on käytetty dynaamisia elementtejä ja monimutkaisia menetelmiä mallintamisen vaiheissa, ei suurinta osaa ongelmista ole otettu aktiivisesti huomioon. Merkityksellisten muuttujien identifioimiseksi tarvitaan tulevaisuudessa laajempaa teoreettista analyysiä. Myös moniluokittelijajärjestelmiä vertaileva analyysi tarjoaa potentiaalisen jatkotutkimuskohteen.
The results showed that the studies had various research areas and dispersed objectives, which indicates a certain level of complexity and multidimensionality around the subject. Multiple classifier systems, or ensemble methods, were the most popular and the highest performing methods. Imbalanced datasets were applied more often than balanced, but only a minority of the studies addressed the problems that arise due to this practice. Responses to the problems in classic prediction methodologies were somewhat insufficient. Although studies implemented dynamic properties and sophisticated techniques in the modelling phase, most of the problems remained unsolved. For the future, in-depth theoretical analysis is needed to find meaningful features and eliminate unsuitable practices in the process. Also, studies are encouraged to continue with imbalanced datasets and to implement dynamic modelling practices for a more realistic modelling framework. Comparative studies of ensemble methods and alternative features and feature types should be investigated further.
Tämä tutkielma analysoi 36 vertaisarvioitua, älykkään maksuvaikeuden ennustamiseen keskittyvää tutkimusta. Tulokset osoittivat, että aihealueella on monia tutkimuskohteita ja -tavoitteita, mikä viittaa monimutkaiseen ja moniuloitteiseen ilmiöön. Meta-analyysin mukaan moniluokittelijajärjestelmiä on käytetty eniten ennustemalleina ja ne ovat myös yltäneet keskimäärin parhaaseen ennustetarkkuuteen. Tarkastelluissa tutkimuksissa on käytetty useammin epätasapainoista kuin tasapainoista dataa, mutta vain pieni osa tutkimuksista on pyrkinyt ratkaisemaan tästä metodivalinnasta johtuvia ongelmia. Klassisten ennustemenetelmien ongelmiin ratkaisut ovat osin puutteellisia. Vaikka tutkimuksissa on käytetty dynaamisia elementtejä ja monimutkaisia menetelmiä mallintamisen vaiheissa, ei suurinta osaa ongelmista ole otettu aktiivisesti huomioon. Merkityksellisten muuttujien identifioimiseksi tarvitaan tulevaisuudessa laajempaa teoreettista analyysiä. Myös moniluokittelijajärjestelmiä vertaileva analyysi tarjoaa potentiaalisen jatkotutkimuskohteen.