Predicting late payment of sales invoices with statistical learning methods
Martikainen, Matti (2023)
Diplomityö
Martikainen, Matti
2023
School of Engineering Science, Laskennallinen tekniikka
Kaikki oikeudet pidätetään.
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi-fe2023072791795
https://urn.fi/URN:NBN:fi-fe2023072791795
Tiivistelmä
Predicting the time at which a company is bound to receive money from their outstanding sales invoices is a part of cash flow forecasting, which helps companies make better financial decisions. This study explores the feasibility of utilizing statistical learning methods to predict late payments of sales invoices in advance, using a data set obtained from a Finnish ERP (enterprise resource planning) software product. Based on past studies on the topic, several ensemble learning classifier models were evaluated for the task. In addition, a naive benchmark classifier was proposed, which based its prediction entirely on the classes of previous invoices from the same customer, prioritizing their most recent invoices with exponential discounting. The evaluated models narrowly outperformed this benchmark on some experiments, while in others the benchmark performed slightly better. The performance difference across the evaluated models was found to be relatively small in any given task. Prior information from previous invoices paid by the same customer was found to be the most significant contributor to the predictions. Avointen myyntisaatavien maksuajan ennustaminen on osa kassavirtaennustamista, joka auttaa yrityksiä tekemään parempia taloudellisia päätöksiä. Tämä tutkimus selvittää, kuinka hyvin suomalaisesta ERP-järjestelmästä kerättyjen avointen myyntilaskujen maksupäivää voitaisiin ennustaa statistisen oppimisen menetelmiä hyödyntäen. Aiempiin tutkimuksiin perustuen arvioitavaksi valittiin useita kokoonpano-oppimiseen (ensemble learning) perustuvia luokittelumalleja. Lisäksi kehitettiin naiivi vertailumenetelmä, jonka ennuste perustui ainoastaan saman asiakkaan aiempien laskujen luokituksiin, painottaen lähiaikoina maksettuja laskuja eksponentiaalisella diskonttauksella. Arvioitavat mallit suoriutuivat osassa kokeista hieman vertailumenetelmää paremmin, mutta toisissa heikommin. Keskinäiset erot mallien suoriutumisessa olivat kaiken kaikkiaan melko pieniä. Arvioitujen mallien luokittelutulokseen vaikutti eniten asiakkaan laskutushistoriasta koottu tieto asiakkaan aiemmasta maksukäyttäytymisestä.
