Asiakaspoistuman ennustaminen päätöspuuhun perustuvien koneoppimismallien avulla - Case vakuutusyhtiö
Malmi, Jalmari (2023)
Kandidaatintutkielma
Malmi, Jalmari
2023
School of Business and Management, Kauppatieteet
Kaikki oikeudet pidätetään.
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi-fe20230921135254
https://urn.fi/URN:NBN:fi-fe20230921135254
Tiivistelmä
Tässä kandidaatintutkielmassa tutkitaan päätöspuuhun perustuvien koneoppimismallien kykyä ennustaa vakuutusyhtiön asiakaspoistumaa. Lisäksi tutkimuksessa pyritään tunnistamaan asiakaspoistumaan vaikuttavia tekijöitä. Tutkimuksen teoriaosuus käsittelee koneoppimisen ja asiakaspoistuman teoriaa. Empiirinen tutkimus on toteutettu käyttäen suomalaisen vakuutusyhtiön yritysasiakkaista koostuvaa aineistoa, sekä Python-ohjelmointikielelle saatavia koneoppimiskirjastoja.
Koneoppimismallien suorituskykyä mitattiin ennustetarkkuus-, täsmällisyys-, muistamis- sekä F-pisteet-mittareilla. Tutkimustulosten perustella päätöspuuhun perustuvilla koneoppimismalleilla voidaan ennustaa asiakaspoistumaa kohtuullisen hyvin. Parhaiten käytetyistä malleista asiakaspoistumaa ennusti Random Forest -koneoppimismalli. Hinta sekä asiakkuuden kesto ovat suurimpia asiakaspoistumaan vaikuttavia tekijöitä. This bachelor's thesis examines the ability of machine learning models based on decision trees to predict the customer churn of an insurance company. In addition, the study aims to identify factors influencing customer churn. The theoretical part of the study deals with the theory of machine learning and customer churn. Empirical research has been carried out us-ing dataset consisting of business customers of a Finnish insurance company, as well as ma-chine learning libraries available for the Python programming language.
The performance of the machine learning models was measured with prediction accuracy, precision, recall and F-score metrics. Based on the research results, machine learning models based on decision trees can predict customer churn reasonably well. Among the used mod-els, the random forest machine learning model predicted churn best. The price and the dura-tion of the customer are the biggest factors affecting customer churn.
Koneoppimismallien suorituskykyä mitattiin ennustetarkkuus-, täsmällisyys-, muistamis- sekä F-pisteet-mittareilla. Tutkimustulosten perustella päätöspuuhun perustuvilla koneoppimismalleilla voidaan ennustaa asiakaspoistumaa kohtuullisen hyvin. Parhaiten käytetyistä malleista asiakaspoistumaa ennusti Random Forest -koneoppimismalli. Hinta sekä asiakkuuden kesto ovat suurimpia asiakaspoistumaan vaikuttavia tekijöitä.
The performance of the machine learning models was measured with prediction accuracy, precision, recall and F-score metrics. Based on the research results, machine learning models based on decision trees can predict customer churn reasonably well. Among the used mod-els, the random forest machine learning model predicted churn best. The price and the dura-tion of the customer are the biggest factors affecting customer churn.
