Asiakasdatan klusterianalyysi itseorganisoituvilla kartoilla
Lunttila, Jenni (2017)
Kandidaatintutkielma
Lunttila, Jenni
2017
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi-fe201708298250
https://urn.fi/URN:NBN:fi-fe201708298250
Tiivistelmä
Tämän kandidaatintutkielman tarkoituksena on selvittää, kuinka itseorganisoituvilla kartoilla
voidaan suorittaa aineiston analyysiä. Tavoitteena on myös selittää, kuinka tästä klusteroinnista
saatuja tuloksia voidaan hyödyntää markkinoinnissa. Tutkielmassa selvitetään
itseorganisoituvien karttojen toimintaperiaate ja menetelmän taustoja. Tämän lisäksi selvitän,
kuinka niitä voidaan käyttää MATLAB® -ohjelmointiympäristössä. Lopuksi suoritan
klusterianalyysin todellisella asiakasdatalla sekä analysoin saadut tulokset tuoden esiin
löytämäni liiketoiminnalliset johtopäätökset.
1950-luvulla pian keinoälyn kehittelemisen jälkeen alkoi työ keinotekoisten neuroverkkojen
kehittelemiseksi nisäkkäiden aivokuoren toimintaa yksinkertaisesti mallintamaan. Kuitenkin
varsinaiset hyödyt näistä saavutettiin vasta vuosituhannen loppupuolella. Nykyään
itseorganisoituvien karttojen käyttö erinäisissä projekteissa, etenkin tekniikan ja lääketieteen
aloilla, kasvattaa suosioitaan nopeaan tahtiin. Neuroverkkotietämyksen ja tietoteknisten
valmiuksien parantuessa mahdollistuu aiempaa suurempien datakokonaisuuksien nopeampi ja
tuloksellisempi käsittely.
Tutkielman tulokset osoittavat millaisia analysoitavasta aineistosta pankille parhaimmat
lainanottajat ovat. He ovat ylempää keskiluokkaa edustavia yli neljäkymmentävuotiaita
asuntovelallisia. Tulokset osoittivat myös sen, kuinka numeeristen muuttujien perusteella
suoritettu klusterointi olisi koodattuun aineistoon pohjautuvaa luotettavampi. Kaiken kaikkiaan
SOM omaa metodina moninaisia etuja muihin klusterointimenetelmiin nähden. The purpose of this Bachelor’s thesis is to find out how to analyze data by clustering it with
self-orgazing maps (SOMs) and how to utilize the results in marketing. The study shows the
mechanics behind these self-organizing maps. I also examine how to use SOMs in MATLAB®
coding environment. To conclude my thesis, I carry out a cluster analysis with real customer
data and then analyze the received results presenting the commercial conclutions which I have
found.
Previous studies around this subject date all the way back to 1950s when the artificial
intelligence was found and the development of artificial neural networks begun to mimic to the
basic functions of cerebral cortex of mammals. Although the actual benefits from the utilization
of this methods were achieved not until the end of 20th century. Nowadays the use of SOMs as
a guidance tool with all sorts of projects, as technological and medical ones, increases
constantly. By the increasing knowledge about neural networks and development of technology
makes it possible to carry out processing bigger data sets while getting more accurate results
faster than ever before.
The results of this study show based on the analysis conducted from the given dataset that the
best loan customers for this bank represent upper middle class, are over 40 years old and
already have some mortgage. The results also show that the formed clusters would become
more reliable if the initial data is in numerical form instead of the coded dataset. All in all
SOM has several advantages compared to other clustering methods.
voidaan suorittaa aineiston analyysiä. Tavoitteena on myös selittää, kuinka tästä klusteroinnista
saatuja tuloksia voidaan hyödyntää markkinoinnissa. Tutkielmassa selvitetään
itseorganisoituvien karttojen toimintaperiaate ja menetelmän taustoja. Tämän lisäksi selvitän,
kuinka niitä voidaan käyttää MATLAB® -ohjelmointiympäristössä. Lopuksi suoritan
klusterianalyysin todellisella asiakasdatalla sekä analysoin saadut tulokset tuoden esiin
löytämäni liiketoiminnalliset johtopäätökset.
1950-luvulla pian keinoälyn kehittelemisen jälkeen alkoi työ keinotekoisten neuroverkkojen
kehittelemiseksi nisäkkäiden aivokuoren toimintaa yksinkertaisesti mallintamaan. Kuitenkin
varsinaiset hyödyt näistä saavutettiin vasta vuosituhannen loppupuolella. Nykyään
itseorganisoituvien karttojen käyttö erinäisissä projekteissa, etenkin tekniikan ja lääketieteen
aloilla, kasvattaa suosioitaan nopeaan tahtiin. Neuroverkkotietämyksen ja tietoteknisten
valmiuksien parantuessa mahdollistuu aiempaa suurempien datakokonaisuuksien nopeampi ja
tuloksellisempi käsittely.
Tutkielman tulokset osoittavat millaisia analysoitavasta aineistosta pankille parhaimmat
lainanottajat ovat. He ovat ylempää keskiluokkaa edustavia yli neljäkymmentävuotiaita
asuntovelallisia. Tulokset osoittivat myös sen, kuinka numeeristen muuttujien perusteella
suoritettu klusterointi olisi koodattuun aineistoon pohjautuvaa luotettavampi. Kaiken kaikkiaan
SOM omaa metodina moninaisia etuja muihin klusterointimenetelmiin nähden.
self-orgazing maps (SOMs) and how to utilize the results in marketing. The study shows the
mechanics behind these self-organizing maps. I also examine how to use SOMs in MATLAB®
coding environment. To conclude my thesis, I carry out a cluster analysis with real customer
data and then analyze the received results presenting the commercial conclutions which I have
found.
Previous studies around this subject date all the way back to 1950s when the artificial
intelligence was found and the development of artificial neural networks begun to mimic to the
basic functions of cerebral cortex of mammals. Although the actual benefits from the utilization
of this methods were achieved not until the end of 20th century. Nowadays the use of SOMs as
a guidance tool with all sorts of projects, as technological and medical ones, increases
constantly. By the increasing knowledge about neural networks and development of technology
makes it possible to carry out processing bigger data sets while getting more accurate results
faster than ever before.
The results of this study show based on the analysis conducted from the given dataset that the
best loan customers for this bank represent upper middle class, are over 40 years old and
already have some mortgage. The results also show that the formed clusters would become
more reliable if the initial data is in numerical form instead of the coded dataset. All in all
SOM has several advantages compared to other clustering methods.