Markkinointidatan tutkiminen muuttujanvalintamenetelmää ja luokittelualgoritmia käyttäen
Vieraankivi, Annika (2019)
Kandidaatintyö
Vieraankivi, Annika
2019
School of Engineering Science, Laskennallinen tekniikka
Kaikki oikeudet pidätetään.
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi-fe2019052216698
https://urn.fi/URN:NBN:fi-fe2019052216698
Tiivistelmä
Tämän kandidaatintyön tavoitteena oli tehdä markkinointidatasta ennustemalli, jolla voidaan ennustaa, kannattaako tietylle kohderyhmälle lähteä markkinoimaan. Oleellista oli myös löytää aineistosta ongelman kannalta merkittävät muuttujat. Muuttujanvalinnan avulla voitiin yksinkertaistaa mallia ja nopeuttaa laskentaa.
Työssä esiteltiin muuttujanvalinnan ja luokittelun teoriat. Muuttujanvalinnassa keskityttiin epämääräisyysarvoon perustuvaan menetelmään ja hyödynnettiin sitä datan esikäsittelyssä. Luokittelualgoritmina käytettiin similaarisuuteen pohjautuvaa menetelmää. Tuloksia arvioitiin luokittelun keskitarkkuuden, -spesifisyyden ja -herkkyyden kautta.
Löydettiin ennustemalli, joka suoriutui hyvin kymmentä muuttujaa käyttäen. Luokittelutuloksia onnistuttiin parantamaan muuttujanvalinnan avulla. Luokittelun keskitarkkuus oli 83,97%, keskispesifisyys 86,83% ja keskiherkkyys 69,69%. Markkinointikampanjaa kuvaavat muuttujat olivat tulosten perusteella ongelman kannalta tärkeämpiä kuin asiakkaaseen liittyvät muuttujat.
Työssä esiteltiin muuttujanvalinnan ja luokittelun teoriat. Muuttujanvalinnassa keskityttiin epämääräisyysarvoon perustuvaan menetelmään ja hyödynnettiin sitä datan esikäsittelyssä. Luokittelualgoritmina käytettiin similaarisuuteen pohjautuvaa menetelmää. Tuloksia arvioitiin luokittelun keskitarkkuuden, -spesifisyyden ja -herkkyyden kautta.
Löydettiin ennustemalli, joka suoriutui hyvin kymmentä muuttujaa käyttäen. Luokittelutuloksia onnistuttiin parantamaan muuttujanvalinnan avulla. Luokittelun keskitarkkuus oli 83,97%, keskispesifisyys 86,83% ja keskiherkkyys 69,69%. Markkinointikampanjaa kuvaavat muuttujat olivat tulosten perusteella ongelman kannalta tärkeämpiä kuin asiakkaaseen liittyvät muuttujat.