Verkkolehden tutustumistilauksen jatkon ennustaminen koneoppimisella
Kunnas, Jere (2025)
Diplomityö
Kunnas, Jere
2025
School of Engineering Science, Tuotantotalous
Kaikki oikeudet pidätetään.
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi-fe20251117108547
https://urn.fi/URN:NBN:fi-fe20251117108547
Tiivistelmä
Tämän diplomityön tavoitteena oli selvittää, voidaanko Qlik AutoML -koneoppimistyökalun avulla ennustaa digitaalisen verkkolehden tutustumistilauksen jatkumista edullisin tutustumisjakson päätyttyä hyödyntämällä kahden viikon ajalta kerättyä verkko- ja sovelluskäyttäytymisdataa. Työ toteutettiin tapaustutkimuksena suomalaisessa mediayhtiössä, ja tutkimuskohteena oli yhden verkkolehden tutustumistilauskampanja.
Koneoppimismallien tehtävänä oli luokitella asiakkaat tilauksen jatkajiin ja päättäjiin sekä tunnistaa päätöksiin vaikuttavia tekijöitä. Tutkimuksessa tarkasteltiin, kuinka hyvin Auto ML:llä rakennettu malli kykenee ennustamaan tutustumistilauksen jatkumista, ja mitkä ominaisuudet vaikuttivat eniten päätökseen jatkaa tai päättää tilaus.
Qlik AutoML mahdollisti mallien kehittämisen ilman laajempaa ohjelmointi- ja koneoppimisosaamista automatisoimalla datan esikäsittelyä, ominaisuuksien valintaa ja mallien koulutusta. Mallien koulutuksessa käytetty data sisälsi käyttäjäkohtaisia tietoja tilauksista, taustatiedoista ja verkkokäyttäytymisestä. Kehitettyjen mallien suorituskyky jäi heikoksi, vaikka ne tunnistivat kohtuullisen hyvin päättävät asiakkaat. Mallit eivät kuitenkaan kyenneet erottamaan luotettavasti aktiivisia päättäviä asiakkaita aktiivisista jatkavista asiakkaista. Ominaisuuksien merkitys osoitti, että erityisesti käyttöaktiivisuus, tilauksen aloitusartikkelin sisällön tyyppi ja käyttäjän maakunta olivat keskeisiä ominaisuuksia. The objective of this master’s thesis was to examine the Qlik AutoML machine learning tool can be used to predict the continuation of a digital newspaper trial subscription after a lowcost introductory period, using web and app behavior data collected during the first two weeks of the subscription. The study was conducted as a case study in a Finnish media company, focusing on one newspaper’s trial subscription campaign.
The machine learning model aimed to classify customers into continuers and cancellers and to identify the key factors influencing their decision. The study investigated how accurately a model built with Qlik AutoML could predict whether a trial subscription would continue and which features had the strongest impact on the decision to continue or cancel.
Qlik AutoML enabled the development of models without extensive programming or machine learning expertise by automating data preprocessing, feature selection, and model training. The training data included user-level information on subscriptions, feature selection, and online behaviour. The model’s overall performance remained limited, although they identified cancelling customers reasonably well. However, the models were unable to reliably distinguish between active users who cancelled and those who continued their subscription. Feature importance analysis showed that usage activity, the content type of the article that initiated the subscription, and the user’s region were the most influential features.
Koneoppimismallien tehtävänä oli luokitella asiakkaat tilauksen jatkajiin ja päättäjiin sekä tunnistaa päätöksiin vaikuttavia tekijöitä. Tutkimuksessa tarkasteltiin, kuinka hyvin Auto ML:llä rakennettu malli kykenee ennustamaan tutustumistilauksen jatkumista, ja mitkä ominaisuudet vaikuttivat eniten päätökseen jatkaa tai päättää tilaus.
Qlik AutoML mahdollisti mallien kehittämisen ilman laajempaa ohjelmointi- ja koneoppimisosaamista automatisoimalla datan esikäsittelyä, ominaisuuksien valintaa ja mallien koulutusta. Mallien koulutuksessa käytetty data sisälsi käyttäjäkohtaisia tietoja tilauksista, taustatiedoista ja verkkokäyttäytymisestä. Kehitettyjen mallien suorituskyky jäi heikoksi, vaikka ne tunnistivat kohtuullisen hyvin päättävät asiakkaat. Mallit eivät kuitenkaan kyenneet erottamaan luotettavasti aktiivisia päättäviä asiakkaita aktiivisista jatkavista asiakkaista. Ominaisuuksien merkitys osoitti, että erityisesti käyttöaktiivisuus, tilauksen aloitusartikkelin sisällön tyyppi ja käyttäjän maakunta olivat keskeisiä ominaisuuksia.
The machine learning model aimed to classify customers into continuers and cancellers and to identify the key factors influencing their decision. The study investigated how accurately a model built with Qlik AutoML could predict whether a trial subscription would continue and which features had the strongest impact on the decision to continue or cancel.
Qlik AutoML enabled the development of models without extensive programming or machine learning expertise by automating data preprocessing, feature selection, and model training. The training data included user-level information on subscriptions, feature selection, and online behaviour. The model’s overall performance remained limited, although they identified cancelling customers reasonably well. However, the models were unable to reliably distinguish between active users who cancelled and those who continued their subscription. Feature importance analysis showed that usage activity, the content type of the article that initiated the subscription, and the user’s region were the most influential features.
