Matrix factorization algorithms for personalized product recommendation : a case study
Hietala, Joona (2021)
Diplomityö
Hietala, Joona
2021
School of Engineering Science, Tuotantotalous
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi-fe2021102552153
https://urn.fi/URN:NBN:fi-fe2021102552153
Tiivistelmä
Recommender systems are software systems that provide users with suggestions on items that could have utility for them. Recommender systems help users find relevant items for them among often large catalogs of items and are widely utilized at e-commerce and platform companies. The primary objective of this thesis is to study and find the most promising techniques for building a recommender system at a case company, intended for providing personalized product recommendations to customers, based on past product purchases and additional information on customers and products.
A literature review is conducted to offer an overview of recommender systems and to find suitable methods to be utilized on a dataset provided by the case company. The literature review is followed by a case study on the dataset, evaluating two performant matrix factorization algorithms chosen based on the literature review: ALS and LightFM.
The comparatively promising results obtained suggest that on the case study dataset, customers’ past purchase behavior is a better predictor of which products they could be interested in than the combination of past product purchases with additional information on customers and products. Although algorithms trained on past product purchases performed better than a hybrid model with additional information incorporated, it is probably justified to sacrifice a little bit of model accuracy for the ability to provide recommendations for cold-start customers who have not made any purchases. Suosittelujärjestelmät ovat ohjelmistotyökaluja ja -menetelmiä, jotka tarjoavat käyttäjille ehdotuksia kohteista, jotka voisivat kiinnostaa heitä. Suosittelujärjestelmät auttavat käyttäjiä löytämään juuri heille sopivia kohteita usein suurista määristä vaihtoehtoja, ja niitä käytetään laajasti verkkokaupoissa ja alustatalouden yrityksissä. Diplomityön ensisijainen tavoite on tutkia ja löytää lupaavimmat menetelmät suosittelujärjestelmän rakentamiseksi toimeksiantajayrityksessä. Järjestelmän tarkoitus on tarjota asiakkaille personoituja tuotesuosituksia aiempien tuoteostojen sekä asiakkaita ja tuotteita kuvaavien lisätietojen perusteella.
Kirjallisuuskatsaus tarjoaa yleiskatsauksen suosittelujärjestelmistä ja pyrkii löytämään menetelmiä, joita voidaan hyödyntää tuotesuositusten antamiseksi yrityksen tarjoaman data-aineiston pohjalta. Yrityksen tarjoamalla data-aineistolla suoritetaan tapaustutkimus, jossa arvioitavana on kaksi kirjallisuuskatsauksen perusteella valittua matriisien faktorointialgoritmia: ALS ja LightFM.
Tapaustutkimuksen tulokset viittaavat siihen, että asiakkaiden aiempi ostokäyttäytyminen ennustaa paremmin, mistä tuotteista he voisivat olla kiinnostuneita, kuin aikaisempien tuoteostojen ja asiakkaiden ja tuotteiden lisätietojen yhdistelmä. Vaikka aikaisempien tuoteostojen avulla koulutettu algoritmi oli tarkempi kuin hybridimalli, joka hyödyntää lisätietoja asiakkaista ja tuotteista, on todennäköisesti kannattavaa uhrata hieman tarkkuutta, jotta suosituksia voidaan tarjota myös asiakkaille, jotka eivät ole vielä tehneet ostoksia.
A literature review is conducted to offer an overview of recommender systems and to find suitable methods to be utilized on a dataset provided by the case company. The literature review is followed by a case study on the dataset, evaluating two performant matrix factorization algorithms chosen based on the literature review: ALS and LightFM.
The comparatively promising results obtained suggest that on the case study dataset, customers’ past purchase behavior is a better predictor of which products they could be interested in than the combination of past product purchases with additional information on customers and products. Although algorithms trained on past product purchases performed better than a hybrid model with additional information incorporated, it is probably justified to sacrifice a little bit of model accuracy for the ability to provide recommendations for cold-start customers who have not made any purchases.
Kirjallisuuskatsaus tarjoaa yleiskatsauksen suosittelujärjestelmistä ja pyrkii löytämään menetelmiä, joita voidaan hyödyntää tuotesuositusten antamiseksi yrityksen tarjoaman data-aineiston pohjalta. Yrityksen tarjoamalla data-aineistolla suoritetaan tapaustutkimus, jossa arvioitavana on kaksi kirjallisuuskatsauksen perusteella valittua matriisien faktorointialgoritmia: ALS ja LightFM.
Tapaustutkimuksen tulokset viittaavat siihen, että asiakkaiden aiempi ostokäyttäytyminen ennustaa paremmin, mistä tuotteista he voisivat olla kiinnostuneita, kuin aikaisempien tuoteostojen ja asiakkaiden ja tuotteiden lisätietojen yhdistelmä. Vaikka aikaisempien tuoteostojen avulla koulutettu algoritmi oli tarkempi kuin hybridimalli, joka hyödyntää lisätietoja asiakkaista ja tuotteista, on todennäköisesti kannattavaa uhrata hieman tarkkuutta, jotta suosituksia voidaan tarjota myös asiakkaille, jotka eivät ole vielä tehneet ostoksia.