Tensoripohjainen suosittelumalli
Halme, Kasper (2016)
Kandidaatintutkielma
Halme, Kasper
2016
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi-fe2016102725608
https://urn.fi/URN:NBN:fi-fe2016102725608
Tiivistelmä
Käsiteltävissä olevan tiedon määrän kasvaessa tarvitaan uusia tapoja analysoida tietoa ja seuloa tietomassoista merkityksellistä informaatiota. Tästä huolimatta monet alan yleiset suosittelumallit, kuten Collaborative Filtering, hyödyntävät tietomassan yleisiä ominaisuuksija tarjoavat vain pinnallista informaatiota.
Tämän kandidaatintyön tavoitteena on selvittää, millaisia tuloksia saadaan, kun haluttu informaatio perustuu tietomassasta löydettyihin trendeihin. Nämä trendit saadaan selville käyttämällä tensorianalytiikkaa Gibbsin Motif Finding -metodilla ja tuottamalla arvio ihmisten käyttäytymismallien suhteista, jotka lopuksi sijoitetaan saadun arvon avulla järjestykseen.
Tutkimuksen selventämiseksi Ylen avointa vaalidataa hyödynnettiin tietomassana trendipohjaisen ja yleisen suosittelumallin tulosten vertailua varten. Vertailusta saadut tulokset erottuivat toisistaan huomattavasti. Trendipohjainen malli sijoitti arvoiltaan vaihtelevia tuloksia tärkeämmiksi, kun yleisen mallin tulokset sen sijaan olivat arvoiltaan samanlaisia. Trendipohjainen suosittelumalli arvioitiin tarkemmaksi kun Collaborative Filteringin. As the amount of data to be handled increases, so does the need for new ways to
analyze and parse it for relevant information. Despite this, many of the general
recommendation models, such as Collaborative Filtering, only take advantage of the
general characteristics giving only superficial information as a result. The aim of
this bachelor’s thesis is to find out what kind of results arises when the desired in-
formation is based on the found trends within data. These trends can be discovered
by using a tensor analytics with Gibbs Motif Finding to provide an estimation of
people’s behavioral relations, which are then ranked according to their scores. In
order to clarify the study, open electoral data was utilized for Trend-based and gen-
eral recommendation model to compare their results. The obtained results differed
significantly from each other. As a new phenomenon, Trend-based recommendation
model ranked results with unique characteristics higher, when the general recom-
mendation models results were homogeneous. In the light of given criterias the
Trend-based recommendation model were assessed to be most accurate of the two.
Tämän kandidaatintyön tavoitteena on selvittää, millaisia tuloksia saadaan, kun haluttu informaatio perustuu tietomassasta löydettyihin trendeihin. Nämä trendit saadaan selville käyttämällä tensorianalytiikkaa Gibbsin Motif Finding -metodilla ja tuottamalla arvio ihmisten käyttäytymismallien suhteista, jotka lopuksi sijoitetaan saadun arvon avulla järjestykseen.
Tutkimuksen selventämiseksi Ylen avointa vaalidataa hyödynnettiin tietomassana trendipohjaisen ja yleisen suosittelumallin tulosten vertailua varten. Vertailusta saadut tulokset erottuivat toisistaan huomattavasti. Trendipohjainen malli sijoitti arvoiltaan vaihtelevia tuloksia tärkeämmiksi, kun yleisen mallin tulokset sen sijaan olivat arvoiltaan samanlaisia. Trendipohjainen suosittelumalli arvioitiin tarkemmaksi kun Collaborative Filteringin.
analyze and parse it for relevant information. Despite this, many of the general
recommendation models, such as Collaborative Filtering, only take advantage of the
general characteristics giving only superficial information as a result. The aim of
this bachelor’s thesis is to find out what kind of results arises when the desired in-
formation is based on the found trends within data. These trends can be discovered
by using a tensor analytics with Gibbs Motif Finding to provide an estimation of
people’s behavioral relations, which are then ranked according to their scores. In
order to clarify the study, open electoral data was utilized for Trend-based and gen-
eral recommendation model to compare their results. The obtained results differed
significantly from each other. As a new phenomenon, Trend-based recommendation
model ranked results with unique characteristics higher, when the general recom-
mendation models results were homogeneous. In the light of given criterias the
Trend-based recommendation model were assessed to be most accurate of the two.