Graph database recommendation system framework implementation for enhancing service configuration
Ylitalo, Valtteri (2025)
Diplomityö
Ylitalo, Valtteri
2025
School of Engineering Science, Tuotantotalous
Kaikki oikeudet pidätetään.
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi-fe2025062775163
https://urn.fi/URN:NBN:fi-fe2025062775163
Tiivistelmä
This master's thesis presents the design and implementation of a graph database-based recommendation system framework aimed at enhancing the service configuration process. The primary objective is to automate and streamline the creation of maintenance service offerings by leveraging the capabilities of graph databases and data science methodologies.
The research adopts the Design Science Research Methodology (DSRM) to iteratively develop and evaluate a recommendation engine that predicts upcoming maintenance needs based on equipment running hours. Neo4j, a graph database management system, is employed to model complex relationships between installations, equipment, events, and service requirements. The system integrates various technologies including Docker, Apache Airflow, and AWS to ensure scalability, repeatability, and automation.
The created framework extracts relevant data from a production graph database, processes it in containerized environments, and generates maintenance recommendations. These recommendations are visualized through a user interface, enabling engineers to access both historical and forecasted maintenance events. The system significantly reduces manual effort by providing pre-configured service packages tailored to each equipment’s predicted usage.
Key contributions of the thesis include a detailed data model for recommendation generation, a prioritization logic based on predicted running hours, and a filtering algorithm for matching service requirements. The results demonstrate the feasibility and efficiency of using graph-based approaches for service configuration and recommendation systems in general in industrial contexts. Future development directions are proposed, including the integration of advanced graph algorithms and machine learning techniques to enhance recommendation accuracy and adaptability. Tässä diplomityössä esitellään graafitietokantaan perustuvan suosittelujärjestelmän ohjelmistokehys, jonka tavoitteena on parantaa huoltopalveluiden määrittelyprosessia. Työn päätavoitteena on automatisoida ja tehostaa huoltotarjousten laatimista hyödyntämällä graafitietokantojen ja datatieteen menetelmiä.
Tutkimus toteutetaan Design Science Research Methodology (DSRM) -lähestymistapaa noudattaen, jossa suosittelulogiikka kehitetään ja arvioidaan iteratiivisesti. Neo4j-graafitietokantaa käytetään mallintamaan monimutkaisia suhteita asennusten, laitteiden, tapahtumien ja huoltovaatimusten välillä. Järjestelmä hyödyntää Dockeria, Apache Airflow’ta ja AWS:ää varmistaakseen skaalautuvuuden, toistettavuuden ja automaation.
Kehitetty ohjelmistokehys siirtää tarvittavat tiedot tuotantotietokannasta säiliöityyn ympäristöön, jossa huoltosuositukset tuotetaan ja tallennetaan takaisin pääjärjestelmään. Tulokset esitetään käyttöliittymässä, joka mahdollistaa huoltohistorian ja tulevien huoltotarpeiden tarkastelun. Järjestelmä vähentää merkittävästi manuaalista työtä tarjoamalla valmiita huoltopakettiehdotuksia.
Työn keskeisiä tuloksia ovat suosittelulogiikkaan soveltuva tietomalli, priorisointialgoritmi sekä suodatusmenetelmä huoltovaatimusten yhdistämiseksi. Tulokset osoittavat, että graafipohjainen lähestymistapa on tehokas ja soveltuva teollisiin huoltoprosesseihin, ja suosittelulogiikan toteuttamiseen yleisesti. Jatkokehitysehdotuksina esitetään kehittyneempien graafialgoritmien ja koneoppimismenetelmien hyödyntämistä suositusten tarkkuuden ja älykkyyden parantamiseksi.
The research adopts the Design Science Research Methodology (DSRM) to iteratively develop and evaluate a recommendation engine that predicts upcoming maintenance needs based on equipment running hours. Neo4j, a graph database management system, is employed to model complex relationships between installations, equipment, events, and service requirements. The system integrates various technologies including Docker, Apache Airflow, and AWS to ensure scalability, repeatability, and automation.
The created framework extracts relevant data from a production graph database, processes it in containerized environments, and generates maintenance recommendations. These recommendations are visualized through a user interface, enabling engineers to access both historical and forecasted maintenance events. The system significantly reduces manual effort by providing pre-configured service packages tailored to each equipment’s predicted usage.
Key contributions of the thesis include a detailed data model for recommendation generation, a prioritization logic based on predicted running hours, and a filtering algorithm for matching service requirements. The results demonstrate the feasibility and efficiency of using graph-based approaches for service configuration and recommendation systems in general in industrial contexts. Future development directions are proposed, including the integration of advanced graph algorithms and machine learning techniques to enhance recommendation accuracy and adaptability.
Tutkimus toteutetaan Design Science Research Methodology (DSRM) -lähestymistapaa noudattaen, jossa suosittelulogiikka kehitetään ja arvioidaan iteratiivisesti. Neo4j-graafitietokantaa käytetään mallintamaan monimutkaisia suhteita asennusten, laitteiden, tapahtumien ja huoltovaatimusten välillä. Järjestelmä hyödyntää Dockeria, Apache Airflow’ta ja AWS:ää varmistaakseen skaalautuvuuden, toistettavuuden ja automaation.
Kehitetty ohjelmistokehys siirtää tarvittavat tiedot tuotantotietokannasta säiliöityyn ympäristöön, jossa huoltosuositukset tuotetaan ja tallennetaan takaisin pääjärjestelmään. Tulokset esitetään käyttöliittymässä, joka mahdollistaa huoltohistorian ja tulevien huoltotarpeiden tarkastelun. Järjestelmä vähentää merkittävästi manuaalista työtä tarjoamalla valmiita huoltopakettiehdotuksia.
Työn keskeisiä tuloksia ovat suosittelulogiikkaan soveltuva tietomalli, priorisointialgoritmi sekä suodatusmenetelmä huoltovaatimusten yhdistämiseksi. Tulokset osoittavat, että graafipohjainen lähestymistapa on tehokas ja soveltuva teollisiin huoltoprosesseihin, ja suosittelulogiikan toteuttamiseen yleisesti. Jatkokehitysehdotuksina esitetään kehittyneempien graafialgoritmien ja koneoppimismenetelmien hyödyntämistä suositusten tarkkuuden ja älykkyyden parantamiseksi.