Machine learning in predictive maintenance : classification approach for remaining useful life prediction
Peltola, Tuomas (2020)
Pro gradu -tutkielma
Peltola, Tuomas
2020
School of Business and Management, Kauppatieteet
Kaikki oikeudet pidätetään.
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi-fe2020052238712
https://urn.fi/URN:NBN:fi-fe2020052238712
Tiivistelmä
This thesis focuses on predicting remaining useful life (RUL) with classification approach. The methodology is demonstrated with NASA’s turbofan engine degradation dataset. Three classification systems with different multi-class divisions are constructed from RUL’s, systems consisting of 10, 6 and 4 classes, respectively. Random forest (RF) and neural network (NN) algorithms are used to train the classification models. The performance comparison between systems and algorithms along with the optimal hyperparameters are the principal questions to be answered in the scope of this study. The performance is measured with mainly Matthews correlation coefficient (MCC) and complemented with interpretations of confusion matrices. The results show that the parameters which were focused on, do not have huge impact on the model performance. The classi-fication system with fewest classes performs much better compared to the other systems, which are closer to each other in terms of MCC. RF slightly outperforms NN in case of every classification system, although the NN parameters would need better optimization. Even though close to perfect classification was not achieved, the results of this study show that the proposed approach has potential, yet the class divisions especially need further consideration. Tämän tutkielman tarkoituksena on ennustaa jäljellä olevaa käyttöikää käyttäen luokittelumalleja. Menetelmää havainnollistetaan NASA:n suihkuturbiinimoottorien vikojen kehittymistä kuvaavalla sensoridatalla. Kolme luokittelujärjestelmää muodostetaan jakamalla jäljellä oleva käyttöikä luokkiin. Järjestelmissä on 10, 6 ja 4 luokkaa. Luokittelumallien kouluttamisessa käytetään random forest (RF) ja neural network (NN) -algoritmeja. Luokittelujärjestelmien ja algoritmien välisen suorituskyvyn vertailu sekä optimaalisten parametrien selvittäminen ovat tämän tutkielman keskiössä. Suorituskykyä mitataan pääasiassa Matthewsin korrelaatiokertoimella (MCC), jonka lisäksi hyödynnetään myös confusion matriiseja. Tulokset osoittavat, että tarkastelun alla olevat parametrit eivät ole kovin tärkeitä mallin suorituskyvyn kannalta. Vähiten luokkia sisältävä luokittelujärjestelmä tuottaa selvästi paremmat tulokset verrattuna kahteen muuhun järjestelmään, jotka ovat suorituskyvyltään lähempänä toisiaan. RF suoriutuu paremmin kuin NN jokaisen luokittelujärjestelmän kohdalla, mutta NN:n parametrien optimointiin tulisi kiinnittää enemmän huomiota parhaan luokittelutarkkuuden varmistamiseksi. Mikään malleista ei kuitenkaan yllä lähelle täydellistä luokittelutulosta. Siitä huolimatta tulokset osoittavat, että menetelmässä on potentiaalia, mutta erityisesti luokkajaotteluun tulisi kiinnittää tarkempaa huomiota.