Statistical fault characterization in industrial processes
Vieraankivi, Annika (2021)
Diplomityö
Vieraankivi, Annika
2021
School of Engineering Science, Laskennallinen tekniikka
Kaikki oikeudet pidätetään.
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi-fe2021083044652
https://urn.fi/URN:NBN:fi-fe2021083044652
Tiivistelmä
Fault detection is used to identify anomalous behavior in a process or machine. This study aims to characterize faults in an industrial process based on vibration signal. The studied data is unlabeled process data containing a few faulty labeled events that are utilized to compare and evaluate models. Faults are examined through regression analysis, principal component analysis, and spectral analysis. In the regression analysis part, three ensemble methods, AdaBoost, Bagging, and Random forest are compared.
The literature review introduces the use of statistical and machine learning anomaly detection in industry. Regression algorithms, spectral analysis, and principal component analysis are presented in theory. The anomaly detection model is created and the variables affecting vibration value are studied. Regression methods are compared and the results show that AdaBoost performs best in terms of R-squared scores and tests on real data. The spectral analysis model needs future improvement since it does not succeed to characterize faults. Principal component analysis manages to reduce dimensionality without losing too much information. Six first principal components succeed to explain more than 80% of variance. In addition to that, data characteristics and variable relationships are studied using resulting principal components and they describe the studied process well. Vikojen tunnistamista käytetään poikkeavan käytöksen löytämiseen prosessista tai koneesta. Tässä työssä pyritään karakterisoimaan vikoja teollisessa prosessissa värinäsignaalin avulla. Tutkittava data on luokittelematonta prosessidataa, jossa on muutama luokiteltu tapahtuma, joita hyödynnetään mallien vertailussa ja arvioinnissa. Poikkeamia tutkitaan regression, pääkomponenttianalyysin ja spektrianalyysin kautta. Regressioanalyysissä verrataan kolmea yhdistämismenetelmää, AdaBoostia, Baggingia ja Satunnaismetsää.
Kirjallisuuskatsauksessa esitellään tilastollisten ja koneoppimiseen pohjautuvien poikkeamien tunnistamismenetelmien käyttöä teollisuudessa. Regressioalgoritmit, spektrianalyysi ja pääkomponenttianalyysi esitellään teoriassa. Työssä luodaan poikkeamien tunnistamiseen malli ja tutkitaan muuttujia, jotka vaikuttavat värinän arvoon. Regressiomenetelmiä vertaillaan ja tulosten perusteella AdaBoost suoriutuu parhaiten. Spektrianalyysillä luotu malli ei onnistu karakterisoimaan vikoja, joten se tarvitsee jatkokehitystä. Pääkomponenttianalyysillä onnistutaan vähentämään datan ulottuvuuksia menettämättä liikaa informaatiota. Kuusi ensimmäistä pääkomponenttia selittävät yli 80% datan varianssista. Tämän lisäksi datan ominaisuuksia ja muuttujien välisiä suhteita tutkitaan pääkomponentteja käyttäen, ja komponentit kuvaavat tutkittavaa prosessia hyvin.
The literature review introduces the use of statistical and machine learning anomaly detection in industry. Regression algorithms, spectral analysis, and principal component analysis are presented in theory. The anomaly detection model is created and the variables affecting vibration value are studied. Regression methods are compared and the results show that AdaBoost performs best in terms of R-squared scores and tests on real data. The spectral analysis model needs future improvement since it does not succeed to characterize faults. Principal component analysis manages to reduce dimensionality without losing too much information. Six first principal components succeed to explain more than 80% of variance. In addition to that, data characteristics and variable relationships are studied using resulting principal components and they describe the studied process well.
Kirjallisuuskatsauksessa esitellään tilastollisten ja koneoppimiseen pohjautuvien poikkeamien tunnistamismenetelmien käyttöä teollisuudessa. Regressioalgoritmit, spektrianalyysi ja pääkomponenttianalyysi esitellään teoriassa. Työssä luodaan poikkeamien tunnistamiseen malli ja tutkitaan muuttujia, jotka vaikuttavat värinän arvoon. Regressiomenetelmiä vertaillaan ja tulosten perusteella AdaBoost suoriutuu parhaiten. Spektrianalyysillä luotu malli ei onnistu karakterisoimaan vikoja, joten se tarvitsee jatkokehitystä. Pääkomponenttianalyysillä onnistutaan vähentämään datan ulottuvuuksia menettämättä liikaa informaatiota. Kuusi ensimmäistä pääkomponenttia selittävät yli 80% datan varianssista. Tämän lisäksi datan ominaisuuksia ja muuttujien välisiä suhteita tutkitaan pääkomponentteja käyttäen, ja komponentit kuvaavat tutkittavaa prosessia hyvin.