Anomaly detection with room temperature time series
Jaatinen-Värri, Ahti (2023)
Pro gradu -tutkielma
Jaatinen-Värri, Ahti
2023
School of Business and Management, Kauppatieteet
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi-fe20231121148049
https://urn.fi/URN:NBN:fi-fe20231121148049
Tiivistelmä
Buildings use energy considerably and for example the European Union has clear intentions on improving the building energy efficiency, and existing building stock is important to be considered when building energy efficiency is discussed.
This work focuses on identifying possible anomalies (i.e. rooms that behave different to other rooms in the building) by using room temperature data time series. The room temperature data is combined with weather data obtained from FMI. The aim of the work is to preliminary examine the possibility to use the data for anomaly detection. Three different Case buildings are studied.
Three different unsupervised methods are tested. The first two are one based on variable distributions and a second one called one class support vector machine (OCSVM), which is a machine-learning method intended especially for anomaly detection. Both of these methods target point anomalies. The third method, k-means clustering, is treating the time series as a whole and categorised the rooms based on the complete series.
With all three tested methods it was possible to identify rooms or clusters of rooms which could be labeled as anomalies. The more detailed analysis and verifying the accuracy of the methods is left for future work, as the target of this project was to preliminarily assess the possibilities provided by the data. When the first two methods are compared, the simple variable distribution based method seemed more promising. Especially, as the OCSVM was computationally rather expensive in comparison. K-means clustering seemed quite promising, as with it several differently behaving clusters could be identified. Rakennukset kuluttavat energiaa merkittäviä määriä ja esimerkiksi Euroopan Unionilla on kunnianhimoisia tavoitetteita koskien rakennusten energiatehokkuutta. EU:n suunnitelmissa olemassa oleva rakennuskanta on myös erittäin tärkeässä roolissa tavoitteiden saavuttamiseksi.
Tässä tutkielmassa selvitetään sopiiko huonekohtainen lämpötilanmittausdata aikasarjoina poikkeavien huoneiden tunnistamiseen. Mittausdata huonelämpötiloista yhdistetään Ilmatieteenlaitoksen säädataan. Työn tavoitteena on alustavasti selvittää kyseisenkaltaisen datan sopivuutta poikkeamien tunnistamiseen. Työssä tutkitaan kolmea eri rakennusta esimerkkeinä.
Työssä kokeillaan kolmea valvomatonta menetelmää poikkeavien huoneiden tunnistamiseen. Kaksi ensimmäistä ovat muuttujien jakaumaan perustava tyhmä luokkittelija ja one-class support vector machine (OCSVM) -niminen koneoppimismenetelmä, joka nimenomaisesti on alunperin suunniteltu tunnistamaan poikkeamia datasta. Molemmat näistä menetelmistä soveltuvat pistemäisten poikkeamien tunnistamiseen. Kolmas tutkittu mentelmä oli k-means -klusteroija, joka, tässä työssä, käsittelee aikasarjoja kokonaisena lajitellen ne.
Kaikilla kolmella testatulla menetelmällä oli mahdollista tunnistaa poikkeavia huoneita. Koska tämä tutkimus oli alustava ja menetelmät valvomattomia, tarkempi analyysi ja menetelmien tulosten varmistaminen jää seuraaviin tutkimushankkeisiin. Kun kahta ensimmäistä menetelmää vertaillaan, jakaumiin perustuva mentelmä oli parempi, varsinkin kun OCSVM oli laskennallisesti huomattavasti raskaampi. K-means -klusteroija vaikutti erittäin lupaavalta ja sen avulla pystyi tunnistamaan kokonaisia huoneryhmiä, jotka poikkesivat rakennuksen keskiarvosta.
This work focuses on identifying possible anomalies (i.e. rooms that behave different to other rooms in the building) by using room temperature data time series. The room temperature data is combined with weather data obtained from FMI. The aim of the work is to preliminary examine the possibility to use the data for anomaly detection. Three different Case buildings are studied.
Three different unsupervised methods are tested. The first two are one based on variable distributions and a second one called one class support vector machine (OCSVM), which is a machine-learning method intended especially for anomaly detection. Both of these methods target point anomalies. The third method, k-means clustering, is treating the time series as a whole and categorised the rooms based on the complete series.
With all three tested methods it was possible to identify rooms or clusters of rooms which could be labeled as anomalies. The more detailed analysis and verifying the accuracy of the methods is left for future work, as the target of this project was to preliminarily assess the possibilities provided by the data. When the first two methods are compared, the simple variable distribution based method seemed more promising. Especially, as the OCSVM was computationally rather expensive in comparison. K-means clustering seemed quite promising, as with it several differently behaving clusters could be identified.
Tässä tutkielmassa selvitetään sopiiko huonekohtainen lämpötilanmittausdata aikasarjoina poikkeavien huoneiden tunnistamiseen. Mittausdata huonelämpötiloista yhdistetään Ilmatieteenlaitoksen säädataan. Työn tavoitteena on alustavasti selvittää kyseisenkaltaisen datan sopivuutta poikkeamien tunnistamiseen. Työssä tutkitaan kolmea eri rakennusta esimerkkeinä.
Työssä kokeillaan kolmea valvomatonta menetelmää poikkeavien huoneiden tunnistamiseen. Kaksi ensimmäistä ovat muuttujien jakaumaan perustava tyhmä luokkittelija ja one-class support vector machine (OCSVM) -niminen koneoppimismenetelmä, joka nimenomaisesti on alunperin suunniteltu tunnistamaan poikkeamia datasta. Molemmat näistä menetelmistä soveltuvat pistemäisten poikkeamien tunnistamiseen. Kolmas tutkittu mentelmä oli k-means -klusteroija, joka, tässä työssä, käsittelee aikasarjoja kokonaisena lajitellen ne.
Kaikilla kolmella testatulla menetelmällä oli mahdollista tunnistaa poikkeavia huoneita. Koska tämä tutkimus oli alustava ja menetelmät valvomattomia, tarkempi analyysi ja menetelmien tulosten varmistaminen jää seuraaviin tutkimushankkeisiin. Kun kahta ensimmäistä menetelmää vertaillaan, jakaumiin perustuva mentelmä oli parempi, varsinkin kun OCSVM oli laskennallisesti huomattavasti raskaampi. K-means -klusteroija vaikutti erittäin lupaavalta ja sen avulla pystyi tunnistamaan kokonaisia huoneryhmiä, jotka poikkesivat rakennuksen keskiarvosta.