Time series clustering by extracted features
Hildén, Felix (2019)
Kandidaatintyö
Hildén, Felix
2019
School of Engineering Science, Laskennallinen tekniikka
Kaikki oikeudet pidätetään.
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi-fe2019050314114
https://urn.fi/URN:NBN:fi-fe2019050314114
Tiivistelmä
Clustering electricity consumers can give insight into how a particular consumption profile is related to other attributes of the customer, for example the residence size or whether a sauna is in use or not. Furthermore, if the profiles are separated well enough, more accurate models predicting consumption could be built.
To cluster consumers, a set of static features were extracted from raw time series representing hourly energy consumption. These features were then clustered with a self-organising map. To visualise the results, background data detailing additional information on each consumer was used as categorical labels for each series.
The results were promising. A set of background data produced some separation on the map, which indicates that there are tangible differences to the hourly consumption data alone. Sähkönkuluttajien ryhmittely voi kertoa, miten tietty kulutusprofiili liittyy kuluttajan muihin ominaisuuksiin, esimerkiksi asunnon kokoon ja saunan käyttöön. Jos profiilit eroavat toisistaan tarpeeksi, tarkempia kulutuksen ennusteita voitaisiin tehdä ryhmien perusteella.
Ryhmittelyn suorittamiseksi tunnittaisen kulutuksen aikasarjoista laskettiin piirteitä, jotka ryhmiteltiin itseorganisoituvan kartan avulla. Tulosten näyttämiseksi kuhunkin kuluttajaan liitettyjä taustatietoja käytettiin ryhmien nimikkeinä.
Tulokset olivat lupaavia. Osa taustatiedoista erottui kartalla, mikä kertoo siitä, että pelkissä kulutuksen aikasarjoissa on todellisia eroja.
To cluster consumers, a set of static features were extracted from raw time series representing hourly energy consumption. These features were then clustered with a self-organising map. To visualise the results, background data detailing additional information on each consumer was used as categorical labels for each series.
The results were promising. A set of background data produced some separation on the map, which indicates that there are tangible differences to the hourly consumption data alone.
Ryhmittelyn suorittamiseksi tunnittaisen kulutuksen aikasarjoista laskettiin piirteitä, jotka ryhmiteltiin itseorganisoituvan kartan avulla. Tulosten näyttämiseksi kuhunkin kuluttajaan liitettyjä taustatietoja käytettiin ryhmien nimikkeinä.
Tulokset olivat lupaavia. Osa taustatiedoista erottui kartalla, mikä kertoo siitä, että pelkissä kulutuksen aikasarjoissa on todellisia eroja.