Analysing electricity consumption data by fast search and find of density peaks
Koponen, Juho-Pekka (2017)
Kandidaatintyö
Koponen, Juho-Pekka
2017
School of Engineering Science, Laskennallinen tekniikka
Kaikki oikeudet pidätetään.
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi-fe2018062026233
https://urn.fi/URN:NBN:fi-fe2018062026233
Tiivistelmä
The aim of this thesis is to compare a clustering method called Clustering by fast search and find of density peaks (CFSFDP) (Rodriguez et al. 2014) to two traditional clustering methods in analysis electricity consumption. These traditional methods are k-means and Density-based clustering of applications with noise (DBSCAN). The profiles of the typical days can be described as cluster centroids. The methods were compared by the easiness of the selection of parameter values and the qualities of the resulting clusters.
Based on the comparison, it was more difficult to select the parameter values with CFSFDP than with the other methods with the used dataset. The resulting clusters of CFSFDP were more spread out than those of the other methods. Between k-means and DBSCAN the results were highly similar. Tämän kandidaatintyön tavoitteena on vertailla Klusterointia nopean haun ja tiheyshuippujen avulla (CFSFDP) (Rodriguez et al. 2014) kahteen perinteiseen klusterointimenetelmään sähkönkulutuksen analysoinnissa. Perinteiset menetelmät, joihin CFSFDP:tä verrataan, ovat k:n keskiarvon klusterointimentelmä ja DBSCAN. Tyypillisten päivien kuormitusprofiileja voidaan kuvata klustereiden keskipisteinä. Menetelmiä vertailtiin parametriarvojen valitsemisen helppoudella sekä tuloksena saatujen klustereiden ominaisuuksilla.
Kyseisen datan kanssa CFSFDP:tä käytettäessä oli vaikeampi valita parametriarvot kuin muilla menetelmillä. Tuloksena olevat klusterit olivat levittyneempiä CFSFDP:llä kuin muilla menetelmillä. Tulokset olivat hyvin samanlaisia k:n keskiarvon ja DBSCAN:n välillä.
Based on the comparison, it was more difficult to select the parameter values with CFSFDP than with the other methods with the used dataset. The resulting clusters of CFSFDP were more spread out than those of the other methods. Between k-means and DBSCAN the results were highly similar.
Kyseisen datan kanssa CFSFDP:tä käytettäessä oli vaikeampi valita parametriarvot kuin muilla menetelmillä. Tuloksena olevat klusterit olivat levittyneempiä CFSFDP:llä kuin muilla menetelmillä. Tulokset olivat hyvin samanlaisia k:n keskiarvon ja DBSCAN:n välillä.