Detecting factors affecting contract terminations in the electricity distribution system
Karhunen, Markku (2022)
Diplomityö
Karhunen, Markku
2022
School of Engineering Science, Laskennallinen tekniikka
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi-fe2022032425093
https://urn.fi/URN:NBN:fi-fe2022032425093
Tiivistelmä
Distribution system contract terminations are a factor of economic interest in the electricity market, as they affect the willingness of the distribution system operators (DSOs) to invest in the improvement of the distribution grid, such as installation of underground cables. In this study, statistical and machine learning methods were employed to study factors affecting the distribution system contract terminations. To this end, a data set obtained from four DSOs was used. Each contract was geolocated and combined with data obtained from government authorities regarding the socioeconomic situation in the area. The final data set involved 434 terminated contracts, 41,104 non-terminated contracts and 99 variables. Subsequently, regression analysis was used to study the effects of different covariates. Multivariate model choice was performed and two machine learning models were trained to predict the termination status. It was found that positive net migration and high local income level decreased the risk of contract terminations, whereas high values of the age of the contract holder, distance to a city and distance to a lake increased the risk. The models constructed in this study could not predict the termination status as a binary yes/no variable. However, it was possible to use the models to calculate risk scores for individual customers. For example, for a multivariate logit model, values as high as 1.9% were frequently observed (whereas the average risk was 1.0%). This may be compared to credit risk analysis where similar low risk scores of a few per cents are often encountered. Jakeluverkkosopimusten irtisanominen on taloudellisesti merkittävä ilmiö sähkömarkkinoilla, koska se vaikuttaa jakeluverkon haltijoiden haluun investoida verkon parantamiseen esim. asentamalla maakaapeleita. Tässä työssä tutkittiin näihin irtisanomisiin vaikuttavia tekijöitä tilastollisten ja koneoppimismenetelmien avulla. Työssä käytettiin neljältä eri jakeluverkkoyhtiöltä saatua aineistoa. Jokainen jakeluverkkosopimus kohdennettiin maantieteelliseen koordinaattijärjestelmään ja yhdistettiin viranomaisilta saatuun, alueen sosioekonomisia oloja koskevaan tilastoaineistoon. Lopullinen aineisto käsitti 434 irtisanottua sopimusta, 41 104 ei-irtisanottua sopimusta ja 99 muuttujaa. Regressioanalyysia käytettiin eri muuttujien vaikutuksen selvittämiseen. Työssä käytettiin monimuuttujamalleja ja kaksi koneoppimismallia opetettiin ennustamaan sopimusten irtisanomista. Havaittiin että muuttovoitto ja korkea paikallinen tulotaso vähensivät sopimusten irtisanomisen riskiä, kun taas sopimuksen haltijan korkea ikä, etäisyys maakuntakeskukseen ja etäisyys järven rantaan lisäsivät riskiä. Tässä työssä rakennetut mallit eivät pystyneet ennustamaan sopimusten irtisanomista binäärisenä kyllä/ei-muuttujana. Mallien avulla pystyttiin kuitenkin laskemaan asiakaskohtaisia risk scoreja. Esimerkiksi logit-monimuuttujamalli tuotti useille asiakkaille 1,9 % risk scoren (siinä missä keskimääräinen riski oli 1,0 %). Tätä voidaan verrata luottoriskianalyysiin, jossa myös usein esiintyy vastaavia matalia, parin prosentin risk scoreja.