Improving demand forecasting through opportunity prediction : lead classification in the electric manufacturing industry
Hynninen, Santeri (2025)
Diplomityö
Hynninen, Santeri
2025
School of Engineering Science, Tuotantotalous
Kaikki oikeudet pidätetään.
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi-fe2025062775166
https://urn.fi/URN:NBN:fi-fe2025062775166
Tiivistelmä
Both academics and practitioners have long acknowledged the significance of demand forecasting in manufacturing. The tools for time-series-based demand forecasting have also made significant advances in recent years, driven by significant improvements in machine learning and data mining. On the other hand, both old statistical models and new, more complex machine learning models require substantial amounts of historical data to capture demand patterns. Thus, recent advances often cannot be directly applied to new, rapidly growing, and opportunistic industries.
The purpose of this research is to explore whether classifying these opportunities from the sales pipeline using machine learning can bring added value to the demand forecasting process in the electrical manufacturing industry. The research followed the design-science research framework, consisting of two main parts: a literature review and empirical research. In the literature review, academics' perspectives on demand forecasting and lead classification were explored. In the empirical part, the knowledge from the literature review and business was applied to build, test, and evaluate a framework for demand forecasting.
As an outcome of the study, we presented a forecasting framework that enables case companies to classify a significant portion of their leads using machine learning and guide where judgmental resources should be utilized. In the research, five machine learning models suggested by academics were tested, achieving an accuracy of 78% without notable bias. A key challenge identified was the enormous inequality in opportunities, resulting in varied risk profiles and a lack of holistic data, particularly behavioral interaction data. Kysynnänennustamisen merkitys valmistavalle teollisuudelle on jo pitkään tunnistettu sekä tutkijoiden että ammatinharjoittajien keskuudessa. Aikasarjapohjaisen kysynnän ennustamisen työkalut ovat myös ottaneet valtavia harppauksia viime vuosina koneoppimisen ja tiedon louhinnan kehittyessä. Toisaalta sekä vanhat tilastolliset mallit että uudet monimutkaisemmat koneoppimismallit vaativat huomattavan määrän historia dataa kysynnän rakenteen oppimiseen. Näin ollen alan viimeaikaisimpia edistysaskeleita ei voida soveltaa toimialoilla, jotka ovat uusia, nopeasti kasvavia ja luonteeltaan opportunistia.
Tämän tutkimuksen tarkoituksena on selvittää, voisiko uusien mahdollisuuksien luokittelu myyntiputkesta koneoppimiseen pohjautuvilla malleilla tuoda lisäarvoa sähköteollisuuden kysynnänennustamiseen. Tutkimus seurasi suunnittelutieteen menetelmiä jakautuen kirjallisuuskatsaukseen ja empiiriseen osaan. Kirjallisuuskatsauksessa selvitettiin, miten kysynnänennustamista ja mahdollisuuksien arviointia on lähestytty tieteellisessä kontekstissa. Empiirisessä osassa sovellettiin kirjallisuuskatsauksesta ja liiketoiminnasta saatua tietoa yhdessä ennustusmallin kehityksessä ja arvioinnissa.
Lopputuloksena esiteltiin ennustamisviitekehys, jonka avulla case-yritys voi luokitella suurimman osan liideistään koneoppimismallin avulla ja kohdistaa inhimilliset resurssit mahdollisimman tehokkaasti. Yhteensä viittä eri kirjallisuuden ehdottamaa mallia testattiin, saavuttaen parhaimmillaan 78 %:n tarkkuuden ilman merkittävää vinoutumaa. Haasteina tutkimuksessa tunnistettiin suuren epätasa-arvon mahdollisuuksien vaikutusten välillä, mikä johti mahdollisuuksien välillä vaihtelevaan riskiprofiiliin, ja dynaamisen sekä erityisesti asiakaskäyttäytymiseen liittyvän datan puutumisen.
The purpose of this research is to explore whether classifying these opportunities from the sales pipeline using machine learning can bring added value to the demand forecasting process in the electrical manufacturing industry. The research followed the design-science research framework, consisting of two main parts: a literature review and empirical research. In the literature review, academics' perspectives on demand forecasting and lead classification were explored. In the empirical part, the knowledge from the literature review and business was applied to build, test, and evaluate a framework for demand forecasting.
As an outcome of the study, we presented a forecasting framework that enables case companies to classify a significant portion of their leads using machine learning and guide where judgmental resources should be utilized. In the research, five machine learning models suggested by academics were tested, achieving an accuracy of 78% without notable bias. A key challenge identified was the enormous inequality in opportunities, resulting in varied risk profiles and a lack of holistic data, particularly behavioral interaction data.
Tämän tutkimuksen tarkoituksena on selvittää, voisiko uusien mahdollisuuksien luokittelu myyntiputkesta koneoppimiseen pohjautuvilla malleilla tuoda lisäarvoa sähköteollisuuden kysynnänennustamiseen. Tutkimus seurasi suunnittelutieteen menetelmiä jakautuen kirjallisuuskatsaukseen ja empiiriseen osaan. Kirjallisuuskatsauksessa selvitettiin, miten kysynnänennustamista ja mahdollisuuksien arviointia on lähestytty tieteellisessä kontekstissa. Empiirisessä osassa sovellettiin kirjallisuuskatsauksesta ja liiketoiminnasta saatua tietoa yhdessä ennustusmallin kehityksessä ja arvioinnissa.
Lopputuloksena esiteltiin ennustamisviitekehys, jonka avulla case-yritys voi luokitella suurimman osan liideistään koneoppimismallin avulla ja kohdistaa inhimilliset resurssit mahdollisimman tehokkaasti. Yhteensä viittä eri kirjallisuuden ehdottamaa mallia testattiin, saavuttaen parhaimmillaan 78 %:n tarkkuuden ilman merkittävää vinoutumaa. Haasteina tutkimuksessa tunnistettiin suuren epätasa-arvon mahdollisuuksien vaikutusten välillä, mikä johti mahdollisuuksien välillä vaihtelevaan riskiprofiiliin, ja dynaamisen sekä erityisesti asiakaskäyttäytymiseen liittyvän datan puutumisen.