Machine learning in sourcing process automation : classification approach for identifying low-value purchases
Rouru, Silja (2023)
Katso/ Avaa
Sisältö avataan julkiseksi: 10.05.2025
Pro gradu -tutkielma
Rouru, Silja
2023
School of Business and Management, Kauppatieteet
Kaikki oikeudet pidätetään.
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi-fe2023050340458
https://urn.fi/URN:NBN:fi-fe2023050340458
Tiivistelmä
Streamlining and automating internal processes through data is an effective approach to steer business resources toward value-adding activities. The aim of this thesis is to construct a machine learning model for low-value purchase identification to enhance the case manufacturing company’s sourcing activities. The method chosen for modelling the low-value purchases is decision trees due to the methods’ efficiency and interpretability. Two decision trees are developed with a limited historical purchase data set of three years. The historical data set is limited to three years to overcome the challenges of adjusted data collection methods.
The first decision tree has three target classes, denoted as low-value, medium-value, and high-value. The second decision tree has two target classes, low-value, and high-value. Both decision trees are constructed with the same chosen independent variables to allow model comparison. The independent variables are chosen as predictors based on their Maximum Relevance - Minimum Redundancy (MRMR) scores. Error cost function is used to adjust prediction outcome for both decision trees separately. Models’ performance is measured with indicators obtained from confusion matrices. The results display that the model with three target classes outperforms the model with two target classes. Finally, the thesis provides recommendations for low-value purchase classification logic and emphasizes the importance of underlying data quality in the selected case company. The results are applied in the case company’s upcoming ERP system. Sisäisten prosessien tehostaminen ja virtaviivaistaminen datan avulla ovat tehokkaita tapoja ohjata yrityksen resursseja kohti enemmän arvoa tuottavia toimintoja. Tämä tutkielma on tehty tapaustutkimuksena valmistavassa teollisuudessa toimivalle yritykselle, joka suunnittelee parhaillaan toiminnan tehostamista hankintaosastollaan. Tutkielman tarkoituksena on rakentaa koneoppimisen malli matalan arvon tuotteiden tunnistamiseksi, jota voidaan käyttää prosessiautomaation keskiössä. Tutkielma käyttää päätöspuita matalan arvon tuotteiden mallinnuksen rakentamiseksi ja mallinnuksessa kaksi erillistä päätöspuuta rakennetaan rajoitetulla kolmen vuoden tietojoukolla.
Ensimmäinen malli rakennetaan kolmen- ja seuraava kahden luokan ennusteella. Mallin pohjalla käytetään kolmea tärkeintä muuttujaa, jotka on valittu niiden Maximum Relevance - Minimum Redundancy (MRMR) -arvojen perusteella. Virhefunktiota käytetään ennusteen tuloksen mukauttamiseen molemmille päätöspuille. Mallien suorituskykyä mitataan pääasiassa sekaannusmatriisista saaduilla mittareilla. Tulokset osoittavat, että kolmen ennustettavan luokan malli suoriutuu matalan arvon tuotteiden ennustamisesta paremmin kuin kahden kohdeluokan malli. Tutkielma antaa suosituksia matalan arvon tuotteiden luokittelulogiikkaan ja korostaa taustalla olevan tiedon laadun merkitystä. Tutkielmassa tehty luokittelumalli tulee käyttöön kohdeyrityksen uuteen toiminnanohjausjärjestelmään.
The first decision tree has three target classes, denoted as low-value, medium-value, and high-value. The second decision tree has two target classes, low-value, and high-value. Both decision trees are constructed with the same chosen independent variables to allow model comparison. The independent variables are chosen as predictors based on their Maximum Relevance - Minimum Redundancy (MRMR) scores. Error cost function is used to adjust prediction outcome for both decision trees separately. Models’ performance is measured with indicators obtained from confusion matrices. The results display that the model with three target classes outperforms the model with two target classes. Finally, the thesis provides recommendations for low-value purchase classification logic and emphasizes the importance of underlying data quality in the selected case company. The results are applied in the case company’s upcoming ERP system.
Ensimmäinen malli rakennetaan kolmen- ja seuraava kahden luokan ennusteella. Mallin pohjalla käytetään kolmea tärkeintä muuttujaa, jotka on valittu niiden Maximum Relevance - Minimum Redundancy (MRMR) -arvojen perusteella. Virhefunktiota käytetään ennusteen tuloksen mukauttamiseen molemmille päätöspuille. Mallien suorituskykyä mitataan pääasiassa sekaannusmatriisista saaduilla mittareilla. Tulokset osoittavat, että kolmen ennustettavan luokan malli suoriutuu matalan arvon tuotteiden ennustamisesta paremmin kuin kahden kohdeluokan malli. Tutkielma antaa suosituksia matalan arvon tuotteiden luokittelulogiikkaan ja korostaa taustalla olevan tiedon laadun merkitystä. Tutkielmassa tehty luokittelumalli tulee käyttöön kohdeyrityksen uuteen toiminnanohjausjärjestelmään.