Material classification in the industry
Maljanen, Joonas (2023)
Diplomityö
Maljanen, Joonas
2023
School of Engineering Science, Laskennallinen tekniikka
Kaikki oikeudet pidätetään.
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi-fe2023052949121
https://urn.fi/URN:NBN:fi-fe2023052949121
Tiivistelmä
In the industry material classification and quality control are key challenges that require speed and accuracy. Automation of material classification using machine learning classifiers would provide a unified method that enables faster and more accurate classifications while reducing human errors. The focus of this study is to research industrial classification of material based on the material’s features. One of the most common classification approaches is to use spectrometer analysis where aborption, emission or scattering properties of the material are analyzed at different wavelengths using a spectrometer. The goal of this study is to develop a machine learning model for the case industry that can classify materials based on spectrometer analysis. For this study the case industry has provided a dataset of 30 000 material classications with 200 unique classes. To develop the model several pre-processing methods, data balancing methods and classification methods that have achieved good results were experimented. In the conducted experiments the best 95% validation accuracy was achieved with a model that used unscaled data, was balanced with Synthetic Minority Oversampling Technique (SMOTE) and was classified with the Random Forest (RF) classifier. Teollisuudessa materiaalien luokittelu ja laadunvalvonta ovat keskeisiä haasteita, joissa vaaditaan nopeutta ja tarkkuutta. Materiaalien luokittelun automatisointi koneoppivien luokittelijoiden avulla tarjoaisi yhtenäisen menetelmän, joka mahdollistaisi nopeamman ja tarkemman luokittelun samalla vähentäen inhimillisiä virheitä. Tässä tutkimuksessa perehdytään teollisuuden materiaalin luokitteluongelmiin, jossa pyritään luokittelemaan materiaaleja niiden ominaisuuksien perusteella. Luokittelutavoista yksi yleisimpiä tapoja on luokitella teollisia materiaaleja spektrometrianalyysilla, jossa spektroskoopilla mitataan materiaalin absorptio-, emissio- tai hajontaominaisuuksia eri aallonpituuksilla. Tutkimuksen tavoitteena on kehittää koneoppiva malli kohdeteollisuudelle, joka pystyy luokittelemaan materiaaleja spektrometrianalyysin perusteella. Kohdeteollisuus antoi tutkimuksen käyttöön 30 000 materiaalin luokittelun tietokannan, joka sisälsi 200 eri luokkaa. Mallin kehittämiseksi testattiin useita esikäsittelymenetelmiä, datan tasapainottamismenetelmiä ja luokittelumenetelmiä, jotka ovat saavuttaneet hyviä tuloksia aiemmissa tutkimuksissa. Suoritetuissa kokeissa parhaan 95 %:n validointitarkkuuden saavuttivat malli, joka käytti skaalaamatonta dataa, joka oli tasapainotettu SMOTE-menetelmällä ja luokiteltu RFluokittelijalla.
