Eleentunnistusmallin hajautettu koulutus tietokoneklusterissa
El-Khoury, Margeritta (2023)
Kandidaatintyö
El-Khoury, Margeritta
2023
School of Engineering Science, Laskennallinen tekniikka
Kaikki oikeudet pidätetään.
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi-fe2023061454755
https://urn.fi/URN:NBN:fi-fe2023061454755
Tiivistelmä
Eleentunnistus mahdollistaa eleiden hyödyntämisen esimerkiksi luontevampien käyttöliittymien toteutuksessa. Koneoppimista hyödyntävät eleentunnistussovellukset, kuten suorituskykyiset koneoppimissovellukset yleisesti, vaativat runsaasti koulutusdataa ja -aikaa. Tämän työn tavoitteena on koneoppimisen nopeuttaminen hajauttamalla ristiinvalidointi neljästä korttitietokoneesta koostuvalle klusterille. Klusterilla koulutetaan eleentunnistusmalli, joka tunnistaa käsin ilmaan piirrettyjä numeroita. Hajautettu koneoppiminen toteutettiin käyttämällä k-kertaista ristiinvalidointia, joka mahdollistaa koulutusprosessin jaon moneen samaan aikaan suoritettavaan osaan ja koulutettujen mallien tarkkuuden arvioinnin.
Kouluttavien suoritinytimien lisäämisen vaikutusta tutkittiin viiden kokeen kautta, joissa koulutettiin 10-kertaisen ristiinvalidoinnin mukaisesti kymmenen mallia eri määrillä kouluttavia tietokoneita ja suoritinytimiä. Eniten kouluttavia ytimiä hyödyntänyt koe saavutti parhaan kokonaisajan, mutta yksittäinen malli koulutettiin nopeiten kokeessa, jossa käytettiin vähiten ytimiä tietokonetta kohden. Ylioppimista havaittiin neljässä mallissa, jotka koulutettiin samalla datan osajoukolla. Tulosten perusteella kouluttavien ydinten määrää lisäämällä voidaan pienentää koulutuksen kokonaisaikaa ja yksittäisen mallin koulutusta voidaan nopeuttaa vähentämällä tietokoneen kuormitusta.
Kouluttavien suoritinytimien lisäämisen vaikutusta tutkittiin viiden kokeen kautta, joissa koulutettiin 10-kertaisen ristiinvalidoinnin mukaisesti kymmenen mallia eri määrillä kouluttavia tietokoneita ja suoritinytimiä. Eniten kouluttavia ytimiä hyödyntänyt koe saavutti parhaan kokonaisajan, mutta yksittäinen malli koulutettiin nopeiten kokeessa, jossa käytettiin vähiten ytimiä tietokonetta kohden. Ylioppimista havaittiin neljässä mallissa, jotka koulutettiin samalla datan osajoukolla. Tulosten perusteella kouluttavien ydinten määrää lisäämällä voidaan pienentää koulutuksen kokonaisaikaa ja yksittäisen mallin koulutusta voidaan nopeuttaa vähentämällä tietokoneen kuormitusta.
