Puhujantunnistus konvoluutioneuroverkolla hyödyntäen reunalaskentaa
Karonen, Alex (2023)
Kandidaatintyö
Karonen, Alex
2023
School of Engineering Science, Laskennallinen tekniikka
Kaikki oikeudet pidätetään.
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi-fe2023061354419
https://urn.fi/URN:NBN:fi-fe2023061354419
Tiivistelmä
Tässä kandidaatintyössä pyrittiin toteuttamaan puhujantunnistava konvoluutioneuroverkko ohjelmoitavalla porttipiirillä (FPGA). Työssä käytettiin Mozilla Common Voice -projektin suomenkielistä puheaineistoa. Aineisto muunnettiin konvoluutioneuroverkolle sopivaksi mel-taajuuskerroin-spektrogrammiksi. Neuroverkko pyrittiin muuntamaan Pynq-Z2 -kehitysalustalle ajettavaan muotoon käyttäen hls4ml-kirjastoa mutta alustan resurssit eivät riittäneet tähän. Sen sijaan tutkittiin erikokoisten neuroverkkojen resurssivaatimuksia FPGA-toteutuksena ja verrattiin teoreettisia luokittelutarkkuuksia hls4ml:n simulointia hyödyntäen.
Työssä luodut neuroverkot olivat luokittelutarkkuuden perusteelala varteenotettavia käytännön sovelluksiin. Konvoluutioneuroverkot yleisesti vaativat paljon laskentaresursseja ja FPGA-alustoilla nämä resurssit ovat rajalliset. Tästä syystä toteutetut neuroverkot pyrittiin pitämään mahdollisimman pieninä kuitenkin tavoitellen järkeviä luokittelutarkkuuksia. Mikään toteutetuista malleista ei vastannut Pynq-Z2:n resursseja synteesiraporttien pohjalta. Työn mallien resurssivaatimusarviot vastaavat ennestään tuotettuja tuloksia vaikka estimaatit eivät ole suoraan vertailukelpoisia jo olemassa olevien tulosten kanssa.
Työssä luodut neuroverkot olivat luokittelutarkkuuden perusteelala varteenotettavia käytännön sovelluksiin. Konvoluutioneuroverkot yleisesti vaativat paljon laskentaresursseja ja FPGA-alustoilla nämä resurssit ovat rajalliset. Tästä syystä toteutetut neuroverkot pyrittiin pitämään mahdollisimman pieninä kuitenkin tavoitellen järkeviä luokittelutarkkuuksia. Mikään toteutetuista malleista ei vastannut Pynq-Z2:n resursseja synteesiraporttien pohjalta. Työn mallien resurssivaatimusarviot vastaavat ennestään tuotettuja tuloksia vaikka estimaatit eivät ole suoraan vertailukelpoisia jo olemassa olevien tulosten kanssa.
