Evaluating Nvidia Jetson Nano 2GB for CNN image classification
Laurén, Niko (2025)
Kandidaatintyö
Laurén, Niko
2025
School of Energy Systems, Sähkötekniikka
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi-fe2025060358202
https://urn.fi/URN:NBN:fi-fe2025060358202
Tiivistelmä
This thesis focuses on evaluating the capabilities of the Nvidia Jetson Nano 2GB Developer Kit for image classification tasks using Convolutional Neural Network (CNN) models. In this study, the classification accuracy of pretrained CNN models is assessed. The study also focuses on comparing the performance of the pretrained ResNet-18 model with a retrained model on the Jetson Nano platform.
Two datasets are used to retrain the ResNet-18 model: a new custom dataset consisting of images of coffee mugs and the Cats & Dogs dataset provided by Nvidia. The impact of dataset size and diversity on classification accuracy was also investigated.
The evaluation consists of measuring the accuracies of each pretrained model for different classes with images provided by Nvidia as well as the images collected from the internet. Unexpected results arose during retraining the ResNet-18 with limited datasets, including a decrease in classification accuracy for cats. The CNN models seem to perform much better with input images that resemble those in the training datasets. The results of retraining indicate that the dataset characteristics, such as size and diversity of images significantly affect model performance, at least on the Jetson Nano. Tämä opinnäytetyö keskittyy Nvidia Jetson Nano 2GB Developer Kitin suorituskyvyn arviointiin kuvien luokittelutehtävissä CNN-malleja käyttäen. Tässä tutkimuksessa arvioidaan esikoulutettujen CNN-mallien luokittelutarkkuutta. Tutkimus keskittyy myös esikoulutetun ResNet-18 -mallin suorituskyvyn vertaamiseen Jetson Nano -alustalla uudelleen koulutettuun mallin kanssa.
ResNet-18-mallin uudelleenkouluttamiseen käytetään kahta tietoaineistoa: uutta, räätälöityä kahvimukeista koostuvaa tietoaineistoa, sekä Cats & Dogs -tietoaineistoa, jonka Nvidia tarjoaa. Työssä tutkittiin myös tietoaineiston laajuuden ja monimuotoisuuden vaikutusta luokittelun tarkkuuteen.
Arviointi koostuu kunkin esikoulutetun mallin tarkkuuden mittaamisesta eri luokilla sekä Nvidian tarjoamilla kuvilla että internetistä kerätyillä kuvilla. Odottamattomia tuloksia syntyi ResNet-18 -mallin uudelleenkoulutuksen aikana rajoitetuilla tietoaineistoilla, mukaan lukien kissojen luokittelutarkkuuden heikkeneminen. CNNmallit näyttävät toimivan paljon paremmin kuvilla, jotka muistuttavat koulutustietoaineistossa olevia kuvia. Uudelleenkoulutuksen tulokset osoittavat, että tietoaineiston ominaisuudet, kuten kuvien koko ja monimuotoisuus, vaikuttavat merkittävästi mallien suorituskykyyn, ainakin Jetson Nanolla.
Two datasets are used to retrain the ResNet-18 model: a new custom dataset consisting of images of coffee mugs and the Cats & Dogs dataset provided by Nvidia. The impact of dataset size and diversity on classification accuracy was also investigated.
The evaluation consists of measuring the accuracies of each pretrained model for different classes with images provided by Nvidia as well as the images collected from the internet. Unexpected results arose during retraining the ResNet-18 with limited datasets, including a decrease in classification accuracy for cats. The CNN models seem to perform much better with input images that resemble those in the training datasets. The results of retraining indicate that the dataset characteristics, such as size and diversity of images significantly affect model performance, at least on the Jetson Nano.
ResNet-18-mallin uudelleenkouluttamiseen käytetään kahta tietoaineistoa: uutta, räätälöityä kahvimukeista koostuvaa tietoaineistoa, sekä Cats & Dogs -tietoaineistoa, jonka Nvidia tarjoaa. Työssä tutkittiin myös tietoaineiston laajuuden ja monimuotoisuuden vaikutusta luokittelun tarkkuuteen.
Arviointi koostuu kunkin esikoulutetun mallin tarkkuuden mittaamisesta eri luokilla sekä Nvidian tarjoamilla kuvilla että internetistä kerätyillä kuvilla. Odottamattomia tuloksia syntyi ResNet-18 -mallin uudelleenkoulutuksen aikana rajoitetuilla tietoaineistoilla, mukaan lukien kissojen luokittelutarkkuuden heikkeneminen. CNNmallit näyttävät toimivan paljon paremmin kuvilla, jotka muistuttavat koulutustietoaineistossa olevia kuvia. Uudelleenkoulutuksen tulokset osoittavat, että tietoaineiston ominaisuudet, kuten kuvien koko ja monimuotoisuus, vaikuttavat merkittävästi mallien suorituskykyyn, ainakin Jetson Nanolla.