Evaluating public cloud and private infrastructure for deploying generative AI in digital products
Sorri, Rasmus (2026)
Kandidaatintyö
Sorri, Rasmus
2026
School of Engineering Science, Tuotantotalous
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi-fe2026052856728
https://urn.fi/URN:NBN:fi-fe2026052856728
Tiivistelmä
This bachelor’s thesis examines the conditions under which public cloud, private infrastructure, or hybrid deployment models are strategically justified for generative AI inference in digital products. The aim of the thesis is to frame deployment model selection as a strategic issue and to compile an evaluation framework from sources that enables the comparison of alternatives in the context of digital products.
The research was conducted as a conceptual, literature-based analysis. The study first defined the key deployment models related to generative AI inference: public cloud, private infrastructure, and hybrid solutions. Subsequently, deployment model selection was examined through the lenses of the Resource-Based View and Transaction Cost Economics. Based on these, the analysis was structured into three key evaluation dimensions: economic scalability, operational performance, and strategic control.
The result of this work was a strategic evaluation framework that demonstrates that the justification for deployment model choice depends on how these three dimensions are weighted in the digital product under consideration. The public cloud is more justified when rapid deployment, flexible capacity, and low initial investment requirements are emphasized. Private infrastructure, on the other hand, is more justified when usage is high, continuous, and predictable, and when data management, operational predictability, and strong internal control are key. Hybrid solutions are most appropriate in situations where different AI features of the same product impose varying requirements on cost structure, performance, and control. Tässä kandidaatintyössä tarkastellaan, millä edellytyksillä julkinen pilvi, yksityinen infrastruktuuri tai hybridiratkaisu on strategisesti perusteltu toteutusmalli generatiivisen tekoälyn inferenssin järjestämiseksi digitaalisissa tuotteissa. Työn tavoitteena on jäsentää toteutusmallin valintaa strategisena kysymyksenä ja laatia lähteiden pohjalta arviointikehys, jonka avulla eri vaihtoehtoja voidaan vertailla digitaalisten tuotteiden kontekstissa.
Tutkimus toteutettiin käsitteellisenä kirjallisuuspohjaisena analyysinä. Tutkimuksessa määriteltiin ensin generatiivisen tekoälyn inferenssiin liittyvät keskeiset toteutusmallit: julkinen pilvi, yksityinen infrastruktuuri ja hybridiratkaisut. Tämän jälkeen toteutusmallin valintaa tarkasteltiin resurssipohjaisen näkemyksen (Resource-Based View) ja transaktiokustannustalouden (Transaction Cost Economics) näkökulmista. Näiden pohjalta analyysi jäsennettiin kolmeen keskeiseen arviointidimensioon: taloudellinen skaalautuvuus, operatiivinen suorituskyky ja strateginen kontrolli.
Tutkimuksen tuloksena muodostettiin strateginen arviointikehys, joka osoittaa, että toteutusmallin strateginen perusteltavuus riippuu siitä, miten nämä kolme ulottuvuutta painottuvat tarkasteltavassa digitaalisessa tuotteessa. Julkinen pilvi on perustellumpi valinta, kun painopiste on nopeassa käyttöönotossa, joustavassa kapasiteetissa ja alhaisissa alkuinvestointivaatimuksissa. Yksityinen infrastruktuuri on puolestaan perustellumpi valinta, kun käyttö on runsasta, jatkuvaa ja ennustettavaa ja kun tietojen hallinta, toiminnan ennustettavuus ja kontrolli ovat avainasemassa. Hybridiratkaisut ovat sopivimpia tilanteissa, joissa saman tuotteen eri tekoälyominaisuudet asettavat vaihtelevia vaatimuksia kustannusrakenteelle, suorituskyvylle ja hallinnalle.
The research was conducted as a conceptual, literature-based analysis. The study first defined the key deployment models related to generative AI inference: public cloud, private infrastructure, and hybrid solutions. Subsequently, deployment model selection was examined through the lenses of the Resource-Based View and Transaction Cost Economics. Based on these, the analysis was structured into three key evaluation dimensions: economic scalability, operational performance, and strategic control.
The result of this work was a strategic evaluation framework that demonstrates that the justification for deployment model choice depends on how these three dimensions are weighted in the digital product under consideration. The public cloud is more justified when rapid deployment, flexible capacity, and low initial investment requirements are emphasized. Private infrastructure, on the other hand, is more justified when usage is high, continuous, and predictable, and when data management, operational predictability, and strong internal control are key. Hybrid solutions are most appropriate in situations where different AI features of the same product impose varying requirements on cost structure, performance, and control.
Tutkimus toteutettiin käsitteellisenä kirjallisuuspohjaisena analyysinä. Tutkimuksessa määriteltiin ensin generatiivisen tekoälyn inferenssiin liittyvät keskeiset toteutusmallit: julkinen pilvi, yksityinen infrastruktuuri ja hybridiratkaisut. Tämän jälkeen toteutusmallin valintaa tarkasteltiin resurssipohjaisen näkemyksen (Resource-Based View) ja transaktiokustannustalouden (Transaction Cost Economics) näkökulmista. Näiden pohjalta analyysi jäsennettiin kolmeen keskeiseen arviointidimensioon: taloudellinen skaalautuvuus, operatiivinen suorituskyky ja strateginen kontrolli.
Tutkimuksen tuloksena muodostettiin strateginen arviointikehys, joka osoittaa, että toteutusmallin strateginen perusteltavuus riippuu siitä, miten nämä kolme ulottuvuutta painottuvat tarkasteltavassa digitaalisessa tuotteessa. Julkinen pilvi on perustellumpi valinta, kun painopiste on nopeassa käyttöönotossa, joustavassa kapasiteetissa ja alhaisissa alkuinvestointivaatimuksissa. Yksityinen infrastruktuuri on puolestaan perustellumpi valinta, kun käyttö on runsasta, jatkuvaa ja ennustettavaa ja kun tietojen hallinta, toiminnan ennustettavuus ja kontrolli ovat avainasemassa. Hybridiratkaisut ovat sopivimpia tilanteissa, joissa saman tuotteen eri tekoälyominaisuudet asettavat vaihtelevia vaatimuksia kustannusrakenteelle, suorituskyvylle ja hallinnalle.
