Tietokantajärjestelmien optimointitekniikoiden testaus ja vertailu
Wahlsten, Jeremias (2025)
Kandidaatintyö
Wahlsten, Jeremias
2025
School of Engineering Science, Tietotekniikka
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi-fe20251229125528
https://urn.fi/URN:NBN:fi-fe20251229125528
Tiivistelmä
Datakeskusten määrän kasvu sekä tiedon jatkuva lisääntyminen ovat nostaneet tietokantojen ja tietokantajärjestelmien merkityksen keskeiseksi osaksi nykyaikaisia tietojärjestelmiä. Lähes kaikki digitaaliset palvelut perustuvat tehokkaaseen tiedon tallennukseen, hakuun ja käsittelyyn, ja näille toiminnoille asetetut suorituskykyvaatimukset ovat erittäin korkeita. Tämän vuoksi tietokantojen optimointi on keskeisessä roolissa myös energiatehokkuuden ja kestävän tietojenkäsittelyn kannalta.
Tietokantajärjestelmien optimointiin on olemassa useita erilaisia tekniikoita, kuten indeksointi, denormalisointi, kyselyoptimointi, välimuistin käyttö ja datan lohkominen. Tämä kandidaatintyö pyrkii osaltaan paikkaamaan tätä tutkimusaukkoa tarkastelemalla optimointitekniikoiden vaikutusta tiedonhakukyselyiden suorituskykyyn systemaattisen kokeellisen testauksen avulla.
Työssä testattiin kahden yleisesti käytetyn optimointitekniikan, indeksoinnin ja denormalisoinnin, vaikutuksia useissa eri tietokantajärjestelmissä. Mukana oli sekä relaatio- että ei-relaatiotietokantoja, jotta optimointien vaikutuksia voitiin arvioida erilaisissa tietokanta-arkkitehtuureissa. Empiirisessä osuudessa käytettiin todellista ja laajaa aineistoa, joka perustui Kelan julkaisemiin opintotukitietoihin. Sama data ja rakenteeltaan vastaavat kyselyt ajettiin jokaisessa tietokantajärjestelmässä ilman optimointeja, indeksien kanssa sekä indeksien ja denormalisoitujen tietorakenteiden yhdistelmällä. Suorituskykyä mitattiin kyselyiden vasteaikojen avulla useiden toistojen perusteella.
Tutkimuksen tulokset osoittavat, että optimointitekniikoilla on erittäin merkittävä vaikutus tietokantakyselyiden suorituskykyyn. Indeksointi paransi useimmissa tapauksissa erityisesti suodattavien ja rajattujen kyselyiden nopeutta, vaikka väärin valitut indeksit saattoivat joissakin tilanteissa heikentää suorituskykyä. Kun indeksointi ja denormalisointi yhdistettiin, kyselyiden vasteajat lyhenivät monissa tapauksissa murto-osaan alkuperäisestä. The growth in the number of data centers and the continuous increase in data volumes have elevated the importance of databases and database management systems to a central role in modern information systems. Nearly all digital services rely on efficient data storage, retrieval, and processing, and the performance requirements for these operations are extremely high. For this reason, database optimization is also a key factor in terms of energy efficiency and sustainable computing.
There are several different techniques available for optimizing database systems, such as indexing, denormalization, query optimization, caching, and data partitioning. This bachelor’s thesis aims to help address this research gap by examining the impact of optimization techniques on the performance of data retrieval queries through systematic experimental testing.
The study evaluates the effects of two commonly used optimization techniques—indexing and denormalization—across multiple database management systems. Both relational and non-relational databases are included in order to assess the impact of these optimizations in different database architectures. The empirical part of the study uses a real and large-scale dataset based on student financial aid data published by Kela. The same dataset and structurally equivalent queries were executed in each database system without optimizations, with indexing enabled, and with a combination of indexing and denormalized data structures. Performance was measured using query response times over multiple repetitions.
The results show that optimization techniques have a highly significant impact on database query performance. Indexing improved the speed of filtering and constrained queries in most cases, although poorly chosen indexes could in some situations degrade performance. When indexing and denormalization were combined, query response times were in many cases reduced to a fraction of their original values.
Tietokantajärjestelmien optimointiin on olemassa useita erilaisia tekniikoita, kuten indeksointi, denormalisointi, kyselyoptimointi, välimuistin käyttö ja datan lohkominen. Tämä kandidaatintyö pyrkii osaltaan paikkaamaan tätä tutkimusaukkoa tarkastelemalla optimointitekniikoiden vaikutusta tiedonhakukyselyiden suorituskykyyn systemaattisen kokeellisen testauksen avulla.
Työssä testattiin kahden yleisesti käytetyn optimointitekniikan, indeksoinnin ja denormalisoinnin, vaikutuksia useissa eri tietokantajärjestelmissä. Mukana oli sekä relaatio- että ei-relaatiotietokantoja, jotta optimointien vaikutuksia voitiin arvioida erilaisissa tietokanta-arkkitehtuureissa. Empiirisessä osuudessa käytettiin todellista ja laajaa aineistoa, joka perustui Kelan julkaisemiin opintotukitietoihin. Sama data ja rakenteeltaan vastaavat kyselyt ajettiin jokaisessa tietokantajärjestelmässä ilman optimointeja, indeksien kanssa sekä indeksien ja denormalisoitujen tietorakenteiden yhdistelmällä. Suorituskykyä mitattiin kyselyiden vasteaikojen avulla useiden toistojen perusteella.
Tutkimuksen tulokset osoittavat, että optimointitekniikoilla on erittäin merkittävä vaikutus tietokantakyselyiden suorituskykyyn. Indeksointi paransi useimmissa tapauksissa erityisesti suodattavien ja rajattujen kyselyiden nopeutta, vaikka väärin valitut indeksit saattoivat joissakin tilanteissa heikentää suorituskykyä. Kun indeksointi ja denormalisointi yhdistettiin, kyselyiden vasteajat lyhenivät monissa tapauksissa murto-osaan alkuperäisestä.
There are several different techniques available for optimizing database systems, such as indexing, denormalization, query optimization, caching, and data partitioning. This bachelor’s thesis aims to help address this research gap by examining the impact of optimization techniques on the performance of data retrieval queries through systematic experimental testing.
The study evaluates the effects of two commonly used optimization techniques—indexing and denormalization—across multiple database management systems. Both relational and non-relational databases are included in order to assess the impact of these optimizations in different database architectures. The empirical part of the study uses a real and large-scale dataset based on student financial aid data published by Kela. The same dataset and structurally equivalent queries were executed in each database system without optimizations, with indexing enabled, and with a combination of indexing and denormalized data structures. Performance was measured using query response times over multiple repetitions.
The results show that optimization techniques have a highly significant impact on database query performance. Indexing improved the speed of filtering and constrained queries in most cases, although poorly chosen indexes could in some situations degrade performance. When indexing and denormalization were combined, query response times were in many cases reduced to a fraction of their original values.
Kokoelmat
Samankaltainen aineisto
Näytetään aineisto, joilla on samankaltaisia nimekkeitä, tekijöitä tai asiasanoja.
-
Provenance structure in citizen science databases
Tiufiakov, Nikita (2018)Today, more and more scientific groups are developing application for their purposes. Citizen science is relatively new domain of science that has already proved that it may be as beneficial as classical science. One of ... -
Hiontarobotti-solun tietojärjestelmä
Soikkeli, Kimmo (2010)Hiontarobotteja käytetään nopeuttamaan hiontaprosessia ja vähentämään henkilöiden tarvetta tehdä kuluttavaa ja raskasta työtä. Yleensä hiottavat kappaleet ovat suuria, jolloin hionta robotillakin kestää kauan. Kun hiottavat ... -
Raportointitietokannan suorituskyvyn parantaminen
Salomäki, Toni (2006)Tietokoneiden tallennuskapasiteetin ja sekä tietokoneiden että verkkojen nopeuden kasvaessa myös käyttäjien odotukset kasvavat. Tietoa talletetaan yhä enemmän ja näistä tiedoista laaditaan yhä monimutkaisempia raportteja. ...

