Computational methods for annotation of metabolites in untargeted LC-MS analysis
Lihtamo, Atte (2023)
Kandidaatintyö
Lihtamo, Atte
2023
School of Engineering Science, Laskennallinen tekniikka
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi-fe2023050541461
https://urn.fi/URN:NBN:fi-fe2023050541461
Tiivistelmä
Metabolomics has become a viable approach to elucidate alterations in the small-molecule chemicals of various biological samples under changing environmental conditions, as well as to assess difference in nutritional values between processed and unprocessed foods, just to name a few. With the recent development of computational methods, there is a great potential for advancing this field. This thesis, conducted on behalf of Afekta Technologies Ltd, aims to investigate the applicability of existing computational techniques in Afekta’s workflow, rather than to develop a novel approach. Specifically, two tools, namely Met- Frag and Sirius, were evaluated using Afekta’s in-house data set. While MetFrag exhib- ited limited accuracy in predicting test data, Sirius demonstrated promising performance and could potentially streamline the annotation of metabolites. It is worth mentioning that despite the progress in this area, achieving a fully automated annotation process remains a challenging task. The development of complex machine learning methods would be necessary to achieve this goal. Metabolomiikan avulla voidaan selvittää esimerkiksi millaisia muutoksia minkä tahansa orgaanisen aineen aineenvaihdunnassa havaitaan ympäristön vaihdellessa, tai selvittää tarkemmin ruoka-aineiden terveellisyyteen liittyviä ominaisuuksia sekä eroja esimerkiksi prosessoidussa ja prosessoimattomassa ruoassa. Tämä kandidaatintyö on tehty Afekta Technologies Oy:lle. Työssä käydään läpi metaboliittien tunnistuksessa käytettävien las- kennallisten menetelmien nykytilanne ja testataan voiko niitä käyttää helpottamaan asian- tuntijan manuaalista tunnistustyötä. Työssä ei kehitetä uutta työkalua metaboliittien tun- nistukseen. Testattavaksi päätyi kaksi työkalua, MetFrag ja Sirius, joita testattiin Afektan datan avulla. MetFrag ei kyennyt tekemään tarpeeksi luotettavia tunnistuksia testidatasta, kun taas Siriuksen tunnistuskyky vaikuttaa lupaavalta ja siitä olisi hyötyä tunnistuspros- essin apuna. Huolimatta viime vuosien aikana tapahtuneesta edistyksestä alalla, täysin automatisoituun ratkaisuun ei ole vielä olemassa sopivaa työkalua. Tällaisen menetelmän kehittäminen vaatisi monimutkaisia koneoppimismalleja.
