Uusia menetelmiä suurten biolääketieteellisten aineistojen analysoimiseen (Väitös: VTM Maiju Pesonen, 24.11.2016, tilastotiede)
Kehittyneet mittausteknologiat mahdollistavat molekyylitason prosessien mittaamisen, jolloin useista vakavista sairauksista saadaan yhä tarkempaa tietoa. Maiju Pesonen kehitti Turun yliopistoon tekemässään väitöstutkimuksessa analyysimenetelmiä, jotka hyödyntävät sairauksista tarjolla olevan tiedon mahdollisimman tehokkaasti.
Turun yliopiston tiedote 16.11.2016
Uudet mittausteknologiat kykenevät tuottamaan valtavia tietomääriä yksittäisten geenien, proteiinien ja rasvojen ilmentymisestä ja pitoisuuksista kehossa ennennäkemättömällä tarkkuudella. Tarve uutta tietoa analysoiville menetelmille on kasvanut, jotta massiivisesta määrästä informaatiota saadaan louhituksi esiin olennainen.
– Tiedetään esimerkiksi, että muutokset ihmisen rasva-aineenvaihdunnassa ovat yhteydessä useisiin vakaviin sairauksiin, kuten diabetekseen, ylipainoon, joihinkin syöpiin, valtimotautiin ja Alzheimerin tautiin. Nyt kun tarkka mittausteknologia on olemassa, tarvitaan uudentyyppisille aineistoille kohdennettuja analyysimenetelmiä, jotka ottavat huomioon aineistojen erityisominaisuudet ja hyödyntävät kaiken tarjolla olevan tiedon mahdollisimman tehokkaasti. Tämän kaltaiset analyysit mahdollistavat sairauksiin liittyvien uusien diagnostisten testien ja hoitomenetelmien kehittämisen, Maiju Pesonen sanoo.
Pesonen tarttui väitöstutkimuksessaan tähän haasteeseen ja vertaili nykyisiä sekä kehitti uusia lipidomiikka- ja genomiikka-aineistoille soveltuvia tilastollisia analyysimenetelmiä. Väittelijän kiinnostuksen kohteena olivat erityisesti sairauksien riskiä ennustavien merkkiaineiden tunnistamiseen liittyvät menetelmät sekä biologisten verkkojen mallintaminen. Biologisilla verkoilla voidaan kuvata, miten esimerkiksi tuhannet geenit vaikuttavat yhdessä tai toistensa kautta jonkin ilmiön, esimerkiksi sairauden, taustalla.
– Kehonnesteiden ja kudosten rasvojen mittauksiin tiivistyy monipuolista tietoa geenisäätelystä, proteiinikoneiston toiminnallisuudesta, ympäristötekijöistä ja ruokavaliosta. Rasvoja ja niiden muutoksia tarkastelemalla voidaan muodostaa kokonaisvaltainen kuva kehon tilasta ja siksi niiden analysointi on erityisen mielenkiintoista, Pesonen sanoo.
Haasteena muuttujien suuri lukumäärä ja epätäydelliset havainnot
Biolääketieteellisessä tutkimuksessa on totutusti tarkasteltu kerrallaan yhden muuttujan, eli geenin, proteiinin tai lipidin, korrelaatiota tunnettuun fenotyyppiin tai esimerkiksi valtimotaudin vaikeusastetta koskevaan ennusteeseen. Usein kuitenkaan yhden geenin, proteiinin tai lipidin tutkiminen muista erillisenä osana ei riitä useimpien sairauksien ymmärtämiseen.
Siksi on tärkeää tutkia biologisia ilmiöitä kokonaisvaltaisesti käyttäen tilastollisia menetelmiä, jotka sallivat kaikkien mitattujen muuttujien yhtäaikaisen tarkastelemisen. Tällaisia ovat esimerkiksi tilastolliset monimuuttujamenetelmät ja regularisoidut regressiomallit.
Myös modernin mittausteknologian rajoitteet tuovat omat haasteensa suurten biolääketieteellisten aineistojen analysointiin. Laitteille ominaisten mittaustarkkuuksien alapuolelle jääviä pitoisuuksia ei voida havaita, jonka seurauksena aineistoista tulee reikäisiä.
Väitöskirjatutkimuksessaan Pesonen räätälöi olemassa olevia ja kehitti uusia analyysimenetelmiä vastaamaan näihin tarpeisiin. Työssä kehitettiin esimerkiksi reikäiselle aineistolle sopivan suurimman uskottavuuden estimaattorin kovarianssimatriisille. Tämä mahdollistaa useiden monimuuttujamenetelmien, kuten pääkomponenttianalyysin, soveltamisen ilman aineiston puuttuvien havaintojen korvaamista ”hyvillä arvauksilla” tai pahimmassa tapauksessa kaikkien epätäydellisten havaintojen kokonaan poissulkemista analyysista.
Toisena tärkeänä kokonaisuutena Pesonen kehitti uusia menetelmiä omiikka-aineistojen verkkorakenteiden mallintamiseen sekä reikäisille että lukumääräaineistoille.
– Inspiraationa biologisten verkkojen mallintamisen yleistämiselle lukumääräaineistoihin oli uuden sukupolven geeni-ilmentymisaineistot, joissa geenien ilmentymistä mitataan kokonaisluvuin. Tällöin aiemmat jatkuville muuttujille kehitetyt menetelmät eivät olekaan enää suoraan sovellettavissa, Pesonen kertoo.
***
VTM Maiju Pesonen esittää väitöskirjansa Analysis of high-dimensional and left-censored data with applications in lipidomics and genomics julkisesti tarkastettavaksi Turun yliopistossa torstaina 24.11.2016 klo 12.00 (Turun yliopisto, päärakennus, Tauno Nurmela -sali, Turku).
Vastaväittäjänä toimii professori Ernst Wit (Rijksuniversiteit Groningen, Alankomaat) ja kustoksena professori Mervi Eerola (Turun yliopisto). Tilaisuus on englanninkielinen.
VTM Maiju Pesonen on syntynyt vuonna 1986 ja kirjoittanut ylioppilaaksi Hyvinkään yhteiskoulun lukiossa. Korkeakoulututkintonsa (VTM) Pesonen suoritti Turun yliopistossa vuonna 2010. Väittelijä työskentelee Post-doc-tutkijana Aalto-yliopistossa. Väitöksen alana on tilastotiede.
Väittelijän yhteystiedot: p. +358408415397, maiju.pesonen(at)aalto.fi
Väittelijän kuva: https://apps.utu.fi/media/vaittelijat/pesonen_maiju.jpg
Väitöskirja on julkaistu sähköisenä: http://urn.fi/URN:ISBN:978-951-29-6643-1