Väitös (tietojenkäsittelytiede): DI Johannes Smolander

Aika

31.8.2023 klo 12.00 - 16.00
DI Johannes Smolander esittää väitöskirjansa ”Cell type identification, differential expression analysis and trajectory inference in single-cell tranomics” julkisesti tarkastettavaksi Turun yliopistossa torstaina 31.8.2023 klo 12.00 (Turun biotiedekeskus, BioCity, Presidentti-sali, Tykistökatu 6, Turku).

Vastaväittäjänä toimii professori Mark Robinson (Zürichin yliopisto, Sveitsi) ja kustoksena professori Laura Elo (Turun yliopisto). Tilaisuus on englanninkielinen. Väitöksen alana on tietojenkäsittelytiede.

Väitöskirja on julkaistu sähköisenä: https://urn.fi/URN:ISBN:978-951-29-9393-2

***

Tiivistelmä väitöstutkimuksesta:

Ribonukleiinihappo (RNA) on keskeinen geneettisen tiedon välittämistä hoitava molekyyli, joka toimii välikappaleena prosessissa, joka tuottaa geenin DNA-emäsjärjestyksen perusteella proteiinin tai muun geenin lopputuotteen. Tätä erityistä tehtävää hoitavaa RNA-tyyppiä kutsutaan lähetti-RNA:ksi, ja sen määrä eliön soluissa vaihtelee sen mukaan, miten aktiivisesti kukin solu pyrkii tuottamaan tiettyä geenin lopputuotetta.

RNA-sekvensointi on menetelmä kustannustehokkaaseen ja tarkkaan lähetti-RNA-tasojen mittaamiseen soluissa. Viime vuosina tapahtuneen nopean kehityksen myötä on tullut mahdolliseksi suorittaa RNA-sekvensointi tuhansille soluille erikseen, joka tarjoaa entistä tarkemman menetelmän solujen ilmentymisen tutkimiseen.

Tässä väitöskirjassa kehitettiin uusia laskennallisia menetelmiä yksisoluisen RNA-sekvensointidatan analysointiin. Toisena keskeisenä tavoitteena oli vanhojen laskennallisten menetelmien tutkiminen ja vertailu väitöskirjassa kehityttyjen menetelmien kanssa.

Ensimmäinen menetelmä hyödyntää uutta koneoppimisalgoritmia hienovaraisten geenien ilmentymiserojen havaitsemiseen. Vertailu muiden menetelmien kanssa näytti, että uusi menetelmä kykeni löytämään ihmisen verestä biologisesti merkityksellisiä immuunisolupopulaatioita, joita muut menetelmät eivät kyenneet löytämään. Menetelmä kykeni myös tunnistamaan entistä herkemmin ihmisen haiman stressaantuneita betasoluja, joilla on todettu olevan yhteys diabetekseen.

Kaksi muuta väitöskirjassa kehitettyä laskennallista menetelmää mallintavat solujen dynaamista kehityskulkua trajektorina. Näiden menetelmien todettiin olevan tietyissä tilanteissa tarkempia kuin aiempien menetelmien. Toisessa menetelmässä tarkoituksena oli myös parantaa trajektorin tunnistuksen käyttäjäkokemusta, sillä menetelmien epätarkkuuden takia näiden menetelmien oikein käyttäminen voi vaatia käyttäjän näkökulmasta huomattavaa vaivannäköä.

Näiden kolmen uuden laskennallisen menetelmän lisäksi vertailimme tilastollisia menetelmiä geenin ilmentymiserojen tunnistamiseen. Erityispiirteenä tässä työssä oli koeasetelma, jossa vertailtavissa ryhmissä on mukana useita eri koehenkilöitä tai muita biologisia replikaatteja. Tämän kaltainen analyysi on altis väärille positiivisille löydöksille. Työn tulosten mukaan menetelmät, jotka muuntavat RNA-sekvensointisignaalin yksisolutasolta näytetasolle ovat keskimäärin parhaita.
Viestintä