Väitöstutkimus tarkasteli tekstinlouhintaa ja tiedonesitystapoja eri sovellusaloilla (Väitös: FM Juho Heimonen, 27.11.2019, bioinformatiikka)
Sähköisessä muodossa tallennetuilla valtavilla aineistoilla on nykyaikana suuri merkitys uusien palveluiden kehittämisessä. FM Juho Heimosen tutkimus selvitti, miten laskennallisia menetelmiä voidaan käyttää tekstiaineistoissa olevan tiedon uuttamiseen ja hallintaan. Tutkimuksessaan Heimonen muun muassa kehitti proteiinien välisten vuorovaikutusten louhintamenetelmiä, tarkasteli hoito-ohjeiden kuvaamista tietokoneen ymmärtämässä muodossa ja analysoi Kiinan imagoa länsimaisessa uutismediassa.
Tekstimuotoisissa aineistoissa on paljon tietoa, jota ei hyödynnetä tehokkaasti, ja siksi tekstinlouhinta ja tiedonesitystavat ovat tärkeitä tutkimuskohteita. Turun yliopistossa väittelevä Juho Heimonen kehitti tutkimuksessaan uudenlaisia tapoja hallita massiivisia tietoaineistoja.
– Esimerkiksi biolääketieteessä sekä tieteellisten artikkelien että biologisen tiedon määrä kasvaa vauhdilla. Tiedon automaattinen kerääminen tekstistä auttaa hallitsemaan tutkijoiden kohtaamaa informaatiotulvaa, Heimonen sanoo.
Tutkimuksessaan Heimonen kehitti menetelmää, jota tarvitaan proteiinien ja muiden biomolekyylien välisten vuorovaikutusten uuttamiseen tieteellisistä artikkeleista. Vuorovaikutusten uuttamisessa tekstistä tyypillisesti tunnistetaan ensiksi maininnat molekyyleistä ja sen jälkeen maininnat niiden vuorovaikutuksista. Nyt kehitettyä menetelmää käytetään monivaiheisen prosessin viimeisenä osana.
– Tekstissä yksi sana voi ilmaista montaa vuorovaikutusta. Ne pitää pystyä erottamaan toisistaan oikean lopputuloksen aikaansaamiseksi, Heimonen sanoo.
Lisäksi Heimonen selvitti, miten tällä tavalla tunnistetut vuorovaikutukset voidaan muuttaa biologisissa tietokannoissa yleisesti käytettyyn muotoon.
– Luonnollisella kielellä ilmaistut vuorovaikutukset ovat yksityiskohdiltaan rikkaita. Tutkimus osoitti, että loogisen päättelyn ja yksinkertaistamisen avulla tekstistä poimituista vuorovaikutuksista voidaan irrottaa haluttu informaatio tietokannoissa käytettäväksi, Heimonen kertoo.
Täsmätyökaluja hoitoalan ammattilaisille
Kirjalliset hoito-ohjeet ovat oleellinen osa potilaan saamaa hoitoa, mutta niiden hallintaan on vain rajoitetusti työkaluja. Heimosen kehittämä hoito-ohjeontologia vastaa tähän tarpeeseen mahdollistamalla hoito-ohjeiden saatavuuden ja sisällön parantamisen laskennallisilla menetelmillä.
Ontologian avulla voidaan määritellä ja kuvata käsitteitä ja niiden välisiä suhteita tietokoneen ymmärtämässä muodossa. Hoito-ohjeontologian avulla voi kuvata sekä hoito-ohjeiden käyttötarkoituksia että niiden sisältöä. Kuvailu auttaa ammattilaisia esimerkiksi löytämään potilaan tarvitsemat ohjeet suuresta ohjekokoelmasta ja varmistamaan ohjeiden sisällön oikeellisuuden ja tarpeellisuuden.
– Ontologiassa on vielä paljon kehitettävää. Tulevaisuudessa sitä on tarkoitus käyttää esimerkiksi hoito-ohjeiden potilaskohtaiseen räätälöintiin, Heimonen toteaa.
Kiinan imago länsimaisessa uutismediassa
Väitöstutkimuksessaan Heimonen analysoi mielipidelouhinnan avulla suuren määrän uutisartikkeleita. Tulosten perusteella Kiina kuvattiin länsimaisissa valtavirtauutismedioissa pääsääntöisesti neutraalisti tai jopa vertailumaita myönteisemmin.
Vuosien 1997 ja 2008 välillä tapahtui muutos positiiviseen suuntaan. Tarkastellun aineiston perusteella Kiinan talous ja kulttuuri koettiin jälkimmäisenä ajankohtana länsimaissa myönteisempinä kuin politiikka.
– Analysoimme valtavan suurta aineistoa automaattisilla menetelmillä, mitä ei ole aikaisemmin tehty. Havaintomme eivät tue usein esitettyjä väitteitä, joiden mukaan länsimaissa luodaan negatiivinen kuva Kiinasta, Heimonen sanoo.
***
FM Juho Heimonen esittää väitöskirjansa ”Knowledge Representation and Text Mining in Biomedical, Healthcare, and Political Domains” julkisesti tarkastettavaksi Turun yliopistossa keskiviikkona 27.11.2019 klo 12 (Turun yliopisto, Agora, luentosali XX, Turku).
Vastaväittäjänä toimii apulaisprofessori Øystein Nytrø (Norwegian University of Science and Technology, Norja) ja kustoksena professori Tapio Salakoski (Turun yliopisto). Tilaisuus on englanninkielinen. Väitöksen alana on bioinformatiikka.
Väittelijän yhteystiedot: +358 2 333 8681, juho.heimonen@utu.fi