Väittelijä kehitti uusia menetelmiä talouden ilmiöiden ennustamiseen (Väitös: FM, VTM Markus Matilainen, 2.2.2018, tilastotiede)

26.01.2018

Markus Matilainen kehitti Turun yliopistoon tekemässään väitöstutkimuksessa uusia menetelmiä moniulotteisten aikasarja-aineistojen analysointiin. Menetelmiä voidaan hyödyntää esimerkiksi taloudellisten ilmiöiden tarkasteluun tai ennustamiseen.

​Turun yliopiston tiedote 26.1.2018

Aikasarja on havaintoyksiköstä tehtyjen mittausten muodostama aineisto. Yleensä aineisto on kokoelma mittauksista, jotka on tehty peräkkäisistä havainnoista tasaisin aikavälein. Aikasarja-aineisto on usein yksiulotteinen, jolloin se koostuu vain yhden havaintoyksikön mittauksista. Moniulotteinen aikasarja-aineisto puolestaan koostuu usean havaintoyksikön mittauksista, kuten eri valuuttakurssit suhteessa euroon.

– Moniulotteisessa aikasarjassa yksittäiset aikasarjat voivat riippua toisistaan ja niiden määrä voi olla huomattavankin suuri. Tällaisten aineistojen analysointi voi olla haastavaa. Mikäli moniulotteisen aikasarja-aineiston rakenne pystyttäisiin selittämään mahdollisimman kattavasti joidenkin latenttien, korreloitumattomien aikasarjojen avulla ja näistä piilevistä muuttujista vain osa voitaisiin todeta merkityksellisiksi, niin jatko-analyysit olisivat paljon helpompia. Tätä olen tutkinut väitöskirjassani, Markus Matilainen sanoo.

Latenttien muuttujien etsimiseen voidaan käyttää niin sanottua sokeaa signaalien erottelua, jossa näiden latenttien, korreloitumattomien muuttujien jakaumaa ei tunneta etukäteen. Mikäli nämä piilevät muuttujat voidaan olettaa toisistaan riippumattomiksi, puhutaan silloin riippumattomien komponenttien analyysista.

Sokean signaalien erottelun menetelmien kirjo on laaja ja niitä on tutkittu paljon riippumattomien ja jakautuneiden muuttujien kohdalla. Aikasarjojen kohdalla menetelmiä ei kuitenkaan ole vielä tutkittu niin laajasti.

– Aikasarjojen tapauksessa lisäongelmia tuottaa havaintojen ajallinen riippuvuus, eli nykyinen havainto voi riippua yhdestä tai useammasta aikaisemmasta havainnosta. Tämän huomioonottaminen on erityisen tärkeää, sillä muuten menettää paljon aineistossa olevaa informaatiota, Matilainen kertoo.

Aikasarjoille, joissa vaihtelun voidaan odottaa pysyvän suhteellisen samanlaisena koko ajan, on kehitetty sokean signaalien erottelun menetelmiä ja niiden teoreettisia ominaisuuksia on tutkittu laajalti. Usein kuitenkin esimerkiksi talouteen liittyville aikasarjoille on tyypillistä se, että niissä on sekä suuren että pienen vaihtelun jaksoja. Ei siis voida sanoa, että vaihtelu pysyisi samanlaisena koko ajanjakson ajan. Tällaisiin aikasarjoihin liittyen tutkimusta sokean signaalien erottelun menetelmistä ei ole paljoa tehty, ja Matilaisen yhtenä tavoitteena on ollut kehittää tällaisille aikasarjoille sopivia menetelmiä.

Väittelijän kehittämä ohjelmistopaketti on vapaasti käytettävissä

Matilainen tutkii väitöskirjassaan myös dimension supistamista. Tällaisessa tapauksessa pyritään korvaamaan aineiston alkuperäiset muuttujat paljon vähemmällä määrällä muuttujia, jotka kuitenkin sisältävät riittävän suuren määrän kaikesta aineistoon sisältyvästä informaatiosta. Sokean signaalien erottelun avulla saaduista latenteista, korreloitumattomista muuttujista voidaan esimerkiksi ottaa vain ne muuttujat, jotka ovat informatiivisimpia tietyn sopivan kriteerin nojalla.

Mikäli moniulotteisella muuttujajoukolla pyritään selittämään ulkopuolista muuttujaa eli vastetta, niin puhutaan ohjatusta dimension supistamisesta. Siinä selittävän muuttujajoukon dimensiota pyritään supistamaan esimerkiksi sokean signaalien erottelun avulla, mutta otetaan kuitenkin huomioon sen ja vasteen välinen riippuvuus. Tämän supistetun latentin muuttujajoukon voidaan ajatella sitten selittävän riittävän hyvin alkuperäisen selittäjäjoukon ja vasteen välisen yhteyden.

Tällaisia menetelmiä on kehitetty riippumattomille moniulotteisille havainnoille, mutta aikasarjojen kohdalla asiaa ei ole tutkittu paljoa. Väitöskirjassaan Matilainen on yleistänyt vanhoja menetelmiä toimimaan myös moniulotteisille aikasarjoille.

– Hyötynä tässä on se, että esimerkiksi ennustamisesta voi tulla helpompaa, sillä tulevien havaintojen ennustamiseen ei välttämättä tarvitse käyttää isoa moniulotteista aineistoa, vaan ennustamiseen voidaankin käyttää pienempää määrää yksiulotteisia aikasarjoja, Matilainen selittää.

Kehitettyjä menetelmiä on sovellettu muun muassa talouden ilmiöitä tarkasteleviin aineistoihin. Matilainen on kehittänyt kaikille väitöskirjatyössä esitetyille menetelmille tehokkaat laskenta-algoritmit ja niiden pohjalta on koottu R-ohjelmistopaketti, joka on vapaasti kaikkien käytettävissä.

***

FM, VTM Markus Matilainen esittää väitöskirjansa On Independent Component Analysis and Supervised Dimension Reduction for Time Series julkisesti tarkastettavaksi Turun yliopistossa perjantaina 2.2.2018 klo 12.00 (Turun yliopisto, Quantum, luentosali XVII, Vesilinnantie 5, Turku).

Vastaväittäjänä toimii professori Efstathia Bura (Technische Universität Wien, Itävalta) ja kustoksena professori Mervi Eerola (Turun yliopisto). Tilaisuus on englanninkielinen.

FM, VTM Markus Matilainen on syntynyt vuonna 1984 ja kirjoitti ylioppilaaksi Turun normaalikoulun lukiossa vuonna 2003. Matilainen suoritti korkeakoulututkintonsa Turun yliopistossa vuosina 2011 (FM) ja 2013 (VTM). Väitöksen alana on tilastotiede. Matilainen työskentelee Turun yliopistossa tohtorikoulutettavana.

Väittelijän yhteystiedot: p. +358440150333, manmat@utu.fi

Väittelijän kuva: https://apps.utu.fi/media/vaittelijat/matilainen_markus.jpg

Väitöskirja on julkaistu sähköisenä: http://urn.fi/URN:ISBN:978-951-29-7106-0

Luotu 26.01.2018 | Muokattu 26.01.2018