Kiinnostaako sinua tutkimusdatan analysointi ja tilastollinen ajattelu?
Sukella tilastotieteen maailmaan uudessa Statistiikan aalloilla -podcastissa! Biostatistiikan yksikkö on kutsunut studioon asiantuntijoita jakamaan tietoa tutkimuksen tekemisestä ja datan analysoinnista. Podcastin avulla voi kehittää tilastollista ajattelua.
Kuuntele ja opi ymmärtämään tutkimusta ja dataa paremmin – Statistiikan aalto kerrallaan!
Kuuntele SoundCloudissa, Apple Podcastsissa tai Spotifyssa!
Jaksojen kuvaukset ja tekstivastineet
Elinaika-analyysi ja kohorttitutkimus ovat aiheena tässä Statistiikan aallossa. Elinaika-analyysillä tarkoitetaan ajan kestoa kuvaavien havaintojen tutkimista. Kesto voi olla mikä tahansa kahden tapahtuman välinen aika, esimerkiksi elinikä, aika hoidon aloittamisesta taudin uusimiseen tai aika lapsen syntymästä ensimmäiseen korvatulehdukseen. Aikajakaumien kuvailun ja vertailun lisäksi kiinnostuksen kohteena voi olla erilaisten altisteiden tai hoitojen vaikutus ajankeston jakaumaan. Tässä podcastissa tilastotieteen professori Kari Auranen kertoo tutkijoille ja opiskelijoille elinaika-analyysin monipuolisista mahdollisuuksista erityisesti kohorttitutkimuksissa.
[Speaker 1]
[00:07] Tervetuloa statistiikan aalloille kuuntelemaan yleisiä asioita tänään kohorttitutkimuksesta ja elinaikaanalyysesta.
[00:14] Olit sitten lääke tai tilastotieteen opiskelija, tutkija tai muuten vaan kiinnostunut biostatistiikasta niin mukavaa, että olet linjoilla.
[00:23] Minä olen biostatistikko Markus Riskumäki, ja tänään haastattelen tilastotieteen professori Kari Aurasta.
[00:30] Tervetuloa, Kari.
[Speaker 2]
[00:32] Kiitos.
[Speaker 1]
[00:34] Mä muistan ehkä joskus jollain luennollani, tai sun pidemällä luennolla kuuleen, että sä et yhtään pidä statistiikka-sanasta.
[00:43] Pitäisikö tän podcastin nimen olla mieluummin vaikka tilastotieteen aalloilla?
[Speaker 2]
[00:46] No en nyt välttämättä siihen kovin voimakasta kantaa, mutta se on ihan totta, että en ihan tästä silkasta statistiikkasanasta koskaan pitänyt.
[00:54] Se näyttää olevan ehkä tämmöinen turkulainen sana.
[00:56] Okei.
[00:57] Että aikanaan itse valmistuin biometriasta Helsingin yliopistosta ja silloin puhuttiin biometriasta.
[01:06] Vieläkin meillä nyt sitten, ehkä kohta puhutaan lisää vielä, mutta tässä Turun yliopiston matematiikka ja tilasäädäntölaitoksella on biometrian opintosuunta.
[01:15] Eli se on rinnasteinen vaikkapa ekonometrialle tai psykometrialle.
[01:20] Olen käyttänyt tämmöistä metriatermia siinä.
[01:26] Mutta biostatistiikka on ehkä vähän, sanoisin,
[01:30] kivempi termi kuin pelkkä statistiikka.
[01:33] Statistiikkalla on vähän semmoinen outo soundi minun kormissaan.
[Speaker 1]
[01:36] Okei, okei.
[01:37] No sä vähän ehdit jo kertoakin, että Helsingissä olet aikoinaan opiskellut,
[01:43] mutta haluaisitko sinä vähän lisää avata sinun taustoja?
[Speaker 2]
[01:46] No joo, mä oon nyt täällä siis tilastotieteen professorina ollut Turussa
[01:51] kymmenisen vuotta melko tarkalleen ja toimin tosiaan matematiikan
[01:56] ja tilastotieteen laitoksen tilastotieteen yksikössä.
[02:01] Opetan tilastotieteen pääaineopiskelijoita siellä,
[02:04] mutta mulla on myös yhteys Turun yliopiston lääketieteelliseen tiedekuntaan
[02:09] toisena ikään kuin työnantajana, sanotaanko näin, laitostasolla.
[02:14] ja minulla on myös toimintaa lääketieteellisten ja epidemiologian savellusten alalla.
[02:23] Minun oma tausta ennen Turkuun tulaa on kansanterveyslaitoksessa,
[02:28] eli se on nykyinen Terveyden ja hyvinvoinnin laitos,
[02:30] jossa olin 20 vuotta tutkijana ja erikoistutkijana
[02:35] ja tein aikanaan väitöskirjan myös toimiessani siellä THL.
[02:40] Minun oma erikoisalaani oli tartuntatautien tilastollinen mallintaminen ja myös rokotusohjelman arviointi.
[02:50] Siihen liittyi myös matemaattinen mallintaminen, tartuntatautien leviämisen matemaattinen mallintaminen.
[02:59] Siellä arvioimme esimerkiksi, jos oli uusi rokote tullut markkinoille tai saataville,
[03:04] niin arvioitiin, että kannattaako se ottaa käyttöön väestötasolla kansallisessa rokotusohjelmassa.
[03:11] Tämmöisiä arvioita tehtiin ja siinä osana tarvittiin aineiston analyysiä ja sitten myöskin ihan tämmöisten
[03:18] leviämismallien ikään kuin rakentamista, että pystyttiin sitten tämmöisiä väestötason vaikutuksia arvioimaan.
[03:23] Ja sitten myöskin olemassa olevia, käytössä olevia rokotteita ja niiden vaikuttavuutta arvioitiin aika ajoin.
[03:32] Tämmöinen on mun taustani.
[03:33] Aika semmoinen, miten mä sanoisin, taustani on vielä siitä ennen soveltamassa matematiikassa ja sitten tilastotieteen opinnoissa.
[03:44] Mutta sitten tää sovellusala tuli sen THL-työn kautta, ja se oli sinänsä ihan hedelmällinen alue,
[03:55] pystyy soveltamaan kaikillaista osaamista sekä sieltä soveltamasta matematiikasta,
[04:03] tilastotieteestä, biometriasta spesifimmin ja sitten myöskin tämä sovellusala oli
[04:10] tai ainakin itse voin sanoa, että oli hyvin kiinnostava ja on yhä kiinnostava.
[Speaker 1]
[04:15] Okei, toi kuulosti sellaiselta, mikä tai mulla heti tuli mieleen sellainen asia,
[04:20] mikä nyt meitä kaikkia on tässä koskettanut viime aikoina,
[04:25] Onko sinä ollut mukana korona-aikaan rokotustutkimuksessa tai muussa?
[Speaker 2]
[04:33] Itse asiassa kyllä.
[04:34] Silloin, kun korona alkoi vuonna 2020, niin palasin hetkeksi THLään.
[04:45] Osa-aikaisesti, mutta kaikkein kivaimpana aikana se oli koko päivän toimistotyötä aamu kuudesta iltaan.
[04:53] myöhään, eli siellä oli mun vanhat kollegat, yhä useita siellä THLs, ja sitten me muotettiin semmoinen
[05:01] oma tiimimme, joka sitten yritti analysoida sitä tietoa, ikään kuin numeerista tietoa ja sitten empiiristä
[05:08] tietoa, mitä sitten alkoi kertyä kuitenkin aika nopeasti.
[05:13] Aika paljon on arvosteltu sitä, että tietoa ehkä
[05:17] pimitettiin tai sitä ei ollut saatavilla, mutta kyllä se loppukädessä oli yllättävänkin paljon sitten olemassa.
[05:24] Mutta tietenkin se, että mitä se tarkoitti, niin ei ollut ihan varmaan aina.
[05:31] Tämä oli hankala sanoa.
[05:33] Joo, olin mukana siinä, sanotaan alkuvaiheessa, tämmöisessä arvioissa.
[05:37] Oikeastaan ennen kuin rokotteet sitten tuli, niin siinä vaiheessa aktiivisemmin olin mukana myös koronatöissä.
[Speaker 1]
[05:45] Okei.
[05:46] Hei, kiitos tästä.
[05:47] Mielenkiintoinen tausta sulla.
[05:50] Mutta tänään kuitenkin puhutaan elinaika-analyysistä ja kohorttitutkimuksista,
[05:55] mitkä on myös tietysti sulle tuttuja aiheita.
[05:58] Aloitetaan vaikka tuosta elinaika-analyysistä.
[06:01] Olisiko sulla näin alkuun jotain esimerkkiä tutkimusasetelmista,
[06:05] jossa tulee käyttää elinaika-analyysiä, tai mitä se ensinnäköisin päätään tarkoittaa?
[Speaker 2]
[06:10] No, niin kuin se nimi sanoo elinaika-analyysi, niin tai kaikille tuli ensimmäisenä mieleen,
[06:15] että tosiaan jotenkin mallinetaan ja analysoidaan elinaikoja.
[06:20] Eli ihan konkreettisesti elämän pituutta, mutta noin yleisemmin elinaika-analyysi tarkoittaa
[06:27] minkä tahansa ajankeston mallintamista ja ikään kuin sen ajankestojen jakauman tutkimista,
[06:34] ja sen tutkimista, miten eri altisteet vaikuttavat kestomuuttujen.
[06:42] Jos palaan tuohon aikaisempaan historiaan, niin pääsin elinaikana maailmaan tartuntatautien puolelta.
[06:53] Jos ajatellaan vaikka lasten korvatulehduksia aiheuttavia bakteereita,
[07:00] Me tutkittiin aika paljon pneumokokkibakteereja ja sen eri alatyyppejä.
[07:04] Se on semmoinen bakteeri, joka yleensä tulee tonne nenänieluun täysin oireettomana,
[07:07] ja sitten se häviää sieltä aika ajan myötä, muutamassa viikossa tai kuukaudessa.
[07:14] Meitä kiinnosti kovasti se dynamiikka, että millä tavalla, kuinka usein ihan pienet lapset
[07:19] saa tätä pneumokokkibakteereja sinne nenänieluunsa, ja sitten kuinka kauan se sitten asustelee siellä.
[07:27] Silloin nämä kestot olivat niitä, mitä me haluttiin tutkia, niiden jakauma, keskimääräinen kesto, mutta myöskin sitten se, kun tilastotieteessä tiedetään, että minkälainen jakaumamuoto elinenläkestoilla on.
[07:41] Silloin me ollaan elinaika-analyysin eli kestojen analyysin maailmassa vähän monimutkaisemmassa joku semmoisessa, että me on vain kaksi tilaa, että olet elossa ja kuollut tai että olet terve, olet sairas tai vaan siinä on sitten useampia tämmöisiä mahdollisia ikään kuin siirtymiä, että voi saada pöpön, voit selvittää sen pöpön, sä voit saada uudestaan ehkä jonkun toisen alatyypin ja niin poispäin.
[08:08] Eli sillä tavalla mä jouduin tähän elinaikoanalyysiin, ja ehkä kohta puhutaan enemmän yleisemmin tämmöistä tapahtumasekvenssiä tai tapahtumahistoriamallien maailmaa.
[08:22] Eli kysyt, että esimerkkejä, niin ensimmäinen on varmaan juuri tämä elinaika itsessään, mutta sitten mikä taas on kesto, ajan kesto tyypillisesti, niin voi olla tämä kohde muuttaa.
[08:34] Se voi olla esimerkiksi hoidon aloittamisesta siihen, että ihmisen tila paranee tai jos on ollut joku diagnoosi, niin kuinka kauan kestää, että kuole tai jos on joku hoito, että kuinka kauan kestää, että tauti uusiutuu ja kaiken näköisiä erilaisia tutkimusasetelmia missä nimenomaan lääketieteessä ja epidemiologian puolella myöskin ajan kestot on tärkeitä ymmärtää.
[09:04] Silloin, kun elinaika on yleisin parissa tai laajennusten tai yleisempien, yleistettyjen mallien kanssa tekemisissä.
[Speaker 1]
[09:17] Joo, sä tuossa aika kattavasti selititkin tämmöisen ehkä yksinkertaisen elinaikamallin,
[09:25] jossa on kaksi tilaa, joku alkutila ja lopputila, esimerkiksi, että onko tutkittava kuollut vai elossa,
[09:31] mutta sit puhuit näistä yleistyksistä, että mitä sitten, jos onkin jotain vähän monimutkaisempaa,
[09:37] että esimerkiksi tutkitaan, tai potilaalla voi olla useampia sairauksia vaikka samanaikaisesti,
[09:44] Voiko tämmöisiä tutkia elinaikainalyysille?
[Speaker 2]
[09:47] Oikeastaan ehkä voisi tarkentaa sillä, että jos...
[09:52] Tai ehkä itse viittaisin tästä sellaiseen vaihtoehtoon,
[09:57] että yksilölle voi tulla erilaisia lopputulemia.
[10:02] Esimerkiksi ihminen voi olla terve nyt,
[10:04] mutta sitten hän voi saada tietyn sairauden tai sitten jonkun toisen sairauden.
[10:08] Ehkä nyt kaikkein selkein ja ymmärrettävin esimerkki olisi se, että jos tutkitaan kuolin syitä.
[10:18] Voidaan ajatella, että on olemassa joku kuolin syy.
[10:22] Meillä on vaikkapa tiettyyn syöpään kuoleminen on semmoinen päätetapahtuma.
[10:31] Sitten me katsomme aikaa siihen jostakin vaikkapa diagnoosista eteenpäin.
[10:36] ja sitten siellä voi olla tämmöinen kilpaileva, niin sanottu kilpaileva riski, joku toinen kuolin syy.
[10:41] Ikään kuin ihminen sitten menehtyykin johonkin toiseen syyhän, kuin siihen meidän varsinaiseen tutkittavaan päätetapahtuman mukaiseen syyhän.
[10:49] Silloin puhutaan kilpailevista riskeistä, ja niitä päätetapahtumia ei olekaan vain yksi, vaan niitä on kaksi tai sitten mahdollisesti useampia.
[10:57] Tämä on sinänsä kiinnostava elinaika-analyysin laajennus, että silloin meidän täytyy ajatella,
[11:06] että ihan tässä oikeassa maailmassa ihminen joutuu johonkin laatikkoon.
[11:12] Särkyttää nyt, että me puhumme laatikkomalleista, mutta tilaa, sanotaan näin.
[11:18] Jos yhtiön tilaan joutuu, niin sieltä ei pääse pois, ja sitten toiseen tilaan ei voi enää mennä.
[11:22] ja täytyy siinä mallin rakenteessa ja siinä analyysissa osata ottaa huomioon.
[11:28] Sitten voidaan mennä myös pitemmälle.
[11:30] Meillä on useampia kuin kaksi, meillä on kolme tai useampia tiloja.
[11:34] Jos palaan tähän nenänielukantajuus eli tämmöiseen oireettoman infektion tutkimiseen,
[11:43] niin siinä nimenomaan sitten yksikin yksilö voi vuoran perään olla ikään kuin ei-kantaja, niin sanotusti,
[11:52] tai sitten tyypin A-kantaja, sitten jälleen ei-kantaja, sitten ehkä tyypin B-kantaja.
[11:58] Silloin meillä on tämmöinen monitila-malli, missä nämä tilat tietyissä sekvensissä seuraa toisiansa,
[12:04] ja haluamme sitten ymmärtää sitä kokodynamiikkaa.
[12:08] Tästä on kaikenlaisia sovelluksia, paitsi lääketieteessä ja epidemiologiassa, myös vaikka sosiologiassa.
[12:15] Voidaan ajatella, että ihminen voi olla erilaisissa tiloissa, voi olla opiskelija, voi olla työssä,
[12:21] voi olla erilaisia kombinaatioita erilaisista tiloista, ja sitten voidaan katsoa, miten ihminen siirtyy,
[12:29] kuinka kauan kestää, että ihminen opiskelusta työllistyy tai joutuu työttömäksi ja uudelleen työllistyy.
[12:35] tämän tapaisia tapahtumahistoria ikään kuin niin sanottuja sekvenssejä tai tapahtumahistoriamalleja,
[12:44] jotka on taas tämmöisiä monitilaisia ikään kuin elinaikamalleja eli kestomalleja.
[12:51] Että on aika rikas tämmöinen kehikko, jonka sovelluksia on paljon muillakin aloilla kuin vaan
[13:01] lääketieteessä tai epidemiologiassa.
[13:03] Itse asiassa, me puhutaan aina englantilaisena terminä kuin survival analysis,
[13:10] elinaikaanalyysi, joka sitten kattaa myöskin,
[13:14] ehkä voisin sanoa, että se kattaa myöskin nämä yleistykset.
[13:17] Mutta sitten jossain muilla alueilla voidaan puhua esimerkiksi failure time analysis,
[13:21] niin kuin vaikkapa, että kuinka on kestävä, että koneen vikaantuu.
[13:24] Eli hyvin tärkeä tämmöinen tekninen kysymys,
[13:27] Siellä on oma traditionsa rakentaa näitä malleja, mutta hyvin samasta asiasta puhutaan.
[13:36] Eli vikaantumisen mallit tai elinajan mallit, että kestoja mallinnetaan.
[Speaker 1]
[13:43] Palataanpa sitten vähän elinaika-analyysin teknisempään läpikäymiseen.
[13:51] Sä tuossa paljon puhuitkin siitä, että elinaika-analyysissä se vastenmuuttoja on nimenomaan aika.
[13:58] Mutta osaisitko sä kertoa muuten, että kuinka elinaika-analyysi eroaa muista tutkimusasetelmista?
[14:04] Että millaisia ominaispiirteitä nimenomaan elinaika-aineistoilla on?
[Speaker 2]
[14:10] No tosiaan niin elinaika-analyysissä se vaste on aika johonkin hyvin määritetyyn päätetapahtumaan.
[14:18] Ja on muunkinlaisia tämmöisiä tilastollisia tai tutkimuksellisia asetelmia, joissa aika näyttelee jonkinlaista roolia.
[14:27] Esimerkiksi puhutaan niin sanottuista pitkittäisistä aineistoanalyyseista tai pitkittäismalleista.
[14:35] Ja siinä tarkoittaa silloin sitä, että esimerkiksi jos ihmiseltä mitataan vaikka verenpaine viikon välein,
[14:41] kun hän saa lääkitystä A tai lääkitystä B, niin silloin meillä on tyypillisesti tämmöinen pitkittäinen aineisto kyseessä,
[14:46] jossa se aika indeksoi, eli on ensimmäinen viikko, toinen viikko, kolmas viikko.
[14:53] Se aika siinä ei ole vastetapahtuma, vaan se on oikeastaan selittävä muuttoja, niin sanotusti.
[15:00] Eli jollakin tavalla nämä on supulaisia.
[15:03] Joskus on ongelmia, joissa voidaan sitten kummastakin suunnasta katsoa sitä ongelmaa.
[15:10] mutta noin lähtökohtaisesti aika toimii eri rooleissa, elinaika-analyysissa ja sitten taas pitkittäisaineistojen analyysissa.
[15:18] Sitten meillä on ehkä aikasarjat tulee mieleen sellaisena aika isona tällaisena mallikehikkona,
[15:24] että me katsotaan jotakin osakekurssien tai säätilan, lempötilan ikään kuin aikasarjaa.
[15:32] Ja siinäkin se aika tyypillisesti aika usein toimii semmosena indeksinä siitä, että monesko mittaus on menossa,
[15:40] monesko aikapiste on menossa ja sitten vieläpä niin, että siinä on usein vain tämmönen yksi ainoa pitkä sarja
[15:46] ja sitten taas ehkä pitkittäis-anniston analyysissa on semmonen ehkä lyhyehkoja aikasarjoja monelta monelta tutkimusyksilöltä.
[15:57] Elinaika-analyysissa se eroaa näistä tosiaan siinä, että se aika johonkin päätetä tapahtumaan on se varsinainen kiinnostuksen kohde ja vastenmuuttuja.
[16:06] Ja nyt jos puhutaan näistä piirteistä, designi, niin se aika siinä on kovin jännä olio, koska tota ihan teknisesti ottaen se on vaan positiivinen luku.
[16:16] Meillä on joku ajan oriko yleensä, nyt me puhumme sen ajan nollahetkestä, ja näissä ongelmissa pitää aina määritellä, että mikä se ajan nollahetki on.
[16:24] Se voi olla syntymä, jolloin se meidän aikamuuttija on ikä, tai se voi olla joku hoito, hoidon hetki tai hoidon saamisen hetki,
[16:36] jolloinkas me aletaan mitata sitten sitä jonkun päätötapattuman ikään kuin sattumista tästä hoidon alkuhetkestä,
[16:43] eli silloin se aika on aika hoidon saamisesta tai aika hoidon alkamisesta.
[16:48] Eli se ajan oriko jollakin tavalla aina määrittelee se, että mistä aikamuuttujasta puhutaan.
[16:53] Aika tavallaan kulkee samaa tahtia, mutta se aikamuuten nimi ja mistä oikeasti puhutaan määräytyy ajan nolla hetkestä.
[17:02] Sitten se odotetaan, odotetaan, odotetaan ja sitten yksilöllä tapahtuu se päätetapahtuma.
[17:10] Sitten me saadaan meidän havainto eli se vaste on se kulunut aika, ajan kesto.
[17:16] Tässä nyt tulee se ajan omituinen piirre, tai ei omituinen, vaan ehkä oleellinen piirre, että me joudutaan odottamaan, mitä se tapahtuu.
[17:24] Esimerkiksi vaikka verenpaine, vois ajatella, että se on positiivinen lukema.
[17:29] Se ei eroa teknisesti jotain ajasta, joka sekin on joku positiivinen lukema.
[17:36] Mutta sen me voidaan yleensä lukea suoraan, se verenpaine sitä mittarista.
[17:40] Mutta aikaa meidän täytyy odottaa.
[17:44] Ja siinä on kaksi asiaa ainakin, mikä sitten tästä seuraa.
[17:47] Yksi on se ihan tämmönen tilastotieteilijän ja totkijan ikään kuin ongelma, että aina meillä ei ole aikaa odottaa niin kauan, että kaikille tämä tapahtuma sattuisi.
[17:59] Me tiedetään vaan, että sitä ei vielä ollut tapahtunut.
[18:02] Oli ulotettu viisi vuotta, mutta ihminen oli yhä elossa, tai ihminen oli yhä terve, tai ihminen oli yhä siinä lähtötilassa, mikä sitten olikin sen ongelman mukainen lähtötila.
[18:13] Silloin me sanotaan, että tämä tapahtuma-aika on sensuroitunut.
[18:18] Me tiedämme, että yksilö oli välttänyt sen päätetapahtuman tiettyyn hetkeen saakka, mutta me emme tiedä milloin sitten siellä tulevaisuudessa se tapahtuisi.
[18:27] Tämä on nyt tyypillinen elinaika-analyysien, ehkä joskus sanotaan, että se on jopa se kaikkien eniten elinaika-aineistoja luonnehtiva piirre, että niissä on tätä sensurointia lähes aina.
[18:39] Eli meidän täytyy jotenkin osata ottaa huomioon siinä analyysissä.
[18:42] Sekin on informaatiota jakaumasta, että yksilö on kuitenkin pysynyt lähtötilassa
[18:48] tietyn mitan aikaa.
[Speaker 1]
[18:50] Eli niitä kumminkin siis analysoidaan?
[Speaker 2]
[18:52] Kyllä, niitä ei poisteta aineistosta, vaan nimenomaan se otetaan huomioon.
[18:56] Se on erittäin tärkeä siinä.
[18:57] Okei.
[18:58] Ja sitten toinen ehkä tässä ajasta on se, että koska se aika etenee,
[19:03] meidän mielestämme eteenpäin,
[19:05] niin useat tavat sitten kuvata elinaika-aineista tai sanotaan ajan kestoja perustuu tähän tämmöiseen ikään kuin ennustamiseen.
[19:15] Mitä tapahtuisi seuraavaksi tai kuinka nopeasti tapahtuisi seuraavaksi, jos vielä mitään ei ole tapahtunut,
[19:21] niin millä vauhdilla yksilö kohtaisi sen päätetapahtuman juuri nyt.
[19:27] Ja me tavallaan kerrytetään tämmöistä tietoa sitten aina ehdollistamalla kaikkeen siihen, mitä jo siihen mennessä on ehtinyt tapahtua.
[19:35] Se voi olla yksinkertaisemmillaan vaan se tieto, että yksilö on vielä siinä lähtötilassa, on vielä elossa, niin sanotusti, on vielä siinä nollatilassa, lähtötilassa.
[19:45] Mutta siihen voidaan sitten sisällyttää muutakin tietoa sen yksilön ikään kuin taustamuuttujista tai siitä, mitä hänellä on ehtinyt tapahtua aikaisemmin siihen hetkeen mennessä.
[19:54] Eli tämmöinen meidän halu ja taipumus ja sitten myöskin tekninen ikään kuin koneisto, joka on olemassa,
[20:04] niin se usein sitten mallintaa tämmöisiä ehdollisia tapahtumavauhtia.
[20:08] Puhutaan tämmöistä uhka-funktiosta tai hasardifunktiosta siinä yhteydessä.
[20:16] Eli vaikka sitten, mä voisin nyt ehkä ottaa vielä esimerkin siitä sensuroitumisesta,
[20:21] että meillä on ihan vastaavia ilmiöitä vaikka jossakin laboratoriamittauksissa,
[20:28] jossa meillä sitten tietää, siinä on vähän toiseen suuntaan sensuorioitumista kyse,
[20:33] että jos mä otan vähän taaksepäin tässä, niin se meidän tyypillinen elinajan sensuorioituminen
[20:38] tarkoittaa sitä, että yksilön tulevaisuus jää meiltä vähän niin kuin pimentoon.
[20:44] Me tiedetään vaan, että yksilö oli elossa tiettyä hetkeä mennessä.
[20:48] Sitten taas laboratoriamittauksessa on usein sellainen detektioraja.
[20:53] Tiedän, että jonkun aineen konsentraatio on alle sen detektioraja.
[20:57] En tiedä, että se on nollan ja detektiorajan välissä.
[20:59] Sekin on ikään kuin sensuroitunut havainto, joka on siellä jossakin.
[21:03] Tiedän, että se on olemassa, mutta tiedän vain, että se on välissä.
[21:07] Nollan ja detektiorajan välissä.
[21:11] Puhutaan vasemmalta sensuroitumista, kun se on pienemmässä päässä.
[21:14] Sitten taas elinaika-analyysissa usein puhutaan oikealta sensuroitumista sen takia,
[21:18] että ne on ikään kuin siellä aika, jos me pidetään se taululle, niin etenee vasemmalta oikealle,
[21:23] niin siellä sinne oikealle puolelle pimentoon se oikea tapahtuma-aika.
[21:28] Tämä on sinänsä hyvin tärkeä juttu.
[21:33] Elinaika-analyysissa ottaa huomioon tai huomata, että siellä on sensuroitumista,
[21:37] ja sitten myöskin osata ottaa se huomioon siinä analyysissa.
[21:40] Me ei heitetä pois niitä, muutenhän me vääristetään sitä informaatiota.
[Speaker 1]
[21:45] Mitä sitten mua kiinnostaa, että tuota...
[21:49] Sä puhuit tuossa, että kuinka kun tosiaan aika on nyt se vastenmuuttuja,
[21:54] niin on pakko odottaa, että niille, esimerkiksi potilaille,
[21:58] tapahtuu siellä tutkimuskohortissa jotain.
[22:01] Niin eikö elinaika-aineistoja sitten pysty tekemään
[22:04] silleen retrospektiivisesti vaikka jostain databaissista?
[Speaker 2]
[22:09] Tämä on hyvä kysymys, ja kyllä voi, että tämä ideali nyt ehkä oli...
[22:15] Tosiaan tässä esitin asian oli, että meillä olisi tämmöinen tutkimuskoortti,
[22:20] muodostettu hetkellä nolla, ja sitten sitä seurataan eteenpäin ajassa,
[22:24] kunnes niitä päätetapahtumia sattuu ainakin riittävän määrä,
[22:27] ja loput sitten sensuroituisi, kun tutkimus päättyy vaikka vain viiden vuoden kuluttua.
[22:32] Mutta on ihan totta, että Suomessa aika usein ja hyvinkin voidaan tehdä tämmöisiä
[22:40] retrospektiivisia kohorttitutkimuksia, joissa se aineisto kerätään rekistereistä jopa vuosikymmenten takaa.
[22:45] Ja sitten luodaan tämmöinen rekisteripohjainen kohortti, eli tämmöinen tutkimusjoukko.
[22:54] Ja sitä voidaan sitten analysoida ihan samoin menetelmin, ikään kuin se oli se seurattu sieltä vuodesta 1960,
[23:00] Aikapa eteenpäin.
[23:02] Silloin tietenkin saadaan paljon pitempiä seuranta-aikoja ja mahdollisesti vähemmän sensurointia.
[23:10] Riippuu tietenkin tutkimuskysymyksistä ja siitä aikajänteestä, mutta se on ihan totta, että näin voidaan tehdä.
[23:16] Siitä tulee tietenkin ehkä...
[23:18] Voi tulla muunlaisia ongelmia rekisteritiedon suhteen, mutta ne eivät ehkä usketa elinaika-analyysin kehikkoa sinänsä.
[23:27] Eli se on ihan totta, että näin voidaan tehdä.
[Speaker 1]
[23:31] Joo, tässä on nyt tullut paljon asiaa lyhyessä ajassa.
[23:35] Uusien asioiden oppimisesta tulee aina kaikkia uusia käsitteitä,
[23:39] mitä monia oletkin tässä jo maininnut.
[23:42] Eli ehkä hieman kertauksena,
[23:44] mitä olisi sellaisia oleellisia, tärkeitä käsitteitä,
[23:48] jotka nimenomaan elinaika-analyysiin liittyvät?
[Speaker 2]
[23:51] No, ehkä nyt sen vielä ikään kuin kertaan,
[23:55] että se aikamuuttujan...
[23:58] Kaksi tärkeitä asiaa pitää päättää, kun aletaan tehdä, sanotaanko, elinaikaanalyysiä.
[24:05] Täytyy päättää, että mikä on se päätetapahtuma ja missä se ajan ori on, mistä sitä aikaa mitataan siihen päätetapahtumaan.
[24:14] Tämä voi tuntua aivan jotenkin yli yksinkertaiselta ja triviaalilta.
[24:21] Tietenkin sen pitäisi suoraan seurata tutkimuskysymyksestä, mutta on kuitenkin oikein hyvä, että itsellensä kirjoittaa ne alas, että nämä ne ovat, ja myöskin osaa ne siinä raportissa kertoa, se on tärkeä asia.
[24:39] Sitten on sellaisia ehkä enemmän teknisiä asioita, jotka liittyvät analyysiin ja siihen informaation kertymiseen.
[24:46] Eli silloin, kun meillä on tämmöinen tilanne, jossa osa yksilöistä tai heidän tapahtuma-aikansa niin sanotusti sensuroituu sieltä oikealta ja lievät vähän sinne tulevaisuuteen,
[24:59] niin meidän täytyy ottaa sekin huomioon kuitenkin sekin informaatio.
[25:03] Silloin käytetään tämmöistä käsitettyä kuin riskijoukko ja henkilöaika.
[25:07] Eli usein siinä tutkimusjoukossa, tutkimuskohortissa katsotaan, että ketkä meillä on seurannassa.
[25:14] Eli ne, jotka ovat tutkimuksessa mukana ja joille minä pystyisin kertomaan juuri nyt, jos heille tapahtuu se päätetapahtuma tai ei.
[25:23] He ovat riskijoukkoon kuuluvia.
[25:25] Ja sitten sen jälkeen, kun se päätetapahtuma on sattunut jollekin yksilölle tai jos hän sensuroituu, niin hän poistuu riskijoukosta.
[25:32] Se on tämmöinen tekninen käsite, joka on hyvin hyödyllinen käytännössä ja vaikkapa juurikin tämmöisessä koorttitutkimuksessa tärkeä käsite.
[25:44] Sitten tämä henkilöaika, englanniksi person time, on sitten se totaaliseuranta-aika, joka sitten tässä riskijoukossa kiertyy, että nämä kaksi käsitettä menee käsikädessä.
[25:55] Ja jos me nämä ikään kuin rekisteröidään ja otetaan havaintoina mukaan siihen analyysiin,
[26:02] niin silloin me pystytään tietyin edellytyksin analysoimaan sitä erinaikajakaumaa,
[26:08] ikään kuin sensurointia ei olisi.
[26:11] Eli me pystytään korjaamaan se, siinä on tiettyjä oletuksia, mitä joudutaan tekemään siitä.
[26:15] Ja ehkä on helppo sanoa se, että siinä tavallaan oletetaan, että ne, jotka sensuroituvat minun aineistostani,
[26:23] eivät ole sen oletettavissa olevan tulevaisuudessa kannalta mitenkään sairaampia tai terveempiä tai herkempiä sille päätetapahtumalle
[26:33] siis kun ne jotka jäävät siihen koorttiin.
[26:35] Eli et se mun koortti ei jotenkin rikastu kohti terveempiä tai sairaampia sanotaanko näin vaikkapa ajan myötä.
[26:45] Ehkä tämmöiset asiat tässä tulee mieleen vielä tästä teknisemmästä puolesta.
[26:53] No sitten, miten näitä elinaika-aineistoja analysoidaan?
[26:57] Ihan lyhyesti ehkä siitä muutaman sanan.
[26:59] Usein me pyritään piirtämään sellainen elinajan keston jakaumakuva jollakin tavalla.
[27:06] Suoraan aineistosta voidaan tietyin eläintyksin piirtää sellainen käyrä,
[27:12] että vuoden päästä vielä 75 prosenttia tutkimuskohortista oli lähtötilassa, oli vielä elossa.
[27:20] Käytän tätä termiä elossa tässä ikään kuin geneerisenä, että on vielä lähtötilassa.
[27:26] Sitten katsotaan, mikä tilanne on kahden vuoden kohdalla, kolmen vuoden kohdalla.
[27:30] Sitten tulee laskeva käyrä.
[27:31] Mitä pitemmällä ajassa mennään, sitä pienempi osuus on enää lähtötilassa.
[27:36] ja tämä on sitten tämmöinen sen koko elinaikajakauman kuva.
[27:44] Puhutaan tämmöistä välttöfunktiosta ja nyt tilasto seuraa uusi sanasto.
[27:49] Sanoo, että tämä on se kestofunktio tai elossaolofunktio, eli se on se, että kuinka suuri osuus on vielä elossa, eli lähtötilassa kullakin ajan hetkellä.
[27:59] Eli tämä välttäfunktio, kestofunktio tai elossaolofunktio, kaikki tarkoittavat samaa asiaa, niin sitä tosiaan voidaan suoraan aineiston perusteella arvioida
[28:12] tämmöisenä niin sanottuna Kaplan-Meyer-menetelmällä.
[28:15] Se saattaa olla osalle kuulijoista tuttukin jo, ja se on hyvin tavallinen tapa kuvata aineistoja.
[28:23] Ja sitten tietenkin voidaan rakentaa tämmöisiä elinaikaregressiomalleja.
[28:29] Tapani kuin lineaarinen regressio, jos se on tuttu kuulijoille, niin tässä sitten pyritään niitä elinaikoja tai sitten niitä elinaikajakamoa vaikuttavia parametreja selittämään erilaisilla ikään kuin muuttujilla,
[28:43] vaikkapa just sillä altisteella tai iällä tai muilla taustamuuttujilla tavallisen regressiomallin tapaa.
[28:50] Siellä on tietyt omat sitten malliluokkaset siihen.
[Speaker 1]
[28:57] Puhuit aika paljon siitä, että kun ne censuroituu, niitä havaintoja pitää pystyä kumminkin analysoimaan jotenkin.
[29:08] Onko tämä hasardin periaatteessa se, millä niitä pystytään analysoimaan?
[29:13] Tämä menee nollaan vasta sitten, kun päätötapahtuma on sattunut.
[Speaker 2]
[29:17] Tämä on aika hyvä kysymys.
[29:19] Tämä voi olla suorastaan hankala vastata ihan suoraan.
[29:26] Mutta luulen, että olet kyllä ihan hyvin tässä jäljellä.
[29:31] Hasardi itsessänsä käsitteenä, sellaisena mallin parametrina,
[29:36] Jollakin tavalla sanotaan, että elinaikajakama voidaan parametrisoida hasardin avulla.
[29:43] Voidaan esittää hasardin avulla.
[29:46] Tämä ei sinänsä vaadi ajatusta siitä, millainen aineistoni on, ja onko siellä sensurointia vai ei.
[29:53] Se on ihan semmoinen teoreettinen suure.
[29:58] Tarkoittaa käytännössä sitä vauhtia, jolla se tapahtuma sattuu juuri nyt, jos ei sitä vielä ole tapahtunut.
[30:07] En hirveästi valitse, jos sanon, että se voidaan useimmiten tulkita näin,
[30:12] että se on suorastaan se ehdollinen todennäköisyys,
[30:15] että se tapahtuma sattuu juuri nyt ehdolla,
[30:17] että se ei ollut vielä tapahtunut.
[30:19] Eli jos katson, että minulla on vauhti kertaa pieni ajan väli,
[30:27] niin niiden kahden tulo matemaattisesti on se todennäköisyys,
[30:32] että se tapahtuisi juuri nyt.
[30:34] Eli tämmöisenä käsitteenä se on olemassa ennen kuin meillä on yhtään havaintoa.
[30:42] Sitten sä kysyit, tai lähdit kysymyksessäsi siitä, että meillä on sensuroitu jo havaintoja.
[30:49] Niin mitäs tämä hazardi siihen pelaa?
[30:52] No se on kyllä ihan totta, että kun se kattoo aina vain sitä seuraavaa hetkeä,
[30:57] jollekin tavalla puhuu vain niistä yksilöistä tai koskee vain niitä yksilöitä, jotka vielä ovat lähtötilassa.
[31:04] Niin sillä tavalla se kyllä sopii hyvin sitten mallintamaan ja kirjoittamaan ikään kuin teknisesti sitä ikään kuin...
[31:15] Ja nyt mennään vähän sinne syviin vesiin, ikään kuin niitä niin sanottuja uskottavuuslausekkeita,
[31:20] joita tarvitaan siellä malliin ikään kuin parametrien estimoinnissa.
[31:27] niin se kyllä sitten soveltuu erityisen hyvin näihin.
[31:29] Samaten nämä kilpailevia riskejä, joista oli aluksi puhetta,
[31:32] sopii myös niihin, koska vaikka minulla olisi kolme eri
[31:37] mahdollista päätetapahtumaa kilpailemassa keskenään,
[31:41] niin tämä hazard puhuvaan sitä seuraavasta milli tai mikro tai vielä nano,
[31:46] kuinka pienen aikaaskeleen hyvänsä seuraavan hetken tapahtumisesta,
[31:52] niin nämä kolme eri vaikkapa kilpailevaa syytä kaikki,
[31:56] voin ikään kuin laskea niille nämä hazardit ehdolla, että mikään näistä kolmesta ei ole vielä tapahtunut.
[32:03] Se olisi paljon hankalampaa, jos puhuisin näistä kolmesta tapahtumasta vaikka vuoden päässä,
[32:08] koska ne on selvästi, että jos yksi on tapahtunut ja toinen ei ole voinut tapahtua,
[32:11] niin voin puhua niistä riskeistäkään kuin jotenkin riippumatta.
[32:14] Tämä hazardista pystyy puhumaan.
[Speaker 1]
[32:16] Joo.
[32:17] Sitten sinä tuossa hieman jo aiemmin mainitsit näistä väyttöfunktioista
[32:24] ja niiden merkitykset tälle elinaiva-analyysille.
[32:27] Mutta miten se nyt sitten liittyy näihin hasardeihin?
[Speaker 2]
[32:30] No, tämä välttö tai kestofunktio tai elossaolofunktio,
[32:35] jota sillä Kaplan-Mayer-menetelmälläkin voidaan arvioida,
[32:38] niin se on yksi tapa kuvata elinaikajakaumaa.
[32:43] Eli usein sanotaan näin, ja se on ihan totta,
[32:45] että elinaikajakauma voidaan täysin ikään kuin määritellä
[32:49] joko antamalla tämä välttöfunktio tai hasardefunktio.
[32:54] Eli ne on tavallaan ikään kuin semmoiset komplementaarset tai vaihtoehtoiset tavat kuvata sitä samaa asiaa.
[33:01] Välittöfunktio on sillä tavalla konkreettinen, jota voidaan usein tosiaan sillä Kaplan-Meier-menetelmällä suoraan aineistosta piirtää.
[33:08] Ja se on myöskin ehkä helppo tulkita, kun se suoraan tarkoittaa sitä elossaolon todennäköisyyttä ja sen aikariippuvuutta.
[33:19] Hasardi taas on kätevämpi parametri silloin, kun aletaan puhua siitä ja mallintaa sitä, että mikä vaikuttaa siihen tapahtumisen vauhtiin.
[33:27] Miten altistus tai hoito tai eri taustamuuttijat joko ikään kuin nopeuttavat tai hidastavat sitä tapahtumisen vauhtia.
[33:35] niin siinä on se hazardi, nämä tällä tavalla rakennetut regressiomallit,
[33:41] niin useimmiten perustuu nimenomaan tämän hazardin vaihtoehtoon,
[33:45] sanoisiko suoremmin kuin siihen välttöfunktioon.
[33:49] Ja ne ovat kuitenkin, ne eivät ole erilliset asiat,
[33:52] että ne ovat tavallaan ikään kuin kolikon kaksipuolella.
[Speaker 1]
[33:56] Okei, kiitos.
[33:58] Tähän väliin olisi varmaan hyvä tehdä joku pieni kertaus tästä kaikesta,
[34:02] miten ollaan elinaikamalleista puhuttu, ennen kuin siirrytään kohorttitutkimuksiin.
[34:08] Mietin, että suurin osa meidän kuuntelijoista on varmaan semmoisia,
[34:10] jotka joskus aikoo tehdä tällaisia elinaikanalyysejä.
[34:15] Pitäisikö se kertaas tehdä vaikka listaamalla vähän,
[34:19] että minkä seikkojen määrittelyyn elinaikanalyysi perustuu?
[34:22] Tai jos itse olet tekemässä elinaikamallia,
[34:25] niin mitä sun pitää muistaa tehdä?
[Speaker 2]
[34:29] Tätä voi olla ehkä hankala tyhjentävästi nyt näin tässä formaatissa antaakaan, mutta jonkinlainen lista tässä nyt ehkä meillä on.
[34:41] Tietenkin ensimmäinen kysymys on se, että mikä se tutkimuskysymys on, ja se sitten sanelee sen, että tosiaan niin kuin sanottiin aikaisemminkin tässä jo,
[34:49] että mikä on se ajan nolla hetki ja mikä on sitten se päätötapahtuma, johon sitä aikaa mitataan.
[34:56] Ja jotta me voitais tutkia sitä meidän päätettä tapahtumaa, eli sitä aikamuuttujan kestoa ja sen riippuvuutta vaikkapa sen hoidosta tai altisteesta,
[35:07] niin meidän täytyy ihan tavallisen tilastollisen teorian mukaan olla kiinnostuneita ja pitää huoli siitä, että se meidän kohortti on jonkinlainen otos siitä päästöstä,
[35:19] mitä haluamme tutkia.
[35:20] Tässä on ihan samat oletukset tai ajatukset voimassa, toki siltä osin.
[35:28] Sitten me keskusteltiin siitä, tai oikeastaan näin voisi sanoa, että kun se ajan nollahetki on määritetty,
[35:34] niin silloin se aika alkaa juosta siitä hetkestä, siihen päätöt tapahtumaan.
[35:40] Mutta sellainen uusi juttu, mistä ei ehkä puhuttu vielä, on se, että aina se seuranta ei ala sieltä nollasta.
[35:46] Eli jos vaikka meillä on ikä, se aikamuuttuja, niin se alkaa juosta sieltä syntymästä, mutta yksilö ei välttämättä ole tullut meidän seurantaan, aktiivisen seurantaan, kun vasta tietyn ikäisenä.
[35:59] Ja silloin tämä pitää ottaa huomioon, taas yksi semmoinen uusi piirre, joka pitää ottaa huomioon siinä elinaika-aineistoanalyysissa, että mä tiedän kyllä, että se yksilö on elossa,
[36:09] eli siinä lähtötilassa silloin, kun hän tulee siihen tutkimukseen, mutta kysymys on sen, että tämä on ehkä nyt hyvin...
[36:18] Ehkä hieman hankalaa tässä selittää, mutta ensimmäinen ajatus oli se, että no, minähän voin ajatella, että minä olen seurannut häntä siitä syntymästä asti,
[36:26] kun hän kerron, että on yhä tässä nyt minulla olemassa sillä hetkellä, kun hän liittyy tähän tutkimukseen, mutta useimmiten tämä on väärin.
[36:36] Teknisesti ottaen mun täytyy ottaa se informaatio tästä yksilöstä huomioon siinä analyysissa vasta siitä iästä lähtien kun hän liittyy tähän seurantaan eli tulee riskijoukkoon.
[36:45] Siinäkin se riskijoukko on taas tärkeä käsite, että se pitää ottaa tällä tavalla huomioon.
[36:51] Ja siksi tämä ajan nollahetki ja sitten sen seurannan alkuhetki ei välttämättä ole sama asia.
[36:58] Se on, se on, se on, puhutaan tämmöisestä englanninkielisellä termiä kuin late entry eli myöhäinen ikään kuin
[37:06] mukaan tulo tutkimukseen tämmöisissä ongelmissa.
[37:11] No sitten sensuroinnista ollaan puhuttu ja nimenomaan sitä niin sanotusti oikealta sensuroinnista, jos puhutaan
[37:18] sensuroinnista, niin elinaikanaanalyysissä tyypillisesti tarkoittaa juuri tätä tulevan tapahtuman
[37:25] sensuroitumista, eli oikealta puolelta sensuroitumista.
[37:29] Tästä pitää olla sen verran kiinnostunut, että mikä sen syy on sensuroituminen.
[37:34] Jos se on ihan täysin riippumaton syy siitä meidän varsinaisista tutkimuskysymyksistä,
[37:38] niin yleensä silloin ollaan ikään kuin hyvillä vesillä.
[37:43] Eli että se sensuroituminen ei rikastuta sitä mun jäljellä jäävää kohorttia
[37:49] jotenkin terveempiin tai sairaampiin päin.
[37:52] mutta jos se sensuroitumisen syy on jotenkin, jos se liittyy jotenkin siihen vastetapahtumaan.
[37:57] Esimerkiksi, että ihmiset, jotka tuntevat itsensä jo sairaiksi, niin jäävät pois sen takia tai ovat tavallisesta terveempiä ja jäävät siksi pois,
[38:08] eivät katso hyötyvästä tässä tutkimuksessa mukanaolosta.
[38:11] niin silloin se ikään kuin vääristää sitä kohortin koostumusta ja harhauttaa.
[38:21] Puhutaan tämmöistä harhasta tai bias, englanniksi sillä termillä.
[38:27] Eli tämä sensurointi ikään kuin sääntö tai mekanismi, se pitää jotenkin hahmottaa
[38:31] ja sitten myöskin usein tehdään oletuksia siitä, että kuinka epäinformatiivista niin sanotusti se on.
[38:37] eli onko meillä tämmöinen vaara, että meillä tapahtuu tämmöistä valikoitumista siinä kohortin koostumuksessa aikaa myöten.
[38:48] Ja ehkä tämmöisiä asioita siinä osin kertauksena tuli vielä.
[Speaker 1]
[38:55] Toisesta vaiheesta nopeasti, eli kohorttitutkimuksesta.
[38:59] Kertoisitko sä aluksi ihan vaan, että mitä kohorttitutkimus tarkoittaa?
[Speaker 2]
[39:04] No nyt kohorttitutkimus oikeastaan ainakin itselleni tarkoittaa käytännössä samaa kuin elinaikahanalyysi kohde.
[39:14] Eli on puuttu jo paljon kohortista, joka on tämmöinen tutkimusjoukko, jota seurataan ajassa eteenpäin.
[39:21] Se kohorttihan, se on joku romalaisen legioinnin termi semmoisesta, en muista enää kuinka monta yksilöä tai sotilasta siihen kuuluu,
[39:29] mutta se oli semmoinen eteenpäin etenevä yksikkö.
[39:32] Siitä tulee tämä kohorttikäsite myös tähän tutkimukseen, että meillä on tutkimusyksilöitä, jotka ajassa etenevät eteenpäin, kunnes jotakin tapahtuu.
[39:44] Eli ne on seurantatutkimuksia, ja ne voi olla tämmöisiä prospektiivisia, jossa me lähdetään nyt liikkeelle ja aletaan seurata eteenpäin, tai sitten ne voidaan retrospektiivisesti,
[39:55] Eli taaksepäin ajassa kerätä, niin kuin tuossa otit esiin aikaisemmin.
[40:02] Ja se, mikä nyt ehkä sitten, jos nyt tässä saan ajatella ääneen,
[40:10] niin karakteerisoi koorttitutkimuksia.
[40:13] Terminä ehkä usein viittaa tämmöisiin suorastaan väestötason tutkimuksiinkin.
[40:19] Isompia juurikin, ehkä puhutaan rekisteripohjista koorttitutkimuksista juurikin silloin,
[40:24] kun ne on tietorekistereistä kerätty, mutta kyllä kohorttitutkimus voisi olla myös
[40:32] sanotaanko kliininen potilaskohortti, jota sitten tutkitaan jostakin tietystä
[40:38] kliinisestä tapahtumasta eteenpäin, että kyllä nekin menee tähän samaan kehikkoon.
[40:43] Ero on ehkä sitten, ei ehkä tässä termissä niinkään, mutta siitä, että miten näitä
[40:49] Sitten analysoidaan, mitä ehkä semmoinen rajatumpi kohortti, pienempi kohortti, selvempi ikään kuin lyhyempi aikajakso meillä on tutkittavana,
[41:01] niin sitä enemmän ollaan usein kiinnostuneita semmoisista ikään kuin yksilöiden välisestä vaihtelusta siinä elinaikataikestojakaumassa.
[41:09] Sitten taas väestötasolla ollaan usein kiinnostuneita keskimääräisistä vauhdeista tai keskimääräisistä ikään kuin uhista.
[41:18] Eli silloin voidaan tyypillisesti mallintaa paljon karkeammin, kun pysytään vain,
[41:23] että miten diabetesilmaantuvuus on vaihdellut vuosikymmenten mittaan eri-ikäisissä ja eri alueilla vaikkapa.
[41:34] Se tulee ehkä siitä karkeustasosta sitten se ero, että osin puhutaanko ihan tämmöisestä rajoitummista ongelmasta tai väestötason ongelmasta.
[41:45] Molemmat menisivät kohorttitutkimuksen ison keikon alle.
[Speaker 1]
[41:50] Voisi sanoa, että kaikki elinaikaanalyysitutkimukset ovat kohorttitutkimuksia,
[41:55] mutta ei välttämättä toisinpäin?
[Speaker 2]
[41:58] Varmaan voisi sanoa näin, jos hetken mietin.
[42:02] Nämä termit ovat hankalia sillä tavalla, että kun tiedetään nyt...
[42:07] Tiedätte ja lukijat tai kuulijatkin tietävät,
[42:13] että niitä ei ole hyvin hankalaa pitää puhtaina.
[42:17] Näitä on mahdottomia, että siinä mielessä näistä voi olla monta mieltä.
[42:24] Kylläkin.
[Speaker 1]
[42:25] Joo, mutta kyllä tämä varmasti kuulijoille tuli läpi nyt kuitenkin.
[42:31] Pääpointit kohorttitutkimuksista.
[42:33] Hei, kiitos paljon.
[42:35] Pystyisitkö vielä vähän tiivistämään tähän loppuun, että mitä toivoisit, että meidän kuuntelijat
[42:40] että muistaa tästä johdatuksesta elinaika-analyysiin ja kohorttitutkimuksiin?
[Speaker 2]
[42:45] Tämä on vaan hankala kysymys.
[42:50] Ehkä sen nyt, että elinaika-analyysia luonnehtii kestojen mallintaminen.
[42:58] Ja jos sinun tutkimusongelmasi on sellainen, että siinä on se kesto.
[43:04] Jonkun ajan kesto on keskiössä ja kiinnostuksen kohteena.
[43:08] tai se, mikä siihen vaikuttaa, mikä lyhentää keskimäärin niitä paranemisaikoja tai uudelleensairastumisaikoja tai pidentää niitä,
[43:21] niin silloin kannattaa kääntyä elinaika-analyysin puoleen, että se on ehkä se.
[43:27] Ja sitten toinen on se, että tässä tuli aika monta tämmöistä teknisempää asiaa, mutta tämä sensuroitumisen ongelma
[43:35] ja se, että meidän tieto, informaatio, tyypillisesti tällaisessa elinaikatutkimuksessa eli kohorttitutkimuksessa
[43:43] kertyy jollakin tavalla vajavaisesti.
[43:44] Siellä on aina jotakin puuttuvaa, että meille se sensuroituminen on tämmöinen puuttuvan tiedon ongelma
[43:51] esimerkiksi, ja näistä täytyy olla jonkun verran tietoinen ja sitten myöskin uskoa ja ymmärtää, että tietyn oletuksiin me voidaan tätä ottaa huomioon
[44:01] näitä puuttuvan tiedon ikään kuin ongelmilta tulee siitä, että me joudumme odottamaan, että tapahtumat sattuvat, jos sattuvat, tai että me otamme kiinni ihmisen seurantaan myöhemmin, kun oikeastaan aika on jo alkanut juosta.
[Speaker 1]
[44:17] Okei.
[44:18] Hei kiitos professori Kari Auronen, että jaoit meille osaamistasi.
[44:23] Ja kiitos sulle kuuntelija, ja toivottavasti tämä innostaa sinua opiskelemaan lisää tilastotieteestä.
[44:30] Toivottavasti kuullaan taas statistiikan aloilla.
[44:43] Tämän podcastin on tuottanut Turun yliopiston lääketieteellisen tiedekunnan biostatistiikan yksikkö.
Tässä Statistiikan aalloilla -jaksossa avataan edellisen jakson aihetta, eli tutkimusasetelmia ja tilastollisen testin valintaa esimerkkien kautta.
Tämän podcastin sisältö sopii erinomaisesti tutkijoille ja kaikille, jotka haluavat oppia tunnistamaan erityyppiset muuttujat sekä valitsemaan sopivan tilastollisen testin yksinkertaisissa tilanteissa. Tämän jakso liittyy Turun yliopiston lääketieteen, bio- ja hammaslääketieteen opiskelijoille pakolliseen Havainnoista päättelyyn -kurssiin. Kurssi on avoin kaikille DigiCampuksella, ja sieltä löytyy podcastissa mainittu analyysikartta.
[Speaker 0]
[00:06] Tervetuloa jälleen statistiikan aalloille.
[00:09] Olit sitten opiskelija, tutkija tai ihan muuten vaan kiinnostunut tilastotieteestä, niin hienoa, että sä oot kuulolla.
[00:15] Minä olen biostatistikko Markus Riskumäki, ja tänään mun kanssa studiossa on jälleen biostatistikko Elisa Löytyniemi Turun yliopiston biostatistiikan yksiköstä.
[00:24] Tervetuloa. [Speaker 1]
[00:26] Kiitos, kiitos, kiva olla taas täällä puhumassa näistä käytännön esimerkeistä. [00:29] Joo, jep.
[Speaker 0]
[00:31] Tosiaan tän päivän jakson Öö jatkoa tuolle aiemmalle jaksolle tilastollisen testin valinnasta, että tota Öö edellinen jakso meinasi mennä niin pitkäksi, että päätettiin nää käytännön esimerkit jättää sitten tälle vähän myöhemmälle.
[00:45] Öö eli tota tosiaan, jos et sitä ole kuunnellut vielä, niin suosittelen käymään kuuntelemassa sen ensimmäisen jakson, koska siinä käydään teoriaa vähän tarkemmin läpi, ja nyt tosiaan vähän sitten enemmän käytännön esimerkkejä siitä, että mikä testi kannattaa missäkin tilanteessa valita.
[01:02] Tää jakso sopii tietysti aivan kaikille, mutta varsinkin esim Öö lääketieteen, lääketieteellisen tiedekunnan opiskelijoille ja tutkijoille, joilla saattaa monesti olla vaikea hahmottaa, mitä testiä kannattaisi käyttää minkäkin tutkimuskysymyksen kanssa. [01:16] Öö mainintana vielä tässä vaiheessa, että jos sä oot enemmän semmoinen
visuaalinen oppija, niin esimerkiksi netistä löytyy hirveä määrä erilaisia analyysikarttoja testin valintaa helpottamaan, mutta jos sä haluat sellaisen suomeksi, niin sellainen löytyy esimerkiksi meidän havainnoista päättelyyn kaksi kurssin digikampus-alustalta.
[01:36] Ja hyvä uutinen on se, että digikampus on avoin ihan kaikille. [01:40] Joo,
[Speaker 1]
[01:40] sinne pääsee siis tietenkintunnareilla, mut sinne pääsee myöskin hakatunnareilla ja sinne pääsee myös Google-tilin kautta.
[01:47] Eli ei tarvita mitään kurssiavaimia eikä mitään sellaisia, vaan pääsee milloin tahansa kertaamaan tai oppimaan beostatistiikkaa.
[Speaker 0]
[01:56] Että jos semmoinen lisäoppiminen kiinnostaa, niin me laitetaan linkki tuolle avoimelle kurssille tän jakson kuvaukseen.
[02:02] Mutta minäkin sitten itse asiaan.
[02:05] Elikkä millaisia tota tilastollisia testejä pitäisi missäkin tapauksessa käyttää? [02:10] Joo,
[Speaker 1]
[02:10] mutta pitäisikö meidän tässä vaiheessa vielä kerrata ne oikeasti semmoiset neljä perusasiaa, Öö mitä me puhuttiin jo siellä teoriapuolella, mutta kerrataan vielä.
[02:20] Eli silloin kun lähdetään etsimään optimaalista analyys metodia, niin silloin sun pitää tunnistaa, mikä on sun tilastoyksikkö siinä sun datassa.
[02:28] Useinhan kliinisissä tutkimuksissa oli se yksi ihminen, mutta oli tiettyjä erikoistapauksia, että se voi joskus olla jopa silmä tai jotain muuta erikoisempaa. [02:37] ja Öö ja se on aina riippumatonta, eli toisesta ihmisestä mitatut arvot on riippumattomia toiseen.
[02:45] Mutta sitten jos me mitataankin samaa ihmistä toistuvasti, niin ne on riippuvia mittauksia, ja se meidän täytyy tunnistaa.
[02:52] Ja vastaavasti sitten jos meillä on vasteena eli meidän kiinnostuksen kohteena jatkuva muuttuja, numeerinen muuttuja, niin silloin meidän täytyy tutkailla, minkälainen jakauma sillä on.
[03:05] Ja Öö koska meillä kaikista tehokkaimmat testit saadaan siitä normaalijakaumasta Eli mikä on se symmetrinen kello, kellokäyrä tai kaus käyrä, niin Öö sitä vasten me tutkaillaan sitä jatkuvan muuttujan tota jakaumaa.
[03:20] Ja sit meidän täytyy tietenkin tunnistaa siitä, että mikä on se meidän kiinnostuksen kohteena oleva muuttuja ja millä muuttujilla eli tekijöillä me koitetaan selittää sen vasteen käyttäytymistä ja sen vaihtelua.
[03:33] Siitä lähtee Niinku kaikki tavallaan liikkeelle. [Speaker 0]
[03:36] Joo, eli kertauksena Öö edellisestä Öö jaksosta, eli ensin ennen kuin ruvetaan näitä testejä miettimään, niin sun pitäisi tietää tai ottaa selvää, että mikä sun tilastoyksikkö on, että onko se esimerkiksi ihminen tai vaikka silmä.
[03:53] Sen jälkeen sun pitää miettiä, että mikä sun vastemuuttuja on, eli se kiinnostuksen kohteena oleva muuttuja ja että onko se numeerinen, eli jatkuva.
[04:03] Eli voi saada periaatteesta nollasta äärettömään arvoja [Speaker 1]
[04:07] tai jopa negatiivisia arvoja. [Speaker 0]
[04:11] Tai sitten, vai onko se kategorinen, eli joku Niinku luokitteleva [Speaker 1]
[04:15] muuttuja.
[04:15] Niin esimerkiksi, että paran Öö tota murtuma vai eikö parantunut? [Speaker 0]
[04:20] Ja tämän jälkeen se tietysti, mihin kaikki tähtää tai haluaisivat tähdätä, on se, että kun tutkitaan tää jatkuvan muuttujan Öö jakaumaa, että nope- noudattaisiko se normaalijakaumaa, eli sitä semmoista tuttua kellokäyrää, koska silloin se on ikään kuin helpompi.
[Speaker 1]
[04:38] Tehokkaampi analysoida, voimakkaammat tilastolliset testit saadaan aikaiseksi. [Speaker 0]
[04:45] Mut joo, siinä oli pieni lyhyt kertaus viime jaksosta, mutta mennään nyt sitten tämän päivän asiaan.
[04:53] eli niiden tilastollisten testien valintaan esimerkkien kautta.
[04:57] Ja tota voitaisiin varmaan aloittaa metodien ehkä yksinkertaisemmasta päästä, eli otetaan nyt Öö vastemuuttujaksi jokin numeerinen muuttuja, eli jatkuva muuttuja ja verrataan sitä kahdessa eri ryhmässä.
[05:12] Minkäslaisia tutkimuskysymyksiä saattaisi olla tällaisessa tilanteessa kyseessä? [Speaker 1]
[05:16] No yksi esimerkki on semmoinen, että meillä oli noin tuhatkuusisataa aika iäkästä naista, Öö vähän yli kuusikymppisiä kaikki, Öö ja me haluttiin tutkia sitten, että Öö mitä Öö miten he Öö tässä tutkimusjoukossa eroaa ne, jotka syö D-vitamiin lisää verrattuna niihin, jotka eivät syö D-vitamiinilisää.
[05:38] Ja Öö näin meitä, meille muodostui tästä tutkimusjoukosta kaksi riippumatonta ryhmää, söi tai ei syönyt D-vitamiini lisää ja näitä ryhmiä me sitten haluttiin verrata, me haluttiin verrata myös niitten ikää, painoja, Öö kalsiumin syöntiä, Öö alkoholin käyttöä gramoissa.
[05:56] Ja näin meille muodostui kaksi riippumatonta ryhmää. [Speaker 0]
[06:01] Joo.
[06:02] Tällaisessa tilanteessa tosiaan, kuten aina jatkuvien muuttujien kanssa, ensin pitäisi testata, että onko se vastemuuttuja normaalisti jakautunut.
[06:10] Ja tässä tapauksessa molemmissa kahdessa ryhmässä.
[06:14] Jos se normaalisuus voidaan olettaa, niin silloin me valitaan niin sanottu parametrinen vaihtoehto, eli kahden otoksen T-testi.
[06:22] Tästäkin on olemassa itse asiassa kaksi eri versiota sen perusteella, että voidaanko näiden ryhmien välinen varianssi olettaa yhtä suureksi, mut ei mennä siihen nyt sen tarkemmin.
[06:32] Mutta sitten taas, jos vaste ei ollut normaalisti jakautunut, niin me valitaan epäparametrinen versio, eli Wilkoksonin ranksum testi, eli suomeksi vilkoksonin järjestyssummatesti.
[06:43] Juu,
[Speaker 1]
[06:43] ja tärkeintä tässä on oivaltaa se meidän tutkimuskysymys.
[06:47] Eli me halutaan kysyä sitä, että erosiko näiden kahden riippumattoman ryhmän keskiarvot tai sit mediaanit toisistaan, eli joko toisilla korkeampi keskiarvo kuin toisilla tai matalampi.
[07:00] Öö eli nimenomaan tämmöinen tasoero, Öö koska mehän mallinnetaan aina keskiarvoa tai mediaania Öö hyvin, hyvin usein, kun meillä on numeerinen vaste, eli tutkitaan keskimääräistä käyttäytymistä.
[07:15] Me ei voida koskaan Niinku analysoida yksilötasoa, vaan me mallinnetaan keskiarvokäyttäytymistä.
[07:22] Eli meidän tutkimuskysymys on se, oli tuossa äskeisessä esimerkissä, että onko niillä, Öö miten ne eroavat vai eroavatko ne, jotka syö D-vitamiinin lisää, niin, niin tota sitä me haluttiin selvittää.
[07:37] Öö Mutta kannattaa aina miettiä se, että mikä on se mun tutkimuskysymys ja sitä kautta lähteä sitten selvittämään sitä sopivaa analyysimetodia.
[07:46] Joo,
[Speaker 0]
[07:46] todellakin.
[07:47] Eli otetaan vielä Öö muistinkertaukseksi vielä kerran Eli jos vasteena on jatkuva muuttuja, jonka keskiarvoja tai mediaaneja me verrataan kahdessa eri ryhmässä, testiksi valitaan kahden otoksen T testi, jos se vaste on normaalisti jakautunut molemmissa ryhmissä.
[08:05] ja jos se taas ei oo normaalisti jakautunut, valitaan Wilkoksonin testi. [Speaker 1]
[08:09] Joo, ja joskus on puhetta siitä, että no mitäs sitten, jos se on normaalisti jakautunut toisessa ryhmässä, mut toisessa ei.
[08:17] Öö niin tota silloin myös valitaan aina se epäparametrin testi, eli mennään tavallaan Niinku turvallisella tiellä.
[08:24] Usein, jos me nähdään vaikka labbramuuttujissa kuitenkin tää niin sanottu vinojakauma, niin silloin Öö tää vinhous toteutuu yleensä molemmissa ryhmissä, niin silloinpa me tehdään niin eka, että me kokeillaan sopiiko siihen joku muunnos, eli me- kokeillaan usein neliöjuuri tai logaritmin muunnosta, joka sopii yllättävän usein tämmöisiin labramuuttujiin ja muunnoksen jälkeen se muuttuja onkin normaalisti jakautunut, ja sit me taas mennään tänne kahden riippumattoman otoksen T-testiä tekemään.
[Speaker 0]
[08:54] Eli semmoinen Öö vinolta näyttävä muuttuja, kun sille tehdään esimerkiksi tää logaritmunnos, niin se saattaakin siirtää niitä arvoja sitten kohti sitä keskipistettä, jolloin saadaankin vähän enemmän semmoinen kellokäyrän muotoinen jakauma.
[09:10] Jes.
[09:11] Sitten mennäänkin vähän hankalampaan tilanteeseen, eli vastenmuuttoja pysyy edelleen jatkuvana, mutta nyt vertailtavia ryhmiä onkin kolme tai enemmän.
[09:19] Olisiko sulla Öö siitä antaa esimerkkiä tutkimusasetelmasta, Elisa?
[Speaker 1]
[09:24] Joo, me tehtiin kanssa Öö toinen tosi iso tutkimus, jossa me kerättiin Öö tietoa, ja itse asiassa ne kävi mittauksissakin Öö kuntatyöntekijöitä, niitäkin oli yli tuhat.
[09:36] Öö ja me tutkittiin heidän esimerkiksi Öö tota elämänlaatua ja Öö ja myöskin tota työkykyä.
[09:45] Ja me haluttiin selvittää sitä, että vaikuttaako Öö onko yhteydessä esimerkiksi koulutustaso Öö kolmiluokkaisena, niin yhteydessä tähän elämänlaatuun tai työkykyyn. [10:00] Eli siinä on tyypillinen esimerkki, että taas ihminen voi olla koulutusasteessa vaan yhdessä Öö luokassa, ja e- ei muodostui kolme riippumatonta ryhmää, ja me haluttiin tutkia yhteyttä numeeriseen elämänlaatu, tämmöiseen total scoreen eli kokonais- Öö tota muuttujaan.
[Speaker 0]
[10:19] Joo, mullakin tulee mieleen yksi tutkimus, jossa mä olin mukana, jossa haluttiin tutkia Öö äidin lihavuuden yhteyttä erilaisiin synnytykseen vaikuttaviin muuttujiin, että tässä esimerkkinä olisi sitten ollut, että tää selittävä tekijä oli tämmöinen äidin BMI luokka, joka oli jaettu muistaakseni neljään eri luokkaan ja tota sitten vasteena tosiaan oli joko jotain esimerkiksi raskauden kesto tai lapsen syntymäpaino.
[Speaker 1]
[10:47] Juu, just näin.
[10:48] Ja sit tyypillinen esimerkki lääketeollisuudesta sit taas on kaikki annosvastetutkimukset Eli niissä meillä on usein mukana lumelääkeryhmä eli placebo, sitten meillä on vaikka kymmenen ja viisikymmentä milligrammaa ja me oikeasti ollaan siinä vaiheessa meidän lääketutkimusta, että me halutaan etsiä vaan pienintä tehokkainta annosta.
[11:07] Mikään muu ei meitä kiinnosta kuin se pienin tehokkain annos.
[11:11] Öö koska useinhan aina kun annoskoko kasvaa, niin haitatkin kasvaa.
[11:16] Ja tämmöisessä voisi olla ihan hyvin esimerkkinä, että se meidän vastenmuuttuja olisi vaikka luun tiheys, joka on mitattu sitten tutkimuksen lopussa ja me halutaan verrata näitä kolmeen ryhmään Öö siinä tapauksessa.
[Speaker 0]
[11:30] OK, eli nyt meillä oli tosiaan käsittelyssä tämmöinen tilanne, missä vastenmuuttaja on edelleen Öö numeerinen eli jatkuva, mutta nyt sitä verrataankin Öö kolmessa ryhmässä tai useammassa ryhmässä.
[11:42] Ja tota tällaisessa tapauksessa jälleen kerran aloitetaan sen vasteen normaalisuuden tarkastelussa kaikissa ryhmissä, Öö joka pitää tosiaan muistaa.
[11:52] Öö Jos se normaalisuus voidaan olettaa, niin me valitaan taas parametrinen testi, eli tässä tapauksessa yksisuuntainen varianssianalyysi, lyhennettynä one way anova englanniksi.
[12:02] Jälleen tästäkin on olemassa tarkempi jako vielä varianssien yhtä suuruuksien mukaan.
[12:07] jos variansseja taas ei voida olettaa yhtään s- suuriksi, niin meidän pitäisi valita semmoinen kuin Welshin testi.
[12:13] Ja jälleen, jos tää vaste ei ollut alun alkaenkaan normaalisti jakautunut kaikissa ryhmissä, niin me valitaan sitten testin epäparametrinen versio, eli tässä tapauksessa Cuscal Wallisin testi.
[Speaker 1]
[12:24] Joo, pari ehkä semmoista pientä huomiota voisi tässä väliin kanssa sanoa, että totta kai tää One way ja Cusc wallis- testi toimii myös kahden ryhmän vertailuun, mutta aika usein sitten kuitenkin julkaisussakin näkee, että ollaan käytetty silloin T-testiä tai testiä, Mutta toimii kyllä niin, toisinpäin ei toimi.
[12:43] Ja sitten taas Öö hirveän usein mä näen sitä, että Öö opiskelija tai tutkija ahdistuu siitä, että mulla on neljä viisi ryhmää ja yhdessä näyttää siltä, että se normaalisuus ei toteudu ja muissa se toteutuu.
[12:57] Mut siinä tota Öö ensimmäinen asia, mihin kannattaa kiinnittää huomiota, että onko se joku ääriryhmä esimerkiksi se Öö vitosryhmä tosi pieni, että jos sulla on siellä viimeisessä ryhmässä viisi tai seitsemän henkeä, niin siitä on tosi tosi vaikea tutkia edes sitä normaalisuutta.
[13:14] Öö eli kannattaa miettiä myös, että onko mitään kliinisiä perusteita siitä, että joku Öö ryhmä olisi hyvin erilainen.
[13:22] Ja useimmiten, mä en oo ainakaan keksinyt montaa muuttujaa, missä olisi perusteltua ajatella, että se jakauma oikeasti olisi erilainen.
[13:30] Ja niinhän usein Öö tehdäänkin myös myös sen tilastollisen voimakkuuden takia, että jos joku ryhmä on tosi pieni, niin se yhdistetään johonkin vierekkäiseen kategoriaan tai
[Speaker 0]
[13:40] luokkaan.
[13:41] Joo, toi oli itse asiassa todella hyvä huomio ja itse asiassa nyt muistinkin tosta, että tässä just itse kerroin aiemmin tästä tän esimerkin tota äidin lihavuuden vaikuttavuudesta. [13:53] missä tää tota selittävä tekijä, eli BMI luokka oli jaettu neljään luokkaan, niin muistaakseni se tässä oli käynyt nimenomaan näin, että siinä oli alun perin viides luokka, joka ei ollut normaalisti jakautunut, mutta siellä oli tyyliin kaksi ja sitten kun se vaan liitettiin nelosluokkaan, niin yhtäkkiä kaikki toimii.
[Speaker 1]
[14:11] Body index luokassa on useimmiten niin, että mikä tahansa aineisto, mistä mä oon nähnyt, niin alipainoisia on äärimmäisen vähän, eli niitä on korkeintaan kourallinen, tuskin yleensä ei sitäkään, niin yleensä se aina yhdistetäänkin Öö hyvin usein siihen seuraavaan luokkaan.
[14:27] Ja vastaavasti sitten taas niitä hyvin ylipainoisia voi olla tosi tosi vähän ja ne yhdistetään sitten siihen ylipainosluokkaan.
[14:34] Ennen sitä yhdistämistä mä kuitenkin aina katson siitä datasta, että siitä yhdistämisestä ei ole mitään hallaa sille datalle, et me ei menetetä mitään tärkeätä tarinaa sillä yhdistämisellä.
[Speaker 0]
[14:45] Kyllä.
[14:46] Mutta joo, eli kertauksena vielä, tällaisessa tilanteessa, kun vastemuuttaja on jatkuva ja verrattavia luokkia on kolme tai enemmän, niin Jälleen aluksi katsotaan, että onko se vaste normaalisti jakautunut kaikissa vertailtavissa ryhmissä, ja sitten me valitaan testiksi yksisuuntainen varianssi analyysi, eli anova, jos se on normaalisti jakautunut ja muuten krusalvallisin testi.
[Speaker 1]
[15:11] Sitten tota tähän pitää vielä sanoa sitten, että Öö pitää muistuttaa, että tää Öö varianssianalyysi ja Cuscal valisin testi, sehän antaa vaan sen päätuloksen, että joku eroaa jostakin, jos me saadaan merkitsevä tulos, eli P alle nolla pilkku nolla viisi.
[15:27] Ja jos me saadaan tää päätulos merkitseväksi, niin meidän täytyy tietenkin selvittää, että no mikä siellä sitten erosi mistäkin ryhmästä.
[15:35] Öö jolloin me tehdään niin sanottuja monivertailuja ja niissä monivertailuissa tarvitsee aina muistaa se, että hyvän tavan mukaisesti me sitten ryhdytään korjaamaan niitä P arvoja, jotta me ei tehtäisi virhetulkintoja liian herkästi ja Öö ja yleisimmät metodit on Niinku käyttää tukeen korjausta tai sitten Öö Sel Din korjausta siellä Calvisin puolella.
[Speaker 0]
[16:00] No sitten, mitäs meillä ei olekaan luokittelua ollenkaan, vaan me verrataan kahta numeerista muuttujaa keskenään.
[Speaker 1]
[16:08] Joo, Niinku mä äsken sanoin, niin me verrattiin keskiarvotasoja tai mediaanitasoja, mut nyt jos meillä onkin kaksi jatkuvaa numeerista muuttujaa, niin me tutkitaankin niiden välistä yhteyttä.
[16:19] Ja silloin kun meillä on kaksi numeerista muuttujaa, niin me yleisesti ottaen puhutaan aina korrelaatiosta niin julkaisuissa kuin missä tahansa muuallakin.
[16:29] Onko ne kaksi numeerista muuttujaa yhteydessä toisiinsa?
[16:33] Öö siinä samassa D-vitamiinijutussa me haluttiin tosiaan myös tutkia sitä, että korreloiko tää D-vitamiini Öö tasot siellä v- veressä, Niinku esimerkiksi seerumin PTH Öö tota arvoihin, jotka on myös tämmöisiä luuapramuuttujia tai lapramuuttujia.
[16:53] Ja tota ja tää tutkitaan yleensä just korrelaation avulla.
[16:58] Ja korrelaatioitahan Niinku mitataan hyvin hyvin paljon, jotkut julkaisut tuntuu olevan Niinku tosi täynnä korrelaatioita, että niitä oikeasti Öö tota lasketaan melkeinpä satoja per tutkimus ja niistä Usein piirretäänkin semmoinen heat map, jossa Öö vaan väreillä kuvataan, että minkä muuttujien välillä on Niinku voimakas korrelaatio ja Öö minkä muuttujan suhteenhan se korrelaatio on sitten lievä, tai sitä ei ole ollenkaan, tai heikko tai lievä tai ei ollenkaan.
[17:25] Öö ja tarvitsee muistaa, että korrelaatiohan voi saada mitä tahansa arvoja miinus ykkösestä ykköseen.
[17:31] Eli myös on se negatiivinen korrelaatio, ja sitten on positiivinen korrelaatio.
[Speaker 0]
[17:36] Joo.
[17:37] Ja tota tässä kahden numeerisen muuttujan tapauksessa on myös tärkeää huomata se, että toisin kuin tota esimerkiksi noissa aiemmin käydyissä luokkavertailuissa, niin nythän me ei eroteta selkeästi vastetta ja tekijää toisistaan, vaan me vaan verrataan muuttujia ikään kuin samalta viivalta.
[Speaker 1]
[17:54] tutkitaan Niinku kahden muuttujan välistä yhteyttä ihan puhtaasti. [Speaker 0]
[17:58] Mutta tässäkin tapauksessa, kun jatkuvista muuttujista puhutaan, niin tuttuun tapaan ensiksi pitää testata, että onko ne muuttujat normaalisti jakautuneita, jonka perusteella me o- osataan sit valita oikea korrelaatio.
[18:11] Jos molemmat muuttujat on normaalisti jakautuneita, niitä verrataan Perssonin korrelaatiolla, muuten spermanin korrelaatiolla.
[Speaker 1]
[18:21] Joo, ja sitten Pissa on vielä se, että se tutkii nimenomaan lineaarista yhteyttä, eli se ei pysty ollenkaan havaitsemaan, jos on niin sanottu monotoninen yhteys, eli semmoinen Niinku vähän Niinku käyrämäisempi yhteys, eli se tutkii tämmöistä funktio- Niinku suoran muotoista yhteyttä.
[Speaker 0]
[18:37] Jep, Mutta, hei, mitäs sitten, jos se toinen muuttujista on sit kumminkin selkeästi mielenkiinnon kohteena.
[18:44] Eli me halutaan tehdä jako vasteen ja tekijän välillä, vaikka meillä onkin kaksi jatkuvaa muuttujaa.
[Speaker 1]
[18:49] Joo, hyvä kysymys ja myös sitä, että jos se korrelaatio, korrelaation tuloksenahan tulee nimenomaan se korrelaatiokerroin, että sä saat vaan tiedon siitä voimakkuudesta, mutta sä et saa vielä tietoa muusta ja hirveän useinhan meillä on mielenkiinnon kohteena se, että minkälainen se yhteys sitten on.
[19:07] Ja jos me nyt ajatellaan, että me haluttaisiin tutkia vaikka Öö kokonaiskolesterolin tai LDL n yhteyttä body mass indeksiin, niin me halutaan kuvailla sitä tarkemmin, että se korrelaatiokerroin ei sit enää Niinku riitä, niin silloin me ryhdytään käyttämään lineaarista regressiota, eli me oikeasti sovitetaan siihen lineaarinen suora siihen, käytännössä katsoen siihen sirontakuvaan, mikä usein näistä piirretään ja silloin me saadaan se suoran yhtälö. [19:36] Öö jossa nimenomaan me ollaan käytännössä katsoen kiinnostuneita siitä kulmakertoimesta.
[19:42] Se kulmakertoimen suuntahan kertoo taas, että minkälainen se yhteys on negatiivinen vai positiivinen, mut se kertoo myös sen, että OK, jos henkilö pystyy pudottamaan Pass indeksiä jonkun yksikön verran, niin kuinka paljon hänen keskimäärin esimerkiksi se kokonaiskolesteroli muuttuu, jolla on suora tulkinta esimerkiksi tavallaan, että sä voisit sanoa seuraavalle potilaalle, että mitä keskimäärin tapahtuu, jos sä pystyt tekemään tätä ja tätä muutosta.
[Speaker 0]
[20:10] Joo, eli oikeastaan vaikka tosiaan lineaarinen regressio kyllä kuulostaa tietysti pelottavalta ja hienolta, niin pohjimmiltaan tässä on tosiaan kyseessä vähän semmoinen yläastematikan tilanne, että Y on KX plus
[Speaker 1]
[20:26] C.
[20:26] Joo, joo, on on, mutta sit kun sulla on oikea data kysymyksessä, niin sulla on aina vaihtelua, että se Öö ainakin mun lukion matikassa tehtiin vielä näitä suoria, jotka meni täydellisesti niitten muutaman pisteen läpi, ja meillä ei koskaan sellaista tilannetta ole, mutta hyvin hyvin käytännössä katsoen meillä on vaan se Öö satunnaisuus siellä mukana Niinku kun me päästään tälle tasolle.
[Speaker 0]
[20:50] Joo, eli voitaisiin vielä kertauksena sanoa, että jos esimerkiksi kahta numeerista muuttujaa verrataan keskenään siten, että nyt meillä on selkeä jako vasteen ja tekijän välillä, niin oikea testi on lineaarinen regressio.
[Speaker 1]
[21:05] Juu, ja siinä me saadaan myöskin paljon tietoa siitä, että kuinka hyvä se malli on selitysasteen avulla, et kuinka paljon me siitä datasta olevasta vaihtelusta pystytään selittämään.
[21:14] Se on myös hyvin mielenkiintoinen asia, mutta täytyy olla realisti, että kun me tutkitaan vaikeita Öö ilmiöitä, Öö niin se selitysasteet ei ole kovin korkeita.
[21:26] Mut sitten me voitaisiin myös keskustella siitä, että on paljon just niitä asioita, mitä äskenkin viitattiin, eli vaikka älykkyys ja kompetenssi ja työpaikan ilmapiiri, mitä taaskaan ei pystytä mittaamaan Niinku suoraan ihmisiltä, vaan me käytetään siihen tota kyselyjä. [21:43] Ja näin me saadaan tämmöistä epäsi suoraa tietoa siitä, mitä me oikeasti halutaan Niinku tutkia, niin siihen esimerkiksi tämmöinen Öö tilastollinen analyysi, mitä ei tietenkään millään peruskursseilla käydä läpi, on faktorianalyysi.
[21:58] Öö ja sitä käytetään paljon kyselyiden kehittämisen osalta myöskin. [22:03] Ja tota ja se pohjautuu myöskin Niinku Öö korrelaatioiden tutkimiseen.
[22:09] Ja tota eli tavallaan Öö etsitään siitä datasta semmoisia joukko muuttujia, jotka korreloi vahvasti keskenään, mutta ne eikä korreloikaan niitten toisten kysymysten kanssa, ja nää Niinku muodostaa tämmöiset muuttujaklimpit voi vai miten muuttujajoukot, jotka korreloi keskenään, niin ne muodostaa sitten niin sanottuja faktoreita, ja sitten me keksitään niille faktoreille se- selventäviä Niinku otsikkonimiä.
[22:36] Ja ja tota ja tässä on esimerkkinä Öö kun me tehtiin YTHS ssä on tehty paljon näitä tutkimuksia, niin me ollaan julkaistukin semmoinen juttu, että mikä opiskelijoita liikuttaa. [22:48] Eli meillä oli Öö yli kolmekymmentä kysymystä opiskelijoilta, että miksi liikut, että Öö onko sen tota, onko sulle tärkeätä uusien taitojen oppiminen vai lihasmassan ja voiman hankinta.
[23:01] Tämmöisillä me sitten muodostettiin, että oikeasti kun me Öö yhdisteltiin korrelaatioiden avulla näitä Öö kysymyksiä, niin meille kävi selvästi Öö selville, että tämmöisiä faktoreita oli kun jonkulle merkitsi terveys ja kunto, toiselle trendikkyys ja status, kolmannelle virkistys ja rentoutuminen, ja näin me saatiin hahmoteltua siitä isosta kysymyssetistä, tiivistettyä sitä tietoa tämmöisiin Öö niin sanottuihin faktoreihin.
[23:30] Ja Öö myös tätä käytetään paljon siinä, kun me kyselyin, että kehitetään Et sit me huomataan, että siellä on joku kysymys, joka ei Niinku liity toisiin kysymyksiin oikein millään lailla, ja se me voidaan tässä kehitysvaiheessa sitten tiputtaa pois.
[23:43] Et sitä ei nyt enää sitten seuraavassa kehitysvaiheessa tähän kyselyyn sitten kuulu. [Speaker 0]
[23:49] Joo mullakin tuli itse asiassa Öö esimerkki omalta työuralta mieleen tästä, että tota, tota hyvin samanlaista analyysiä tehtiin, mutta me selvitettiin siinä tota, että.
[24:03] tämmöisten Niinku pienten lasten vanhemmat oli tehnyt tota pitänyt Öö, ruokapäiväkirjaa, että mitä kaikkea ne on syöttänyt niille lapsille ja sitten jonkun varmaan tekoälysovelluksen kautta sitten laskettiin kaikkia vitamiinien määriä niistä ja semmoisista ja tota.
[24:19] Sit siinä oli myös semmoisia elämänlaatukysymyksiä muistaakseni, ja niistä tota sitten pikkuhiljaa sitä kysymyspatteristoa Niinku pienennettiin ja pienennettiin, kunnes saatiin semmoinen optimaali.
[24:31] mittaria aikaiseksi, että mitä tota, mitä niiden vanhempien pitäisi syöttää lapsilleen, että he Niinku voivat kaikista parhaiten.
[Speaker 1]
[24:40] Joo, täällä tehdään paljon väitöskirjatutkimuksia, missä nimenomaan kyselyjä kehitetään.
[24:45] Ja sitten erilaisia korrelaatioanalyyseja käytetään myös siihen, että katsotaankin Öö mitkä ihmisjoukot siellä korreloi ja koitetaan jakaa ihmisiä joihinkin ryhmiin.
[24:56] Sitäkin tehdään paljon ja kaikki perustuu just näihin yhteyksiin eli korrelaatioihin. [Speaker 0]
[25:03] Nyt me ollaan käyty läpi kaikenlaisia testejä numeerisille eli jatkuville vasteille. [25:09] Mutta tota mitäs sitten, kun verrataan kategorisia muuttujia keskenään?
[Speaker 1]
[25:13] No sit me tarvitaan taas tietenkin ihan omat testit, koska eihän me voida mitään normaalijakaumaa tietenkään Öö tutkia, että lonkkamurtuma kyllä ei, ei ei, ei todellakaan, vaan silloin me tu- tunnistetaan, että meidän OK, Öö meidän vaste on kategorinen ja Öö usein meidän tekijätkin on kategorisia, niin silloin ne on esimerkiksi näin, että että siinä mu-
D-vitamiinitutkimuksessa, niin me verrattiin sitä, että Öö tupakoiko Öö nää henkilöt, jotka käyttää D-vitamiinia Öö enemmän tai vähemmän verrattuna niihin, jotka ei käyttänyt
D-vitamiinia.
[25:51] Eli me tutkitaan tällaisia eroja, me voidaan hyvin tutkia myös jossain tutkimusjoukossa ja miesten ja naisten välillä, että onko tupakoinnin osuuksissa eroa. [26:01] Öö tai sitten me ollaan tutkittu myöskin haavan paranemisia, haavan komplikaatioita, onko niissä Öö eroa tupakoinnin ja ei-tupakoivien suhteen, miesten ja naisten välillä eroa, eli tän tyyppisiä esimerkkejä.
[26:16] Näissä mä kaikissa mainitsin eron.
[26:18] Hyvin tyypillinen on myöskin Öö YTHS llä tehdään myös näitä tutkimuksia, joissa me tutkitaan että särkeekö niiden päätä, Öö onko päänsärkyä enemmän niillä, joilla on myöskin vaikka hartiakipuja.
[26:33] Eli tutkitaan kahden selvästi Niinku Öö tavallaan vasten välistä yhteyttä. [26:38] Me ei puhuta silloin koskaan kuitenkaan korrelaatiosta, me puhutaan Niinku yhteyksistä tai assosiaatioista.
[Speaker 0]
[26:45] pieniä tota välihuomio voisi tähän väliin.
[26:48] Moni kuuntelija varmaan tietääkin, mutta jos et satu tietämään. [26:51] Tässä on monesti mainittu YTHS.
[26:53] Siinä on.
[26:54] Se on siis tota ylioppilaiden terveydenhoitosäätiö,, joka on siis korkeakouluopiskelijoiden tämmöinen.
[27:00] terveydenhoitopalvelu.
[27:03] Joo, Eli tosiaan tota vähän Niinku Elisa jo kerkesi sanoakin, niin kahden kategorisen muuttajan tapauksessa me ei voida testata sitä normaalisuutta,, joten meidän pitää tätä asiaa ajatella hieman eri kantilta.
[27:16] tällainen vaste tekijä ajattelun sijaan me tutkitaan muuttujien yhteyttä tai esimerkiksi ryhmien välisiä eroja.
[27:23] Ja mitä tää käytännössä sit tapahtuu, on, että näistä kategorisista muuttujista me tehdään frekvenssitaulukko, josta nähdään kaikkien luokkayhdistelmien lukumäärät, eli frekvenssit.
[27:35] Ja tota sit tän jälkeen me tehdään joko parametrinen ki neliötesti, jolla on Öö vähän tämmöiset tiukemmat kriteerit, mutta onneksi kaikki tota tilasto-ohjelmat, millä sä yrität tehdä näitä testejä, niin ne kyllä sitten herjaavat sulle, jos ne Öö Oletukset ei täyty.
[27:56] Niin jos oletukset ei täyty, ja tällaisessa tapauksessa pitää sitten käyttää sitä epäbarametrista versiota, joka on Fisherin tarkka testi.
[Speaker 1]
[28:04] Ja Fisherin tarkka testihän on aina ihan täydellinen testi, eli sen voi tehdä aina, mäkin usein teen julkaisuihin pelkkää Fisherin eksaktia testiä.
[28:14] Öö ja tota mutta sit täytyy havaita, että jos käyttää suuria frekvenssitaulukoita ja jos sulla on semmoinen data, et sulla tulee vaikka viisi kertaa viisi frekvenssitaulu, niin ajoajat esimerkiksi näillä valikkopohjaisilla ohjelmilla voi olla tosi pitkät, ne voi olla tunteja, ne voi olla jopa päiviä.
[28:31] Mun pisin on ollut oikeasti viikko ja viikon se kone ruksutti ja sit se syötti tota tuloksen viikon jälkeen.
[28:40] Eli pitää varautua sitten siihen, Öö mut senkin takia aika usein niitä Öö luokkia yhdistellään, niin kuin oli äsken puhetta.
[28:47] Ja Öö sit me voidaan tässäkin vaiheessa jo, Öö jos meillä on binäärivaste, eli Öö just tämmöinen, että lonkkamurtuma kyllä ei, kaksiluokkainen, kaksi luokkaa kategoriaa tässä muuttujassa vasteessa, niin me voidaan aloittaa tehdä logistista regressiota, johon me ei myöskään Öö peruskursseilla Niinku ehditä menemään.
[29:07] Öö Sit on pari semmoista erikoistapausta oikeasti, minkä mä haluaisin Niinku mainita, Öö mitä aika harva tutkijakaan Niinku on kuullut, ja samoin ei Öö usein peruskursseilla ehdi käydä läpi, niin Öö jos meillä se toinen muuttuja on Niinku tämmöinen ordinaaliasteikollinen, eli meillä on kategorioita, jolla on järjestys, niin silloin meillä on myöskin erikoisanalyysejä, analyysimetodi olemassa.
[29:33] Eli esimerkiksi semmoinen, että Öö me tutkittiin korona-aikaan yhden lääkkeen auttavaa Öö vaikutusta verrattuna siten sitä apulääkettä ei anneta.
[29:46] Ja meillä oli Öö vastenmuuttujina tämmöinen kliininen status, joka oli arvot ykkösestä seiskaan.
[29:53] Ykkönen oli se, että pä- oli päässyt kotiin ja oli ihan normaalissa kunnossa tai Öö mis- Öö parantunut siis kokonaan ja sit seiska oli se, että oli kuollut.
[30:04] Ja, ja tota tää mitattiin sitten Niinku kuukauden kuluttua siitä Öö sairaalaan tulosta. [30:11] Ja, ja tota tässä me voidaan kuitenkin tutkia näitä vaikka kahden ryhmän välistä eroa niin, että onko siellä tämmöistä siirtymää.
[30:19] Vähän samalla tavalla kuin mu- jakaumien Öö siirtymää me tu- tutkitaan siellä keskiarvo ja mediaanipuolella, niin tavallaan, että onko niin, jotka eivät saaneet tätä Öö apulääkettä, niin onko ne Niinku heikommassa hapessa sitten kuukauden päästä.
[30:34] niin siihen on olemassa ihan tämmöinen erikoistesti kuin Kokran Armitas trenditesti ja se on hirveän käyttökelpoinen, koska meillä mitataan kliinise- kliinisessä maailmassa aika paljon ykkösestä vitoseen, jollain likertas asteikolla asioita, tai tässä meidän kliininen status oli ykkösestä seiskaan, että se on tosi hyödyllinen myös tunnistaa, että tämmöinenkin testi on olemassa.
[30:56] No sit meillä on usein tehdään myös näitä niin sanottuja crossover design Öö tutkimuksia, eli vaihtovuorot Öö tutkimus, jossa esimerkiksi, jos meillä on kaksi periodinen crossover tutkimus, niin kaikki tutkittavat käy sekä lääkkeen vaikka A ja lääkkeen B, mut me satunnaistetaan se järjestys, että osa käy järjestyksessä A B ja osa käy B A.
[31:17] Ja Öö se on hirveän tehokas Öö tutkimusasetelma, koska me nimenomaan päästään sen subjektin sisäiseen vaihteluun, mistä me kohta puhutaan niiden muutoksienkin yhteydessä.
[31:30] Ja silloin kun me tutkitaan lääkettä, niin meitä tietenkin kiinnostaa, että tuliko sillä lääkkeellä A ja tuliko sitten lääkkeellä B haittatapahtuma vai ei.
[31:40] Ja me halutaan tätä verrata.
[31:42] Mutta nyt kun meillä on sitten samalta henkilöltä mitattu kaksi periodia, kaksi arvoa, niin me voidaan tehdä frekvenssitaulukko jossa meillä on kummastakin muuttujasta sitten tää kyllä ei, niin siihen sopii sitten taas McNarin testi.
[31:56] Eli jos on mitattu kahdessa aikapisteessä jotakin samaa asiaa, niin voidaan tutkia tätä, että onko näitten lääkevaikutus, haittatapahtumat erilaisia Öö Ala ja Bllä.
[32:09] Ja sitten on vielä paljon paljon lisää näitä erikoisuustestejä, eri- erilaisia testejä, erilaisiin tilanteisiin, myös kategoristen muuttujien tilanteessa.
[Speaker 0]
[32:21] Joo, tossa kun sä puhuit tästä McNamarin testissä, niin sä mainitsitkin, että siinä on tota kaksi aikapistettä, niin siitä tuli nyt sitten aika orgaanisesti tää meidän seuraava aihe, tota alustettua sitten, että mikä on aika yleinen ainakin lääketieteellisessä tutkimuksessa, että ei olla ikään kuin yhdessä pisteessä ajassa, vaan jotain seurataan Niinku Öö tehdään monta mittausta ajan
[Speaker 1]
[32:47] mittaan.
[32:47] No todellakin, että kaikki käytännössä k prospektiiviset tutkimukset, Öö varsinkin lääketutkimukset, melkein aina prospektiivisia tutkimuksia, niin tehdään mittauksia yli ajan. [32:59] Öö ja Öö siinä nimenomaan taas, muistatko sä, kun puhuttiin aluksi siitä, että meidän täytyy tunnistaa, mikä on riippuvaa ja mikä on riippumatonta, niin nimenomaan näissä aikapisteissä tarvitsee tunnistaa, että ne on nyt riippuvia mittauksia.
[33:14] Ja yleisesti ottaen aina, kun me tehdään Niinku prospektiivistä tutkimusta, meitä kiinnostaa se muutos, varsinkin jos meillä on joku interventio, niin me halutaan verrata myöskin niitä muutoksia.
[33:26] Mutta meillä oli myös yksi semmoinen tosi tosi iso, me tehtiin Euroopan laajuinen Öö Proc tutkimus Öö eka Öö ekassa pisteessä nää oli juuri valmistumassa sairaanhoitajiksi ja sitten me tehtiin kahden vuoden päästä tämmöinen Niinku seurantapiste, jolloin me kyselyllä samoilta ihmisiltä kysyttiin että Öö erilaisilla kyselyillä, että mikä on heidän kompetenssi eli pätevyys siinä kohtaa, ja me haluttiin nimenomaan tutkia sitä, että miten se on muuttunut Öö kahden vuoden aikana tää pätevyyden kokemus näillä sairaanhoitajilla, ihan uunituoreilla sairaanhoitajilla.
[34:04] Ja Öö siihenhän sitten taas se, että me taas Öö lasketaan se muutosmuuttuja Ja me taas tutkitaan se muutosmuuttujan, noudattaako se muutosmuuttujan normaalisuutta, Öö normaalijakaumaa vai ei.
[34:18] Ja sitä Öö vasten me sitten voidaan tehdä joko parittainen testi tai vilkok on sign drank testi, eli Niinku huomaat, niin näissä nimissä pitää olla hirveän tä- tarkka, kun nää samat ihmiset on kehittänyt Öö sekä testejä riippumattomia ryhmiä ha- Öö tota vertailuun, että sitten riippuviin Niinku aikapistevertailuihin.
[Speaker 0]
[34:38] Joo.
[34:38] Ja Öö tosiaan vielä tarkennuksena tossa sun äskeisestä puheenvuorosta, että tää Niinku muutos muuttui ja sehän tarkoittaa siis sitä, että kun meillä on kaksi näitä aikapistettä, joista on nyt Niinku jotain arvoa mitattu esimerkiksi sitä omaa kokemusta, kompetenssista, joku numero, niin otetaan se jälkimmäinen numero ja miinustetaan siitä se ensimmäinen numero ja siitä saadaan se muutosnumero sille henkilölle.
[Speaker 1]
[35:04] Näin me saadaan sen muutoksen etumerkki heti Niinku järkeväks.
[35:09] Ja tota, mutta tää Öö tavallaan prospektiivisissä tutkimuksissa niin laajenee heti, että me halutaan tietää, onko tää muutos erilaisten ryhmien välillä.
[35:19] Nonii, me palataan taas siihen kahden otoksen T testiin tai one way an vaan Niinku tuolta alusta, mutta sitten meillä on hyvin hyvin paljon tutkimuksia, jossa me mitataankin useampi aikapiste, niin äsken mainitut analyysimetodit ei enää taas toimi.
[35:36] Öö vaan sitten me joudutaan menemään monimutkaisempiin analyysimetodeihin. [35:40] Öö Hirveän hyödyllistä monessa kliinisessä tutkimuksessa on, että meillä on vähintään kolme aikapistettä, jossa me saadaan selville sen Öö muutoksen Niinku mm tarkempi tää Öö muoto.
[35:55] Eli me puhutaan usein keskiarvo tai mediaanikäyristä, et me nähdään, miten se muuttuu eka nopeasti Niinku siinä alkuvaiheessa, entäs sitten pidemmällä tähtäimellä. [36:04] Eli hyötyä on siitä, että meillä on ainakin kolme aikapistettä.
[36:08] Eli aluksi Öö tämmöisissä, Öö kun meillä on useamman aikapisteen Öö data ja meillä on nimenomaan taas vaste on tämmöinen jatkuva numeerinen muuttuja, niin me eka alustavasti katsotaan se, että näyttääkö siltä, että se vaste on normaalisti jakautunut. [36:24] Ja jos se näyttää siltä alustavassa tarkastelussa, niin me sitten se Öö siihen sovitetaan tämmöistä lineaarista sekamallia, englanniksi mä ainakin kirjoitan julkaisuihin linear mixed models for repeated measurements.
[36:39] Ja mm ja se ottaa nimenomaan huomioon sen korrelaation aikapisteiden välillä, eli nimenomaan huomioi sen, että siitä yhdeltä subjektilta on useampi mittaus.
[36:52] Ja Öö tää metodi on nykyisin aika kiva siinä, että se sallii myös, että sieltä joitakin arvoja puuttuu, että jos henkilö nyt on ollut Havaijilla tai hiihtolomalla, niin se ei haittaa, hän pääsee niiltä kaikilta aikapis- muilta aikapisteiltään myös mukaan tähän malliin.
[37:10] Ja Öö sit jos se vaste näyttää todella pahalta, eli ei ei ole lähelläkään normaalijakaumaa, ei edes sen muunnoksen jälkeen, niin silloin ainoa epäparametrinen vastine, meillä on tämmöinen Friedmanin testi, jossa me voidaan ainoastaan tutkia sitä Öö aikamuutosta Öö jonkun vaikka ryhmän sisällä.
[37:30] Ja sitten tota tästä täytyy kohtaa sanoa se, minkä takia mä puhun nyt alustavasta Niinku vasteen normaalisuuden tutkimisesta, että ihan aidon oikeasti, niin Öö me Öö nää analyysin metodit vaatii sen, että niin sanotut jäännökset on normaalisti jakautuneet. [37:49] Ja jäännös tarkoittaa se, että mitä jää siltä mallilta selittämättä, jää Niinku yli, niin se on jäännöstä ja niitten jäännösten pitää olla normaalisti jakautunut.
[38:00] Mutta mä sanoisin kyllä näillä kilometreillä, että se alustava tarkastelu sen vasteen jakaumasta kuvaa tosi tosi hyvin Öö sitä Öö normaalisuutta myöskin, mutta jos se on vähän, vähän heikohko, niin usein mallin jälkeen ne jäännökset Öö Öö noudattaa paremmin normaali su- normaalijakaumaa, eli ko- jos se malli on hyvä, niin niistä jäännöksistä tulee Niinku lähempänä normaalijakaumaa tai jopa täydelliset normaalijakaumat verrattuna siihen alustavaan tarkisteluun.
[38:33] Ja Öö sitten semmoinen, mikä on kanssa hyödyllistä tietää, että me voidaan mahdollisesti myös laskea otoskokoja toistomittausmalleille, joka tarkoittaa sitä, että me tarvitaan aina vähemmän Öö tutkittavia henkilöitä, koska me nimenomaan taas hyödynnetään sitä korrelaatiota mittausten välillä.
[38:52] Ja jopa me voidaan Öö sanoa, että matemaattisesti me ei tarvita jotain aikapistettä, että ne korrelaatiot on niin voimakkaita, että se ei tuo mitään informaatiota, joku Öö aikapiste.
[39:05] Öö Yksi esimerkki tästä on esimerkiksi luun tiheys.
[39:08] Lun tiheydellä on tosi voimakas korrelaatio vaikka jos sulta mitataan nyt ja kahden vuoden päästä, niin ne on miltei samat arvot, ja ne on tosi voimakas korrelaatio, joten luun mittauksia tai luun tiheyttä ei tarvitse mitata oikeasti matemaattisin syin niin usein, kun kun tota, mut usein tullaan sitten vastaan siihen, että kliinisesti halutaan kuitenkin nähdä se data,
Mutta, mut tätäkin voidaan keskustella, että mitkä mittauspisteet on Niinku optimaalisia matemaattiselta kannalta.
[39:38] Ja sit vielä yksi Öö analyys metodi, joka on tässä Öö käymättä läpi, niin on elinaika-analyysit, eli eli juuri sitä, että kun me tutkitaan Öö eroaako aika Öö diagnoosista, Öö syöpäkuolemaan, randomisoinnista, Öö jonkun metastaasin tulemiseen, Öö niin niissähän meillä on ihan omat metodit, koska meillähän on juuri erilainen data, että meitä kiinnostaa useimmiten siinä aika jostain alusta johonkin tapahtumaan.
[40:10] Mut sitten kaikki eivät Öö usein onneksi saa sitä tapahtumaa, mut meillä on heiltäkin se koko seuranta-aika, jolloin heille ei ole tullut tapahtumaa.
[40:20] Me voidaan tutkia elinaikamalleilla myöskin positiivisia tapahtumia, kuten aika Öö lapsettomuushoidon alusta raskau- raskauteen, Öö työttömyyden alusta, työnsaantiin tai jotakin muuta.
[40:34] Mutta näistähän meillä on ihan oma podcast.
[40:37] Öö Kari oli juttelemassa Öö sun Markus kanssa Öö ja se on hyvin Öö hieno podcast, joten tota ei puhuta siitä tänään sen enempää.
[Speaker 0]
[40:49] Joo.
[40:50] Siinä tuli paljon asiaa ja paljon asiaa on tullut muutenkin jo.
[40:54] tota Mutta kumminkin näissä esimerkeissä, mitä me ollaan tähän mennessä käyty läpi, niin on ollut oikeastaan vaan tämmöisiä hieman yksinkertaistettuja tilanteita, jossa tota siinä mallissa olisi mukana vain yksi tekijä, jolla selitetään jotain yhtä vastetta.
[41:09] Käytännössä kuitenkin halutaan samaan malliin huomioida esimerkiksi ikä, sukupuoli, koulutustaso, BMI luokka tai mitä ikinä, mitä nyt sitten kuhunkin tutkimustilanteeseen sopii.
[41:21] Ja tota usein se analyysimetodi silloin laajenee lineaariseksi malliksi. [41:25] Julkaisuissa tätä voidaan kutsua esimerkiksi multiwayanovaksi.
[41:30] Lineaarisissa malleissa taas oletetaan vasteen olevan normaalisti jakautunut, tai jos ihan tarkkoja ollaan, niin tosiaan samalla tavalla kuin noissa toistomittauksissakin, niin ne jäännökset, eli ne mitä malleista jää selittämättä, pitäisi olla normaalisti jakautuneita.
[Speaker 1]
[41:45] Juu, juu.
[41:46] Ja tässä jos me nyt ajatellaan vaikka sitä elämänlaatu esimerkkiä, niin eihän me voida olla niin naiiveja, et me voitaisi kuvitella, että yksi tekijä riittäisi meille tota selittämään, mistä elämänlaatu Niinku koostuu tai mikä mik- mitkä tek-, mikä tekijä olisi siinä yhteydessä. [42:02] Eli me tarvitaan paljon monimutkaisempaa mallia ja silloin me siirrytään näihin isompiin malleihin, mihin voidaan pistää monta tekijää.
[42:10] Ja Niinku säkin mainitsit noita tekijöitä, niin ne voi olla kategorisia, ne voi olla numeerisia, näin.
[42:17] Mutta sitten meille tuleekin taas uusia haasteita matkan varrella.
[42:20] Eli siinä meidän täytyy Niinku miettiä, että mikä meidän mallinnusstrategia on. [42:25] Ja Öö joka biostatistikollakin on varmaan pikkasen oma mallinnusstrategia, ja niitä Öö on useammanlaisia, mutta akateemisella puolella yksi on Niinku mun mielestä aika Öö iso vallalla, mallinnusstrategioista.
[42:39] Se on sellainen, että ensin tehdään niin sanottu univariate approach, joka tarkoittaa, että kaikki ne mun mielenkiintoiset tekijät, onko niitä nyt viisi tai kymmenen, niin mä tutkin ne yksi kerrallaan, eli käyttää juuri niitä me- menetelmiä, mitä tuossa ollaan aikaisemmin puhuttu.
[42:56] Ja sen jälkeen sitten me tehdäänkin tämmöinen multivariable malli, johon me esimerkiksi otetaan mukaan ne kaikki, jotka on ollut merkitseviä siellä yksi kerrallaan katsottuna, eli univariate approachissa.
[43:10] Ja tota ja tässä välissä mä vielä teen itse sellaisen testin, että mä tutkin sitä, että mitkä näistä tekijöistä korreloi Öö tai ovat hyvin voimakkaassa yhteydessä toisiinsa, koska jos siellä esimerkiksi on tota mm Öö mitäs mä nyt keksisin?
[43:29] Öö siellä voisi olla asumismuoto ja parisuhde, niin niin voit kuvitella, että ne ovat aivan aika voimakkaassa yhteydessä toisiinsa, jolloin mä sanon tutkijalle, että hmm, että tota näitäpä nyt ei kannata molempia lykätä sinne meidän monimutkaisempaan malliin, koska ne yrittää tietenkin selittää Niinku samaa asiaa, joten mä kysyn tutkijalta, että kumman tekijän sä haluat ottaa tähän seuraavaan tasoon.
[43:57] Kumpi on tän tutkimuksen kannalta Niinku oleellisempi?
[44:01] Öö eli näin, näin on aika yleinen tapa tehdä akateemisella puolella. [44:06] Teollisuudessa taas tilanne on täysin toisin.
[44:09] Meidän pitää selittää ihan eksakt se tilastollinen malli jo tutkimussuunnitelmassa. [44:15] Mitä tekijöitä me halutaan ottaa malliin mukaan.
[44:19] Ja niinpä me Öö tehdään se malli, ja se on sitten heti meidän final malli, eli siellä ei tehdä ollenkaan niin paljon tämmöistä mallin rakennusta Öö kun akateemisella puolella. [44:31] Akateemisella puolella on usein se, että me ei vielä tiedetä kovin paljoa, lääketutkimuksessa, kun me ollaan ihmispuolella jo tutkimassa, niin meidän pitäisi aika paljon jo tietää asioista.
[44:42] Mutta totta kai meidän täytyy myös sitten joka vaiheessa tarkistaa ne oletukset ja tietää niitten mallien oletukset.
[44:50] Ja toki me tässä mainittiin vaan tää lineärinen malli. [44:54] Meillä on myös paljon paljon muita malleja.
[44:58] Öö esimerkiksi just niihin Öö binäärisiin vasteisiin eli kaksiluokkaisiin vasteisiin, mitä me voidaan tehdä, mutta ehkä Öö Markus, tää alkaa olla jo tarpeeksi suuri annos tälle päivälle.
[Speaker 0]
[45:13] Joo, pakko se vaan vielä tohon, tohon sanoa, että tota tosiaan kun puhuit tosta tota mallinnusstrategiasta ja kuinka se on akateemisella puolella yleensä aina samanlainen, niin mulla on aika tämmöinen malliesimerkki tuli mieleen, et mä olin joskus tota tota auttamassa statistiikoissa semmoisessa aika mielenkiintoisessa syvärityössä, eli, elikkä tota lääketieteen semmoisessa lopputyössä, missä nimenomaan tehtiin tää ensin jiväriet ja sitten multivärle tota lähestymistapa ja siinä tota Öö tutkittiin vasteena tota seksuaalifunktiota kuvaavia mittareita naisilla, eli ne vastemuuttujat oli tällaisia kun seksuaalinen halu, orgasmipisteytys, kiihotusaste, kipu J- JNE, Öö joita sitten selitettiin muuttujilla, kuten parisuhdeonnellisuus, pulssiaallon nopeus, hormonikorvaushoito, depressiokyselyn pistemäärä.
[46:08] Öö elikkä tässä nimenomaan oli aina yksi vastenmuuttuja ja hirveä määrä niitä tota selittäviä muuttujia.
[46:16] Ja esimerkiksi tässä tapauksessa just käytettiin lopulta sitten usean muuttujan lineaarista mallia.
[Speaker 1]
[46:22] jo useamman tekijän lineaarista [Speaker 0]
[46:24] mallia juuri näin juuri näin.
[46:27] Mutta joo, tosiaan siinä tuli siinä tuli kyllä taas tuutin täydeltä informaatiota, toivottavasti pysyitte kärryillä ja hereillä.
[46:36] Ja tota Öö tosiaan vielä uudestaan loppuun maininta, että jos sä haluat tutkailla sitä analyysikarttaa, johon tämänkin jakso pohjautuu ja tai haluat oppia lisää aiheesta, niin käy tutustumassa meidän täysin avoimeen kurssiin havainnoista päättelyyn, joka löytyy digikampuksesta ja me laitetaan linkki tän jakson kuvaukseen.
[46:56] Mutta joo, hei, kiitos vielä kerran Elisa, että tulit taas pölisemään mun kanssa tänne. [47:02] Kyllä,
[Speaker 1]
[47:02] kiitos.
[47:03] Oli kiva olla taas mukana. [Speaker 0]
[47:06] Ja hei, kiitos sinulle, kuuntelija, että olit linjoilla.
[47:09] Toivottavasti tämä jakso innosti sinua oppimaan lisää paitsi tilastollisten testien käytöstä ja oikeissa tilanteissa, niin myös ihan yleisemmin tilastotieteestä.
[47:19] Kuullaan taas statistiikan aalloilla. [Speaker 1]
[47:31] Tämän podcastin on tuottanut Turun yliopiston lääketieteellisen tiedekunnan biostatistiikan yksikkö.
Tässä tulee todellinen Statistiikan aalto täynnä tietoa tutkimusasetelmista ja tilastollisen testin valinnasta. Tutkimusasetelma ja muuttujien mitta-asteikon tunnistaminen johdattavat sopivaan tilastolliseen testiin.
Tämän podcastin sisältö sopii erinomaisesti tutkijoille ja kaikille, jotka haluavat oppia tunnistamaan erityyppiset muuttujat sekä valitsemaan sopivan tilastollisen testin yksinkertaisissa tilanteissa. Tämän jakso liittyy Turun yliopiston lääketieteen, bio- ja hammaslääketieteen opiskelijoille pakolliseen Havainnoista päättelyyn -kurssiin. Kurssi on avoin kaikille DigiCampuksella, ja sieltä löytyy podcastissa mainittu analyysikartta. Seuraavassa podcastissa avaamme tätä aihetta esimerkeillä.
[Speaker 1]
[00:00] Tervetuloa takaisin parhain kuuntelijan.
[00:07] Täällä teidän seurannanne tänään jälleen biostatistikko Markus Riskumäki.
[00:10] Ja minä olen biostatistikko Elisa Löttyniemi.
[Speaker 2]
[00:13] Ja tämä on Statistiikan aallolla podcast.
[Speaker 1]
[00:17] Olit sitten lääketieteen tai hammaslääketieteen opiskelija, tutkija,
[00:22] tai ihan muuten vain kiinnostunut biostatistiikasta, niin hienoa, että sä oot kuulolla.
[00:25] Tänään me puhumme tilastollisissa analysoissa.
[00:25] niin hienoa, että saat kuulolla.
[00:28] Tänään me puhumme tilastollisista analyyseista,
[00:31] tai jos jaksan aiheen tiivistäisiin yhteen kysymykseen,
[00:33] niin se voisi olla, että mitä ihmien testiä tähän aineistoon
[00:37] nyt pitäisi sitten käyttää.
[00:39] Mikäs meidän keskustelun aiheet on tälle päivälle?
[Speaker 2]
[00:43] No, aluksi mä ajattelin, että me voitais käydä läpi
[00:47] erilaisia tutkimusasetelmia, ja sen jälkeen näitä
[00:50] tilastollisia menetelmiä, eli näitä erilaisia testejä.
[00:53] Ja kuten sanoitkin, miten löydän sopivan testin joka erilaiseen tilanteeseen ja miksi käytän sitä testiä.
[01:07] Sitten voidaan pohtia erilaisia esimerkkejä tässä matkan varrella.
[01:12] Pitäisikö meidän aloittaa tosiaan niistä erilaisista tutkimusasetelmista?
[Speaker 1]
[01:17] Joo, mutta ennen kuin päästään niin pitkälle, niin me voitaisiin aloittaa vähän puhumalla määritelmistä, niitä aina tarvittaa.
[01:25] Eli ennen kuin päästään tutkimustyyppeihin, niin pitää meidän puhua tarkemmin kahdesta termistä.
[01:32] Ensinnäkin riskitekijä tai interventio, eli tekijä, ja toisena tutkimuksen tulokset tai kiinnostavien mittauksien arvot, eli vaste.
[01:43] Ensimmäinen termi eli riskitekijä, jonka vaikutustamme halutaan tutkia.
[01:48] Riskitekijä voi olla esimerkiksi joku tiedetty alleeli, joka nostaa vaikka diabeteksen puhkeamisen riskiä.
[01:54] Tai sitten vaikka ylipaino tai kohonnut verenpaine.
[01:58] Interventio taas on vaikka lääke, jota tutkitaan.
[Speaker 2]
[02:01] Niin, tai toisaalta interventio voi olla myöskin koulutus.
[02:04] Me tehdään paljon sellaisia tutkimuksia, joissa henkilökuntaa koulutetaan ja sitten me tutkitaan lisääntyykö henkilökunnan tietotaito tämän koulutuksen ansiosta.
[Speaker 1]
[02:14] Eli näillä riskitekijöillä tai interventioilla koetetaan selittää tuon kiinnostuksen kohteen eli sen vasteen käyttäytymistä, eikö vaan?
[02:21] Juu.
[02:22] Näitä kutsutaan monesti juuri tämän takia myös selittäväksi muuttujaksi.
[02:27] Ja sitten se toinen termi eli vaste, se on jotain, jonka arvo muuttuu tai käyttäytyy kiinnostavasti tekijän vaikutuksesta.
[02:34] Vaste on siis yleensä tutkimuksen kiinnostuksen kohteena tai voi sanoa päämuuttujana tässä tutkimuksessa.
[02:42] Esimerkkinä vasteesta voisi olla esimerkiksi diabeteksen puhkeaminen, alkoholin käytön väheneminen, suolisto-oireiden paraneminen ja niin poispäin.
[02:50] Vastetta saatetaan kutsua myös selitettäväksi muuttujaksi.
[02:55] Sitten päästäänkin niihin erilaisiin tutkimusasetelmiin.
[02:58] Aloitetaan puhumalla kahdesta erilaisesta ikään kuin pääluokasta.
[03:02] Näitä pääluokia on retrospektiivinen ja prospektiivinen tutkimus.
[03:08] Retrospektiivinen tutkimus tarkoittaa sitä, että vastenmuuttuvia
[03:11] ja luultavasti myös selittävät muuttojat on jo esiintyneet.
[03:15] Eli tutkimusdata on ikään kuin jo olemassa keruuhetkellä.
[Speaker 2]
[03:19] Tällaisia tutkimuksia muuten on suurin osa syväreistä läkiksessä
[03:24] kaikki kradutkin, että ohjaaja antaa sulle tai kertoo, mistä kerätään jo olemassa oleva data, vaikka potilaskertomuksista.
[Speaker 1]
[03:32] Joo.
[03:34] Eli siis se tieto esimerkiksi altistumisesta jollekin sairaudelle kerätään siis jälkikäteen.
[03:40] Sairauden ei ole mahdollisesti ilmaannuttua.
[03:42] Tyypillinen esimerkki voisi olla vaikka, että halutaan tutkia, mitä tupakointi aiheuttaa,
[03:47] koska me ei voida tehdä tutkimusta, jossa niin sanotusti käsketään jotain ihmisiä polttamaan askipäivässä.
[Speaker 2]
[03:53] No eipä, no eipä.
[Speaker 1]
[03:55] Tällainen tieto pitää vain kerätä niin sanotusti jälkikäteen
[03:59] semmoisilta henkilöiltä, jotka tupakoivat vakituisesti
[04:02] ja vertailla niitä sitten semmosiin, jotka ei ole polttanut.
[Speaker 2]
[04:05] Näin se menee.
[Speaker 1]
[04:07] Sitten se toinen oli prospektiivinen tutkimus.
[04:09] Ja se taas tarkoittaa tulevaisuudessa tehtävää tutkimusta.
[04:13] Eli vastetta ja mahdollisesti myöskään selittäviä muuttuja ei ole vielä esiintynyt.
[04:18] Valtistuneita ja altistumattomia seurataan siis sairauden suhteen ajankuluessa.
[04:22] Toinen tyypillinen esimerkki on lääketutkimus, jossa yksi ryhmä saa tutkimuslääkettä ja toinen ryhmä lumelääkettä.
[Speaker 2]
[04:29] Eli suomeksi tarkoittaa se, että me kirjoitetaan tutkimussuunnitelma, ja sitten me itse kerätään, tehdään ne mittaukset ja kerätään se data analyysejä varten.
[Speaker 1]
[04:40] Joo, okei.
[04:40] Mitäs muita tutkimusluokkia on olemassa, Eliisa?
[Speaker 2]
[04:45] No, mä sanoisin, että me voidaan tehdä näitä erilaisia jakoja, näitä jossakin jutuissa on vähän erilaisiakin näitä termejä, mutta me voitaisiin nyt käyttää tämmöistä luokkajakoa kuin kuvailevat, mä usein kutsun niitä myös evaluaatiotutkimuksiksi ja sitten analyyttiset tutkimukset.
[05:04] Ja kuten tämä kuvailevan tutkimuksen nimikin jo kertoo, niin me pyritään vain kuvailemaan jostakin joukosta kerättyä dataa tai aineistoa useimmiten just tunnuslukujen avulla.
[05:17] Tunnuslukuja on myös keskiarvot ja medianit ja muut.
[05:21] Eli me ei pyritä vastaamaan mihinkään meidän hienoon tutkimusideaan.
[05:28] Me ollaan kerätty jollain tavalla se tosiaan data, ja me kuvaillaan sitä dataa.
[05:34] Me ei välttämättä haluta myöskään todistaa muuttujen välistä yhteyttä, mutta nämä voi kuitenkin antaa meillä osviittajia nimenomaan ideoita seuraavinkin tutkimuksiin, ja sitä kautta me voidaan rakentaa mielenkiintoisia tutkimuskysymyksiä.
[05:51] Esimerkkejä tällaisista kuvailevista tutkimusta voisi olla myös tapauskuvaukset, joissa usein kuvataan vain yhden potilaan tarina, mitä siinä on tapahtunut.
[06:01] Tapaussarjat, joissa olemme keränneet muutaman samantyyppinen potilas esimerkiksi.
[06:08] Sitten poikkileikkaustutkimukset, joissa käytännössä aina kerätään data vain yhdestä aikapisteestä.
[Speaker 1]
[06:17] Sitten taas analyyttisissa tutkimuksissa me yritetään testata jotain tutkimushypoteesia ja osoittaa siis kausaalisia yhteyksiä muuttien välillä, eli syy-seuraussuhteita.
[06:29] Analyyttisten tutkimuksen sateenvarjon alla voisi ajatella olevan vielä kaksi alaluokkaa, sellaiset kuin havainnoivat ja kokeelliset tutkimukset.
[06:39] Ja taas, kuten jo nimikin vähän implikoi, niin havainnoivissa tutkimuksissa havainnoidaan.
[06:45] Eli tutkija ei yksinkertaisesti vaikka dokumentoi luonnollisesti tapahtuvia yhteyksiä tekijöiden ja vasteiden välillä.
[06:54] Yksi esimerkki voisi olla tämmöinen kuin tapausverrokkitutkimus,
[06:57] jossa ensin määritellään vaste, vaikkapa potilaat, joilla on keuhkosyöpä,
[07:02] verrattuna potilaisille, joilla ei ole keuhkosyöpää,
[07:04] ja sitten tutkitaan potilaiden aiempaa altistumista riskitekijöillä, esimerkiksi tupakka varmaan olisi tässä minun esimerkissä.
[07:12] Tai sitten näistä tutkitaan harvinaisia sairauksia, esimerkiksi on tehty väitöskirjoja, joissa tutkitaan syntymäepämuodostumia.
[07:19] Niissä on kerätty jokaiselle niin sanottu epämuodostuma lapselle viisi terveyttäkontrollia ja esimerkiksi vertaillaan äitien syömiä lääkkeitä tai sairauksia.
[Speaker 2]
[07:30] Tämäkin on tällainen tyypillinen esimerkki, missä olen ollut mukana.
[07:33] Meillä ei ole oikein mitään tietoa, mistä nämä lasten epämuodostumat ovat johtuneet.
[07:41] Sen takia olemme oikeasti saaneet rekisteristä kaikki näiden äitien syömät ostamat lääkkeet raskauden aikana.
[07:49] Usein olemme kiinnostuneita nimenomaan raskauden alkuvaiheesta.
[07:53] Myös me kerätään äidin sairaukset, äidin painot, bodimasindeksit ja näin, ja me koitetaan löytää joku mahdollinen tämmönen, mikä voisi aiheuttaa näitä epämuodostumia.
[08:05] Oikeasti me ollaan hirveän kiinnostuneita, mikä voisi aiheuttaa, mutta oikeasti me ei ennen tätä meidän analyysejä kunnolla tiedetä asiasta.
[Speaker 1]
[08:14] Joo.
[08:16] Eli vielä kertauksena tapausverrokkitutkimuksista.
[08:20] Niissä aloitettiin tutkimuksen lopputuloksesta, eli vasteesta.
[08:23] Jonka jälkeen tutkitaan ajassa taaksepäin ja määritellään riskitekijöitä,
[08:26] eli selittäviä muuttuja.
[Speaker 2]
[08:28] No sitten me voitaisiin ajatella toisena esimerkkinä
[08:32] tämmöisiä kohorttitutkimuksia, eli seurantatutkimuksia,
[08:35] jokaan sitten taas ihan tavallaan tehdään vähän toisinpäin.
[08:40] Eli me ollaan jollain lailla tietoisia näistä,
[08:42] että mitkä saattaisiin olla riskitekijöitä, ehkä ei ollut varmoja, koska me teemme tutkimusta, mutta meillä on joku haisu näistä mahdollisista riskitekijöistä.
[08:52] Ja sitten me kerätään sitä dataa, me otetaan myös nämä riskitekijät huomioon ja me tietenkin kerätään muitakin taustatekijöitä.
[09:02] Ja sitten me lähdetään seuraamaan näitä erilaisia ryhmiä ja katsotaan sitten, kuka sairastuu tämän seurannan aikana.
[09:09] Yksi esimerkki on Turussa tehty pitkä pitkä, ainakin 20-30 vuotta jo ollut, DIP-tutkimus, jossa siellä on mukana lapsia, joilla on erilaisia näitä diabetesriskialleleja,
[09:26] niitä vähän eri tasoisia, ja nyt me sitten seurataan, tai on seurattu heitä 2-30 vuotta, ja sitten me katsotaan, kenelle sitten tulee tämä tyyppin yksi diabetes.
[09:38] Me aloitamme mahdollisista riskitekijöistä ja saamme seurannan aikana selville, kuka sairastuu, ja koitamme tämän datan avulla tarkentaa tietoa sairauden puhkeamisesta.
[09:55] Nämä ovat samantyyppisiä, tutkimuksen tavoite on sama, saada selville lisää jostain sairauden riskitekijästä, mutta se tutkimuksen suunta oli tässä erilainen.
[Speaker 1]
[10:16] Eli tapausverrokkitutkimuksessa tosiaan aloitettiin vasteesta, jonka jälkeen katsottiin taaksepäin ja etsittiin mahdollisia altistuksia riskitekijöille eli määritellään sitten jälkikäteen selittäviä tekijöitä ja kohorttitutkimuksessa taas just toisinpäin, että saatetaan aloittaa valtavasta määrästä erilaisia altistuksia riskitekijöille, jonka jälkeen katsotaan eteenpäin ajassa ja etsitään sitten sitä vastetta eli selittävää tekijää.
[10:43] Sitten toinen suurempi luokka analyyttisten tutkimusten alla oli kokeelliset tutkimukset.
[10:49] Tämä on nyt luultavasti se tutkimusasetelma, josta meillä ja varmaan tämän podcastin kuuntelijoillakin on ehkä eniten kokemusta tai tietoa.
[10:57] Voisi sanoa, että kokeelliset tutkimukset on ihan tieteellisen tutkimuksen kulmakivi,
[11:02] joissa tutkija altistaa osan tai kaikki tutkimusjoukosta jollekin tekijälle.
[11:07] Tutuimpana esimerkkinä tällaisesta tutkimuksesta on varmaankin satunnaisesti tutut kontrolloidut tutkimukset.
[11:14] Taas esimerkkinä vaikka kaikki lääketutkimukset, joissa on usein mukana lumelääkäryhmä, jonka muutoksia verrataan lääkäryhmän muutokseen.
[Speaker 2]
[11:22] Tässä on tärkeänä asiana ymmärtää, että vain näillä kokeellisilla tutkimuksilla voidaan osoittaa todellinen, kausaalinen eli syy-seurausyhteys,
[11:31] jossa nimenomaan tutkija antaa sen altisteen tai onko se sitten lääke tai mikä on.
[11:39] Eli pakottaa tämän tutkittavan kausaalisen yhteyden tutkimuskohteille, jos ne hienosti sanotaan.
[11:46] Nyt kun me tehdään tämmöistä lääketutkimusta esimerkiksi, niin me tutkitaan sitten sitä, että tekeekö se lääke mitä me haaveillaan sen tekevän
[11:55] vai tekeekö se liian vähän mitä me haaveillaan sen tekevän.
[12:00] Jos meillä on esimerkki, jossa lääkkeellä pyritään vaikuttamaan vaikka luontihoitojen nostamaan luontihoitta,
[12:06] niin me tehdään siinä tutkimuksessa mittauksia, ja sitten me pystytään tilastollisella mallintamisella todistamaan,
[12:13] että nousiko sen lääkeryhmän luontihoidon keskiarvo enemmän kuin lumenlääkeryhmällä.
[12:20] No sitten havainnoivat tutkimukset, kuten ne tapausverokkitutkimukset ja kohorttitutkimukset, voi näyttää myös yhteyttä eli korrelaatiota näiden asioiden välillä, mutta ne ei osoita välttämättä syytä sille tapahtumalle tai vasteelle.
[12:38] Ja sen takia tämä ainut tapa osoittaa syyseuraussuhteet eli kausallisuus on tämä kokeellinen tutkimus.
[Speaker 1]
[12:45] Joo.
[12:46] Siinä oli aika tyhjentävästi käytännön erilaiset tutkimusasetelmat läpsi.
[Speaker 2]
[12:51] No niin, nyt kun ne on sitten käyty läpi, niin voitaisiinko me sitten puhua myöskin näiden eri asetelmien hyvistä ja huonoista puolista, koska tämä on aika suuri kysymys.
[13:02] Miksi esimerkiksi joku haluaisi tehdä havainnoivaa tutkimusta,
[13:06] vaikka me jo päädystiin siihen, että ainoastaan tällä kokeellisella tutkimuksella
[13:10] me voidaan osoittaa tämä kausaallinen yhteys ja syy-seuraussuhde,
[13:13] joka me oikeasti tietenkin halutaan tietää?
[Speaker 1]
[13:16] Joo, musta tuntuu, että helposti tulee ajateltua,
[13:18] että mitä ihmeen järkeä on edes tehdä havainnoivaa tutkimusta.
[13:23] Mutta uskokaa tai älkää, niin esim.
[13:25] näillä kohortti tai tapausverkkotutkimuksilla
[13:27] on ehdottomasti myös hyviä puolia.
[13:30] Kohorttitutkimusten eli seurantatutkimusten hyötyä on esimerkiksi se, että sä voit olla varma siitä ajankohdasta.
[13:36] Sä voit olla varma siitä, milloin jotain tapahtui ja milloin se seuraava asia sitten tapahtui.
[13:42] Sitten sä voit myös tutkia useampaa lopputulosta annetulle altistukselle ja tutkia useampaa altistusta samassa kohortissa.
[13:49] Sitten sä voit myös määrittää lopputuloksen suhteellisen riskin annetulla altistuksella.
[13:55] Sitten tämä toinen, eli tapausverrokkitutkimukset, niiden hyödyt taas on esimerkiksi, että sä voit valita tapaukset juuri sulle sopiviksi.
[14:03] Se voi potentiaalisesti vähentää sekoittavien tekijöiden harhaa, eli semmoista systemaattista virhettä siinä tutkimuksessa.
[14:10] Sä tarvit kokonaisuudessaan paljon pienemmän otoksen mahdollisesti, ja pienemmät otokset tietysti tarkoittaa pienempiä tutkimuskuluja.
[Speaker 2]
[14:18] Joo, todella paljon pienempiä tutkimuskuluja.
[Speaker 1]
[14:21] Joo, mitäs vielä.
[14:24] Niin, sä voit tarkastella useita altistumisia lopputuloksille.
[14:29] Ja tapausverkkotutkimukset on todella hyviä myös harvinaisille taudeille, koska usein on tosi vaikeaa selvittää,
[14:35] että kuka nyt sitten sairastuu näihin harvinaisiin tauteihin, jos niitä tapahtuu esimerkiksi vain yhdessä miljoonasta tapauksesta.
[Speaker 2]
[14:42] Joo joo, mä voin kertoa myös yhden esimerkin, kun mä olin yhdessä laitekehitysfirmassa töissä,
[14:48] Me kehitettiin tällaista testiä tällaiseen skits-sairauteen, jota tulee noin yhdelle syntyvälle lapselle 60 000 syntyvään lapseen.
[15:01] Viranomaiset sanoivat, että meidän pitää löytää 15 tällaista sairaslabranäytettä.
[15:09] Suomessa meidän pitäisi kerätä dataa noin 20 vuotta, niin se on täysin mahdoton tehtävä firmalle.
[15:15] Joten ainoa tapaus on mennä keräämään ympäri Eurooppaa pakkasista näitä sairasnäytteitä.
[15:21] Se on yksi esimerkki, että me ei pystytä vaan käytännössä tekemään mitään prospektiivista tutkimusta tämmöisille harvinaisille sairauksille.
[15:30] No sitten kohortti ja tapausverkkotutkimuksessa on tietysti myöskin haittoja tai huonoja puolia.
[15:38] Esimerkiksi kohorttitutkimuksilla varjopuoli tietenkin on se sama kuin äskeisessä esimerkissä, että meidän pitäisi tehdä tätä seurantaa tosi pitkään, mikä ei ole aina käytännössä mahdollista.
[15:54] Tietenkin niissä voi olla myös semmoisia sekoittavia tekijöitä, mitä me emme halua.
[16:03] Sitten tapausverokkitutkimuksessa taas meillä voi olla haittojakin sellaisia, että meillä on joskus vaikeaa löytää niitä sopivia verokkeja,
[16:12] koska ne pitäisi olla muuten ihan samanlaisia, mutta niiltä pitäisi puuttua vain se MS-sairaus, koska me halutaan tietenkin mahdollisimman paljon vähentää tätä harhaalisystemaattista virhettä.
[16:26] Varsinkin, jos tutkimus on kyselytutkimus tai haastattelu, niin meille voi tulla muistiharhaa, että ihmiset eivät muista asioita.
[Speaker 1]
[16:38] Muistiharhaan oli sitä, että joku tutkittava potilas, kun siltä kysellään haastattelussa mitattavia asioita, muistaa väärin tai ei muista ollenkaan, mitä hän on vaikka syönyt.
[Speaker 2]
[16:53] Ja sitten meillä on myöskin tämmöisiä, että mitä kaikkea me voidaan laskea näistä erilaisista tutkimuksista.
[17:00] Että tapausverokkitutkimuksessa me ei oikein voida määrittää suhteellista riskiä,
[17:04] mutta me voidaan laskea tämmöinen ristisuhde, eli odds ratio,
[17:08] mikä on hyvin paljon käytetty erilaisissa julkaisuissa.
[Speaker 1]
[17:13] Joo.
[17:13] Sitten kuten me jo painotettiin monta kertaa aiemmin,
[17:17] Sitten taas kokeellisten tutkimusten kohdalla hyödyt on, että voit selvittää todellisen kausaalisuhteen eli syy-seuraussuhteen.
[17:26] Ja jos sä satunnaistat potilaat kokeellisissa tutkimuksissa tai koehenkilöissä,
[17:31] niin sä pääset todennäköisesti eroon niistä sekoittavista tekijöistä, joista olemme helposti huolestuneita muilla tutkimustyypeillä.
[17:39] Sä voit myös tarkastella altistumista ja lopputulosta paljon eristetymmällä tai lainausmerkeissä laboratorio-olosuhteisemmalla tavalla ja sillä lailla sitten taas vähentää jonkin verran aineiston sitä niin sanottua melua tai kohinaa.
[Speaker 2]
[17:53] Tästä yhtenä esimerkkinä on vaikka lääkkeen imeytymistutkimukset,
[17:58] jossa tutkimushenkilöltä kielletään liikunta, saunominen.
[18:02] He jopa syövät samaa ruokaa, saavat juoda vettä tietyn standardin määrän.
[18:08] Tällä tavalla yritetään juuri melua kohinaa, eli vaihtelua vähentää.
[Speaker 1]
[18:16] Tietysti kokeellisilla tutkimuksilla on myös haittoja.
[18:20] Kuten kaikilla tutkimustyypeillä.
[18:23] Kokeelliset tutkimukset voivat olla helposti tosi kalliita.
[18:26] Rekrytointi voi olla todella vaikeaa, vähän riippuen siitä, mitä yrittää tutkia.
[18:31] Sitten tietysti jotain sairauksia tai lopputuloksia ei voida oikein eettisesti arvioida kokeellisilla tutkimuksilla.
[18:37] Esimerkkinä just se, että ei voida pakottaa ketään polttamaan askeja ja tupakkaa päivässä,
[18:42] ja sitten katsoa, miten se vaikuttaa hänen keuhkoihin.
[18:46] Sitten tietysti kokeelliset tutkimukset voivat viedä hyvin kauan aikaa.
[Speaker 2]
[18:51] Sitten täytyy myös tajuta se, että kokeelliset tutkimukset usein käytännössä katsomaan maksaa miljoonia ja ne vaatii ihan valtavan koneiston ympärilleen.
[19:02] Olen juuri ollut mukana parissa tutkimuksissa, joissa näitä tutkittavia koehenkilöitä rekrytoitiin ympäri maailman.
[19:12] Ja tämmöiseen hallinnointiin vaaditaan tietenkin hirveästi ihmisiä ja sitten tutkimuksen luvat haetaan niistä joka ikisestä maasta ja se vaatii myöskin hirveästi byrokratiaa ja muuta.
[19:25] Ja jos nyt ajatellaan tämmöistä akateemista yliopistoympäristöä niin eihän tutkijoilla ole semmoisia rahoja varsinkaan Suomessa.
[Speaker 1]
[19:35] Okei, eli kaikki, mitä tähän mennessä ollaan käyty läpi, niin on varmasti monelle kuuntelijalle ollut vähän semmoista kertausta.
[19:43] Mutta seuraava askel onkin sitten itse podcastin aihe, että okei, sulla on tutkimus, sä oot käynyt aineiston.
[19:51] Miten ihmeessä sä nyt sitten analysoit sitä sun aineistoa?
[Speaker 2]
[19:54] Joo, no mä aloittaisin miettimällä siitä sun datasta niinku ne kulmakivet.
[20:01] Eli mun mielestä dataa tarvitsee nimenomaan ymmärtää sen datan tärkeimmät ominaisuudet.
[20:08] Ja me ollaan jo puhuttu siitä vasteesta, eli se kiinnostuksen kohteena oleva muuttujan havainnot,
[20:14] ja sitten tekijä, jolla me koitetaan selittää sitä vasteen käyttäytymistä.
[20:18] Mutta tämä tarvitsee ensimmäisenä ymmärtää.
[20:22] Mutta sitten meillä on muitakin tärkeitä näitä kulmakiviasioita.
[20:28] Vastaista minun pitää vielä täydentää se, että siitä kiinnostuksen kohtenolla muuttujasta sinun pitää ymmärtää, minkälainen se muuttuja on.
[20:37] Tämän kurssin puitteissa usein riittää näitä analyysejä varten se, että sinun pitää ymmärtää, onko se sinun kiinnostuksen kohtenolla muuttuja kategorinen vai onko se jatkuva eli numeerinen.
[20:48] Sitten vielä sun täytyy ymmärtää, mitä siinä sun datassa on riippumatonta.
[20:55] Onko siellä havaintoja, jotka onkin riippuvia.
[20:59] Tyypillinen esimerkki tästä on se, että kun me mitataan eri henkilöiltä arvoa, vaikka verenpainesulta ja multa, Markus,
[21:07] niin totta kai ne on riippumattomia havaintoja.
[21:10] Mutta jos multa mitataan kaksi kertaa se verenpaine, niin ne on riippuvia mittauksia.
[21:17] Ja kumpaankin näihin tapaukseen tehdään siis erilaiset tilastolliset testit, eli meidän täytyy ymmärtää onko meidän havainnot riippumattomia vai riippuvia.
[21:28] Koska muuten sä voit tehdä ihan vääriä testejä.
[21:32] Ja sit jos sulla on vastenumerinen jatkuva muuttuja, niin sun täytyy saada tietoa siitä minkälainen sen jakauma on.
[Speaker 1]
[21:41] Joo.
[21:43] Nyt me jatketaan sit sillä lailla, että me yritetään käydä läpi tämmönen erittäin hyvä, mutta ensi vilkausulla varmasti aika pelottava taulukko,
[21:51] jolla voi tarkastella kerättyä dataa ja valita lopulta sit oikea tilastollinen testi just sun tilanteeseen.
[Speaker 2]
[21:57] Niin se tarkoitat sitä meidän kaksi sivusta analyysikarttaa?
[Speaker 1]
[22:00] Joo, kyllä.
[22:01] Juuri näin.
[22:02] Eli mennään ihan kurssin aiheeseen.
[22:05] Me ei nyt voida tässä jaksossa kuvailla, miten käytännössä jokainen testi suoritetaan,
[22:11] koska siinä on ihan liikaa informaatiota yhteen jaksoon, mutta tämä lyhyt läpikäynti toivottavasti
[22:17] auttaa vähintäänkin esittämään ne peruskysymykset, joiden perusteella sä voit katsoa sun aineistoa
[22:22] ja ajatella, että okei, tähän mun pitäisi kiinnittää huomiota, kun suunnittelen analyysejäni.
[22:28] Okei, eli tosiaan, niin kuin Elisa mainitsi, niin käydään läpi sitä kurssin sivuilta löytyvää kahden sivun analyysikarttaa.
[22:36] Ihan ensimmäinen kysymys on, mitä tyyppiä sun aineiston vastemuuttuja on.
[22:41] Eli niin kuin Elisa tuossa jo aiemmin mainitsi, niin tässä on kaksi kaaraa.
[22:45] Vaste on joko jatkuva, eli numeerinen, tai sitten se on kategorinen.
[22:50] Joten kertauksena jatkuvan muuttujan kohdalla on siis kyse asioista, jotka liikkuvat jatkumossa.
[22:56] Esimerkiksi ikä, BMI, paino, ja tämä siis tarkoittaa sitä, että esimerkiksi se paino voi olla 100 kiloa, 101 kiloa, 102 kiloa, yksitoisensa jälkeen, eli liikkuvat jatkumossa.
[23:09] Jatkuvat muuttujat ovat hieman monimutkaisempia kuin seuraava tietotyyppi, joten palataan niiden varsinaiseen analyysiin ihan hetken päästä.
[Speaker 2]
[23:17] Tämä toinen yleinen tietotyyppi, johon me kaikki törmätään, on tosiaan kategorinamuuttuja.
[23:27] Kategorisen muuttujien analyysi löydät sieltä analyysikartalta sivulta 2.
[23:33] Nimensä mukaisesti kategorinan data on dataa, joka on jaoteltu useisiin diskreteihin luokkiin tai kategorioihin.
[23:42] Esimerkiksi meillä voi olla sukupuoli, mies, nainen, muu.
[23:46] Siinä on kolme kategoriaa.
[23:49] Kyllä, ei on tietenkin kategorisointitapa.
[23:54] Eli johkin kysymykseen voi vastata vain kyllä tai ei.
[23:59] Ja jos sinulla on kategorinen vastemuuttuja ja kategorinen tekijä,
[24:05] eli sinulla on tilanne niin sanotusti cut-cut,
[24:09] niin me voidaan tällaista kahden kategorisen muuttujan välistä yhteyttä tutkia esimerkiksi kiinneljötestillä.
[24:19] Yksinkertaisesti sanottuna se testi määrittää, onko siellä tilastollisesti merkitsevää eroa vaikka näissä luokissa mies-nainen-muu, vaikka nyt tupakoinnin suhteen.
[24:33] Tai sitten meillä voi olla erilainen tilanne, että me halutaan tutkia yhteyttä esimerkiksi polvi ja lonkkakivun välillä, jotka olisivat kyllä ei muut vastauksemahdollisuuksia.
[24:46] Jos taas tässä taulukossa on aika pieniä frekvenssejä, eli suomeksi vähän henkilöitä,
[24:54] niin me joudutaan käyttämään Fischerin exaktia testiä, joka periaatteessa tutkii ihan samaa asiaa kuin tämä kiinnelijotesti,
[25:03] mutta se on todellakin tarkka testi, se laskee tarkat todennäköisyydet yhteen.
[25:08] Eli sitä voi käyttää aina, se on aina parastesti.
[25:13] Mutta mikä sen haittaa on, että se tietokoneen vaatima laskuaika voi olla tosi tosi pitkä, jos sulla niitä kategorioita on paljon.
[25:24] Mulla pisin laskuaika on ollut tosiaan noin viikon verran.
[25:28] Ja sen takia mä pelkään, että moni podcastin kuuntelijakin luulee, että tietokone on jäänyt jumiin.
[25:33] Ei jää jumiin, vaan se vaan kestää pitkän aikaa.
[Speaker 1]
[25:37] Sitten voisit miettiä, miten monimutkainen lasku on kyseessä, jos tietokoneeltakin kestää viikko.
[Speaker 2]
[25:42] Joo, ja sen takia me opetetaan myös nämä kaksi testiä, että voi käyttää suuriin lukuihin aina.
[25:50] JMP, meidän CHAMP-ohjelma, antaa myös varoituksen, milloin se kiinneliötesti ei ole sopiva testi.
[25:56] Silloin on tietenkin ainakin pakko käyttää sitä Fisherin Exactia-testiä.
[26:01] Nämä testit voi tehdä tämän kurssin puitteissa sekä nominaaliasteikollisille kuin ordinaaliasteikollisille muuttujille.
[26:09] Taas kertauksena vähän.
[26:10] Nominaaliasteikollinenhan oli semmoinen, jos kategorisessa muuttujissa luokilla ei ole järjestystä, niin kuin vaikka mies-nainen muu.
[26:18] Ja ordinaaliasteikollinen on semmoinen kategorinen muuttoja, kuten vaikka mielipide kysytty asteikolla 1-5 täysin eri mieltä, täysin samaa mieltä.
[26:27] eli missä on se järjestys.
[26:30] Okei, mutta otetaan vähän takapakkia.
[26:33] Mennään takaisin jatkuviin muuttujiin.
[26:36] Mitä me silloin tehdään, Markus, jos se vastenmuuttoja on jatkuva?
[Speaker 1]
[26:40] Joo, eli jos vastenmuuttoja on jatkuva, eli numeerinen,
[26:43] niin seuraavaksi täytyy miettiä, että millainen jakauma sillä on.
[26:47] Ja muistettava taas se, mitä sä sanoitkin jo,
[26:50] että on vain yksi havainto per tutkimushenkilö,
[26:54] Eli havainnot on tosiaan riippumattomia toisistaan.
[26:58] Eli tämä nyt oli taas esimerkiksi se, että jos mitataan minun verenpaineeni ja Eliisan verenpaineeni, niin ne ei liity toisiinsa millään lailla.
[27:06] Jakaumatarkastelussa sun pitää päättää, että onko sun data normaalisti jakautunutta vai ei.
[27:12] Mutta käydään näitä vähän tarkemmin läpi ennen sinne analyysikaavioon siirtymistä.
[27:18] Eli riippumattomuus siis tilastotieteessä tarkoitti sitä, että yhden asian esiintyminen ei vaikuta toisen asian todennäköisyyteen esiintyä.
[27:27] Esimerkkinä juuri esimerkiksi tämä mun ja Elisan verenpaineet tai sitten yksinkertaisesti nopan heitto.
[27:33] Eli ihan sama kuinka monta kertaa sä heität noppaa, niin todennäköisyys saada silmäluvuksi esimerkiksi yksi tulee olemaan aina täysin sama.
[Speaker 2]
[27:43] Sitten siirrytään siihen toiseen kriteeriin, eli onko se data normaalisti jakautunutta vai ei.
[27:53] Me ollaan kaikki kuultu siitä normaaliakaumasta, kellokäyrästä, normaalikäyrästä, kaussinkäyrästä.
[28:02] Se tulee siitä, kun se muistuttaa vähän tämmöistä kelloa, se muoto.
[28:10] Helpoin tapa aloittaa datan tutkimista on piirtää muuttujasta histogrammi ja katsoa visuaalisesti, muistuttaako se tällaista kaussinkäyrää eli kellokäyrää.
[28:26] Histogrammista hirveän usein näkee jo, että jos se on jotain ihan muuta, eli se ei ole ollenkaan symmetrinen, miten aina kaussinkäyrä on.
[28:37] Silloin voin tehdä jo aika nopeastikin sen johtopäätöksen, että data ei ole normaalisti jakautunutta.
[28:43] Mitäs sitten, jos se on tämmöinen vähän sinne päin?
[28:48] Eli se muistuttaa vähän sitä kaussinkäyrää, mutta et ole kuitenkaan ihan siitä varma, että voinko nyt sanoa, että tämä on normaalisti jakautunut.
[28:58] Täytyy aina muistaa se, että kun me katsotaan datastiakaumaa, niin se ei ole sellainen kuin näissä kauniissa oppikirjoissa tai Wikipediassa,
[29:08] mikä kuvaa täydellistä normaaliakaumaa, eli sitä teoreettista normaaliakaumaa.
[29:12] Me pyritään katsoa sitä, että onko se likimain kohtuullisen lähellä sitä normaaliakaumaa.
[29:19] Mutta meillähän oli siinä paljon tämmöisiä apukeinoja, mitä me voidaan katsoa.
[29:24] Yksi parhaita on se QQ-plotti, minkä JMPstäkin saa, ja siellä on myöskin ne katkoviivat, että onko ne havaintopisteet katkoviivan sisällä.
[29:35] Meillä on vinous ja huipukkuusluvut, mutta nyt ei tässä podcastissa mennä ihan niin syvälle kertomaan, mitä ne kaikki oli.
[29:47] Mutta sitten täytyy vielä pistää vähän korvan taakse se, että jos me näemme, että se on vinojakauma, mikä on hirveän useimmissa labbramuuttujissa jostakin syystä, ne tuppaa olevan vinojen jakaumia,
[29:58] niin me voidaan myöskin muuntaa sitä dataa, eli tehdä joka havainnolle logaritmin tai neliöiden muunnos, ja sitä kautta hirveän useimmin saadaan se jakauma normaalisti jakautuneeksi.
[30:09] Sitten meillä on vielä lisää näitä oletuksia analyyseilla, eli meidän täytyy ymmärtää, siinä analyysikartassa yritetään hyvin kuvata sitä meidän taustaoletuksia, mitä meidän täytyy ensin selvittää, ennen kuin me päästään tekemään sitä varsinaista testiä.
[30:25] Me oletetaan aina, että näillä eri ryhmillä on kutakuinkin saman verran hajontaa, mutta tähänkin on sitten oma taustatesti, mitä me ollaan kurssillakin tehty.
[30:37] Mutta tässä oli nyt sitten tärkeämpiä pohjatietoja.
[30:39] Mitäs me sitten tehdään, Markus?
[Speaker 1]
[30:41] Okei, eli nyt sulla on siis jatkuva vastenmuuttuja,
[30:44] ja näillä Elisa mainitsemilla tarkasteluilla me ollaan nyt päätetty,
[30:48] että se on normaalisti jakautunut.
[30:51] Okei, seuraavaksi täytyy miettiä, että millaista kysymystä me kysytään.
[30:55] Ja tämä jakautuu laajasti kahteen kysymykseen,
[30:58] että haluatko sä tietää suhteista muuttujien välillä,
[31:02] vai haluatko tietää eroista eri ryhmien keskiarvojen välillä.
[Speaker 2]
[31:05] Ja suhteessa tarvitaan nimenomaan semmoista yhteyttä.
[31:11] Niin,
[Speaker 1]
[31:12] Eli vaikuttaako yksi muuttuja toiseen muuttujaan.
[31:16] Eli tässä kohtaa sun täytyy ensiksi pohtia, että minkälainen muuttujaa sun tekijä on.
[31:21] Eli se selittävä muuttuja.
[31:23] Onko sun tekijä sukupuoli vai BMI, eli onko se kategorinen vai numeerinen.
[31:29] Jos sä haluat tietää suhteista, eli niistä kahden muuttujan välisistä yhteydestä,
[31:34] eli vaikuttaako muuttuja x, joka on jatkuva muuttuja, muuttujaan y jollakin tavalla.
[31:40] Sä voit käyttää jotain nimeltä regressioanalyysi.
[31:44] Ja nyt me siis katsotaan jatkuvien muuttujien kaaviota sieltä analyysikartan sivulta 2.
[31:50] Tämmöisessä regressioanalyysissä se yhteysmuoto on siis num num,
[31:54] tai sitten num on yhtä kuin kat plus num.
[31:59] Eli vasteena on numeerinen muuttuja ja tekijöinä joko pelkkiä numeerisiä muuttujia tai sekä kategorisia että numeerisiä muuttujia.
[Speaker 2]
[32:07] Ja usein silloin, jos meillä on sekä numeerisiä että kategorisia muuttujia, niin sittenhän me puhutaan myöskin lineaarisista malleista.
[Speaker 1]
[32:14] Joo.
[Speaker 2]
[32:15] Mutta me ennää vielä tämä yksinkertainen, niin kuin meillä on vain yksi tekijä mukana siellä, yksi numeerinen tekijä.
[32:22] Joo,
[Speaker 1]
[32:23] Eli yksinkertaisin versio tästä regressiosta on lineaarinen regressio,
[32:27] jossa muuttujien välillä on lineaarinen yhteys, eli yläasteeltakin tutuin termein
[32:33] jana y on yhtä kuin a x plus b.
[32:37] Tällöin yhteys oli siis num num.
[32:40] Eli koordinaatistossa näkyy suora viiva, joka näyttää muuttujien x ja y-välisen yhteyden.
[Speaker 2]
[32:46] Muistetaan vielä, että kun me tehdään tätä datasta,
[32:50] niin me sovitetaan siihen dataan suora, joka parhaiten kuvaa sitä yhteyttä.
[32:55] Eihän ne havaintopisteet kaikki sillä suoralla viivalla ole.
[Speaker 1]
[32:58] Niin, jep.
[33:00] Jälleen kerran, tosi elämässä ei löydy niitä Wikipediaan teoreettisia,
[33:05] kauniita kuvioita.
[33:07] Ja tietysti tämän yhteyden ei myöskään tarvitse olla lineaarinen,
[33:11] vaan se voi olla esimerkiksi kaareva tai eksponentiaalinen.
[33:16] Eli regressioanalyyseja on myös monelle selittävälle muuttujalle tai ylipäätään epälineaarisille yhteyksille.
[33:22] Eli sä voit käyttää regressioanalyysiä, kun haluat selvittää, minkälainen funktio parhaiten kuvaisi kahden muuttujan välistä yhteyttä.
[33:31] Lineaarisessa regressiossa sä näet, että jos x-muuttuja muuttuu yhden yksikön verran, kuinka paljon keskimäärin y muuttuu.
[Speaker 2]
[33:38] Otetaan tästä vaikka tuon ihan käytännön esimerkkinä, että jos me tutkitaan painon ja kolesterolin välistä yhteyttä,
[33:46] niin me voitaisiin ikään kuin potilallekin sanoa, että jos sä pystyt pudottaa painoa 10 kg, niin sun kolesteroli keskimäärin tippuu tämän ja tämän verran.
[33:56] Ja sit sä et ehkä tarvitse enää vaikka kolesterolilääkitystä.
[33:59] Eli tätä voi ihan hyödyntää tämmöisissä potilastöissä.
[34:04] Ja totta kai labra-hommissa, mitä paljon biolääketieteen tutkijat tekevät,
[34:10] niin tämä on hyvin yleinen metodi.
[Speaker 1]
[34:12] Joo.
[34:13] No, mutta mitä sitten, jos sinä et selkeästi pysty erottamaan,
[34:16] että kumpi näistä sinun muuttujista on vasta ja kumpi tekijä,
[34:20] mutta sinä haluat kuitenkin tietää, onko näiden muuttujien välillä yhteyttä
[34:23] ja kuinka voimakasta se on.
[34:25] Niin silloin sinun pitää käyttää erilaista analyysimallia nimeltään korrelaatioanalyysi.
[34:31] Nyt puhutaan kahden jatkuvan muuttujan välisestä yhteydestä, eli yhteystyyppi on taas NumNum.
[34:38] Jos se datana noudattaa normaaliakaumaa, niin silloin käytetään tämmöistä kuin Pearsonin korrelaatio,
[34:43] ja jos taas data ei ole normaalisti jakautunut, niin käytetään epäparametristä versiota, eli Spearmanin korrelaatiota.
[34:51] Jälleen me ei nyt tässä jaksossa pureuduta näihin testeihin tämän tarkemmin.
[Speaker 2]
[34:55] Okei, nyt me siis tutkittiin tota NumNum-tilannetta, mutta meillä on aika paljon yleisempi semmoinen tilanne,
[35:04] että me halutaankin vertailla eri ryhmien välillä vaikka keskiarvoja.
[35:11] Eli me halutaan katsoa, että onko siellä ryhmässä A erilainen keskiarvo kuin ryhmässä B.
[35:17] Huomaa, että tämä ryhmä on nyt kategorinen muuttuja A ja B2-luokkaa.
[35:23] Nyt me ollaan sitten analyysikartalla sivulla yksi, ja esimerkkinä me voidaan vaikka tutkia, että onko tutkimusryhmässä erilainen podimasi-indeksi kuin kontrolliryhmässä, ja nimenomaan keskiarvojen suhteen.
[35:41] Eli tässä tapauksessa meidän vaste on podimasi-indeksi, numeroinen jatkuva muuttuja, ja tekijä on kategorinen, jossa on vielä kaksi luokkaa.
[35:51] Eli nyt me kutsutaan tätä analyysimallia NUMCAT-malliksi.
[35:57] Ja tuossa mun esimerkissä oli äsken kaksi ryhmää, mutta ensinnäisenä sun pitää tuossa analyysikartan sivulta yksikin selvittää, että kuinka monta ryhmää sulla on, kuinka monta keskiarvoa sä haluat vertailla.
[36:09] Ja taas tausto-oletuksia, kun me äskenkin pohdittiin, niin nyt meidän pitää katsoa sitä normaaliakauma-oletusta molemmissa ryhmissä.
[36:20] sinne JMP-henkisen by-group, eli kummassakin ryhmässä katsotaan erikseen sitä normaaliakauma-oletusta.
[36:25] Ja nyt jos meillä on kaksi vertailtavaa ryhmää ja kummassakin ryhmässä data noudattaa normaaliakaumaa,
[36:33] niin silloin me voidaan käyttää studentin t-testiä, jota me usein kutsutaan myös kahden riippumattoman ryhmän t-testiksi,
[36:42] jossa nimenomaan verrataan tätä keskiarvoja kahdessa eri ryhmässä.
[36:48] No, jos se data ei noudata normaaliakaumaa, niin meidän täytyy tehdä erilainen testi, joka ei sitä sitten edellytä.
[36:56] Eli silloin me käytetään Wilcoxonin järjestyssummatestiä, jota me usein kurssillakin kutsutaan Wilcoxon RankSum-testiksi.
[37:04] Ihan näin väännetään se englantia suomeksi, koska julkaisussa nämä kaikki testien nimet on käytännössä katsoen englanniksi, niin sen takia me käydään nekin läpi.
[37:13] Synonyymi tälle testille on Manwethin U-testi ja kaikissa näissäkin tutkitaan kahta riippumatonta ryhmää.
[37:21] Silloin kun me mennään epäparametrisiin testeihin, me ajatellaan yleensä, että me verrataan mediaania, koska nimenomaan kun me ei oleteta sitä normaaliakaumaa,
[37:31] niin silloinhän me ei voida verrata keskiarvoa,
[37:34] koska keskiarvo ei ollut optimaalinen tunnusluku,
[37:37] jos meillä on tosi tosi vino tai muuten outo jakauma.
[37:41] No, mitä me sitten tehdään, jos ryhmiä onkin enemmän kuin kaksi,
[37:45] vaikka sitten sukupuolimies, nainen, muut?
[37:51] Nämä teetestit ja näiden epäparametsit vastineet ei yleisty.
[37:56] Ne toimivat vain tälle kahden ryhmän tilanteessa.
[38:00] Mutta jos meillä on enemmän kuin kaksi ryhmää, niin silloin, jos data noudattaa normaalia kaumaa, niin me voidaan käyttää yksisuuntaista ANOVA-testiä, One Way ANOVA, joka suomeksi on siis varianssianalyysi.
[38:17] Mutta kannattaa huomioida, että tämä nimi on vähän monella tapaa jännä.
[38:22] Me verrataan keskiarvoja, mutta me tutkitaan tätä keskiarvon eroa tutkimalla datassa olevaa vaihtelua.
[38:31] Ja varianssihan on keskihajonta toiseen, joten me tutkitaan sitä sen vaihtelun avulla.
[38:37] Mutta jos se vaste ei ole normaalisti jakautunut näissä ryhmissä,
[38:42] niin silloin meidän epäparametrinen testin nimi on kruskalvalisin testi.
[38:51] Aletaanko me olla, Markus, aika täällä ylärajoilla meidän tilastollisessa ajattelukyvyssämme?
[Speaker 1]
[38:58] Joo, ehdottomasti.
[38:59] Tässä on nyt kyllä tullut ihan infoa mohan täydeltä, niin sanotusti.
[39:05] mutta muistakaa tosiaan, että kaikki tämä tieto mitä me käydään läpi on siellä kurssin sivujen analyysikartassa mitä kannattaa pitää silmällä tässä jatkuvasti.
[Speaker 2]
[39:14] Juu, ja sit vielä tosi tosi tärkeä pointti, mitä mä haluan muistuttaa, että jos siltä henkilöltä on mitattu joku asia kaksi kertaa, niin ne havainnot ei ole riippumattomia.
[39:26] Silloin edellä mainitut testit eivät tietenkään sovi.
[39:30] Silloin me käytämme parittaista t-testiä tai Wilcoxon SineTrank-testiä, joka on suomeksi Wilcoxonin merkittyjen sijalukujen testi.
[39:39] Eli yleensä me lasketaan, jos me mitataan kaksi kertaa, me lasketaan vielä niiden erotus eli esimerkiksi sen muutos muuttuja.
[39:47] Mutta mennään vielä yksi vähän monimutkaisempi asia läpi, vai mitä, joka liittyy myös näihin meidän mainitsemiin juttuihin.
[Speaker 1]
[39:55] Juu, eli tämä viimeinen asia on melko monimutkainen ja se on nyt täysin ok, jos sä haluat antaa tämän mieluummin tutkimusryhmänsä tilastotieteilijälle tehtäväksi, mutta voi olla ihan hyvä olla edes perusymmärrys.
[40:08] Yksi kysymys, joka tulee aina esiin tutkimuksia suunniteltaessa, että noh, entä jos sä haluat ottaa huomioon useampia tekijöitä siinä mallinnuksessa kuin vaan kahta.
[40:17] Niin kuin tässä ollaan nyt puhuttu näistä kaikissa analyysissä on ollut vain kaksi muuttujaa.
[40:23] Eli nyt siis puhutaan siitä aiemmin ohimenen mainitusta NUM on yhtä kuin CAT plus NUM yhteydestä.
[40:30] Eli että vastenmuuttoja on jatkuva ja sitten ne selittävät voi olla sekä kategorisia että jatkuvia.
[Speaker 2]
[40:37] Joo ja tämähän on tosi tosi tyypillinen meidän jokapäiväisessä elämässä.
[40:43] Meidän tutkimusdata on niin monimutkainen, että ei sinne riitä vaan yksi tekijä selittämään sen vasteen käyttäytymistä.
[40:50] vaan me halutaan laittaa sinne monta tekijää, jotka voi olla kategorisia tai numeerisia tai molempia tosiaan.
[40:59] Mä annan esimerkin tästä yhdestä väitöskirjatutkimusjulkaisusta.
[41:05] Me haluttiin tutkia, mitkä tekijät on yhteydessä elämänlaatuun ja sitten me haluttiin myös tutkia, mitkä tekijät on yhteydessä työkykyyn.
[41:16] Me tutkittiin unenlaadun yhteyttä, parisuhteen yhteyttä,
[41:20] podimasindeksin yhteyttä, tupakoinnin yhteyttä, koulutustason yhteyttä,
[41:24] masennuksen ja ahdistuksen yhteyttä, kolmivuorotyötä ja niin edelleen.
[41:27] Niitä oli aika paljon, koska ymmärrätte sitä, että jos me puhutaan elämänlaadusta,
[41:33] työkyvystä, niin ei yksi tekijä millään riitä selittämään sitä.
[41:37] Ja tässäkin tutkimuksessa oli mukana yli 700 Porin kaupungissa työskentelevää ihmistä.
[Speaker 1]
[41:44] Joo, mutta vaikka sitä elämänlaatua tutkiessa tosiaan tarvitaan hirveä määrä niitä mahdollisia selittäviä muuttuja,
[41:52] niin onneksi sitäkin voidaan analysoida ihan tilastollisella mallinnuksella.
[41:57] Ja nyt, koska mukana tässä esimerkissä on sekä jatkuvia että kategorisia tekijöitä,
[42:02] niin me sanottaisiin tätä mallia monisuuntaiseksi tai monentekijän varianssianalyysiksi.
[42:08] Tai yleisemmin voidaan sanoa vain lineaarinen malli, johon voidaan lisätä muuttuja, joita sä haluat kontrolloida.
[42:15] Ja kategoristen muuttujien tapauksessa sä voit käyttää logistista regressiota.
[Speaker 2]
[42:19] Nimenomaan silloin, kun vaste on se kategorinen muuttuja.
[42:23] Usein vieläpä binäärinen kyllä ei, lonkkamurtuma kyllä ei.
[Speaker 1]
[42:27] Joo, kyllä.
[42:27] Hyvä huomio.
[42:29] Eli jos sun vastenmuuttoja onkin sitten kategoriina, niin sä voit käyttää tosiaan logistista regressiota, joka lisää malliin muuttujat, joita sä aloit kontrolloida.
[42:38] Ja tämmönen logistinen regressio antaa sulle eräänlaisen ristisuhteen, eli odds ration.
[42:45] Eli vertailuluvun, jossa esimerkiksi vertaillaan lääkkeen merkitystä lonkkamurtumien vähenemiseen verrattuna johonkin lumelääkkeeseen.
[42:52] Joo, siinä tuli taas paljon asiaa.
[42:57] Meidän piti harjoitella vielä oikean tilastollisen testin valintaa käytännön esimerkeillä,
[43:03] mutta ehkä me voitaisiin siirtää se omaan jaksoonsa, koska tässä on jo puhuttu aika pitkään.
[43:09] Mutta tiivistetään tähän nopeasti vielä loppuun, että mistä kaikesta tänään on oikein puhuttu.
[Speaker 2]
[43:14] No tänään me aloitettiin käymällä läpi paljon määritelmiä, puhuttiin riskitekijästä tai interventiosta,
[43:20] jonka vaikutusta tutkitaan, ja tuloksista, jotka saadaan sen riskitekijän tai intervention seurauksena, eli se vaste, mitä me halutaan oikeasti tutkia.
[43:32] Sitten me keskusteltiin eri tutkimustyypeistä, jotka myös vaikuttavat siihen tilastollisen testin valintaan.
[43:38] Eli ne retrospektiiviset tutkimukset versus prospektiiviset tutkimukset.
[43:43] Eli kerätäänkö se data, joka on jo olemassa, vai aloitetaanko me tutkimus ja tehdään ne mittaukset itse tulevaisuudessa.
[43:51] Ja sitten me puhuttiin havainnoivista versus kokeelliset tutkimukset.
[43:55] Ja sitten me korostettiin sitä, että vain kokeellisesta tutkimusta voidaan tehdä nämä syysseurauspäätelmät.
[Speaker 1]
[44:01] Sen jälkeen me hypättiin yleisiin tilastollisiin testeihin.
[44:06] Joten testeistä puhuttaessa me käytettiin kurssin sitä kaksi sivuista analyysikarttaa.
[44:12] Ensimmäinen tehtävä oli tunnistaa, mikä on vaste ja mikä on tekijä siinä sun datassa.
[44:18] Myös tärkeä komponentti oli tunnistaa, että onko ne havainnot datassa riippumattomia,
[44:23] eli esimerkiksi mitattu eri ihmisistä, vai onko ne riippuvia, eli mitattu vaikka kaksi kertaa sama asia samalta ihmiseltä.
[44:33] Kun se tunnistat vasteen, niin seuraavaksi oli tunnistettava, että onko se vaste numeerinen vai kategorinen muuttuja.
[44:41] Jos vaste oli kategorinen, niin kurssilla käytettiin Kiin 4 tai Fisherin
[44:46] eksaktia testiä havaitsemaan eroja tai yhteyksiä siihen toiseen kategoriseen
[44:51] muuttujaan, eli silloin kun yhteys oli cut-cut.
[Speaker 2]
[44:55] Ja sitten taas jos sun vaste olikin se numeerinen muuttuja, niin piti ensin tutkia
[45:00] sen jakaumaa, että onko se normaalisti jakautunut vai ei, ja valita sen mukaan testi.
[45:07] Koska usein nämä testit, kuten tämä kahden riippumattoman ryhmän t-testi ja yksisuuntainen varianssianalyysi,
[45:13] oletus on nimenomaan se pakollinen taustaoletus, että se vaste on normaalisti jakautunut, ja vielä kaikissa ryhmissä.
[45:22] Ja sitten taas toisaalta, jos vaste ei ole normaalisti jakautunut, monnoksenkaan jälkeen,
[45:27] niin sitten me siirrymme näihin niin sanottuihin epäparametsiin testeihin.
[45:31] Ja niiden kaavat perustuvat vain datassa olevaan järjestykseen.
[45:36] Ja oikeasti me unohdetaan ne havaintoarvot, ne numeroarvot.
[45:41] Eli vain se järjestys merkitsee.
[45:44] Jostain sitten on myös hyötyä se, että poikkeavat arvot ei silloin hetkauta niitä datan tuloksia.
[45:50] Näitäkin testejä olisi kuitenkin erikseen kahden ryhmän vertailuun ja useamman ryhmän vertailuun.
[45:56] Näissä testeissä me aina haluttiin tutkia sitä keskiarvo tai medianitasoeroja ryhmien välillä.
[46:03] Eli siinä suhteessa tämä oli taas tämmöinen num-cat-tilanne.
[46:09] Ja sitten taas, jos me haluttiinkin tutkia kahden numeerisen muuttujan välistä yhteyttä,
[46:14] eli num-num-tilanne, niin silloin siihen sopikin korrelaatiot ja lineaariset regressiot.
[46:22] Tärkeänä yksityiskohtana erikoistapauksena meidän kurssilla oli kahden aikapisteen vertailu, joka usein on tämmöinen ennen-jälkeen vertailu, johon on pakko tehdä erilaiset testit.
[46:34] Ja kun me usein lasketaan tämä muutosmuuttuja, niin me katsotaan sen muutosmuuttujan jakaumaa, ja jos se noudattaa normaalia jakaumaa, niin me voitiin käyttää parittaista t-testiä, tai sitten jos ei noudattanut, niin Wilcoxon SineTrank-testi oli sopiva testi sille.
[Speaker 1]
[46:52] Joo, ja jälleen kerran, tämä kaikki varmasti tuntuu alkuun aivan tuhottoman monimutkaiselta,
[46:58] ja varsinkin jos teet jo omaa tutkimusta, esimerkiksi syvärityötä,
[47:01] niin se voi olla kauhean pelottavaa valita testiä sun tarkkaan kerätylle datalle.
[47:07] Mutta nämä kyllä muistuu mieleen kertaamalla, ja muista aina,
[47:11] että kannattaa pitää lähettävillä esimerkiksi juuri sitä kurssin analyysikarttaa.
[Speaker 2]
[47:16] Ja sitten kannattaa aina myös muistaa, että aina jos on epävarma tai sinulla on joku asia epäselvää,
[47:24] niin sinä voit kysyä ohjaajalta tai sitten sinä voit ottaa yhteyttä meidän biostatistiikan yksikköön.
[Speaker 1]
[47:32] Okei, siinä taisi olla sitten lopulta kaikki tällä kertaa.
[47:36] Tosiaan minä olin Markus.
[Speaker 2]
[47:38] Ja minä olin Elisa.
[Speaker 1]
[47:39] Ja tämä oli Statistiikan aloilla podcast.
[47:42] Toivottavasti tämä jakso innosti sinua oppimaan lisää tilastollisesta testauksesta tai ylipäätään biostatistiikasta.
[47:50] Kuullaan taas Statistiikan aalloilla.
[48:02] Tämän podcastin on tuottanut Turun yliopiston lääketieteellisen tiedekunnan biostatistiikan
[Speaker 2]
[48:07] Yksikkö.
Oletko aloittamassa opinnäytetyötä? Suunnitteletko määrällistä tutkimusta? Tällä Statistiikan aallolla on selkeitä ohjeita erityisesti lääketieteen, bio- ja hammaslääketieteen opiskelijoille sekä väitöskirjatutkijoille, jotka ovat aloittamassa ensimmäistä tutkimustaan. Hyvä tutkimussuunnitelma ja huolellisesti kerätty aineisto on laadukkaan tutkimuksen perusta!
[Speaker 0]
[00:02] Tervetuloa taas statistiikan aalloille.
[00:09] Tällä kertaa kohde yleisönämme on sinä, joka suunnittelet ensimmäistä määrällistä tutkimustasi.
[00:16] Minä olen biostatistikko Markus Riskumäki ja vierainani mulla on jälleen biostatistikko Elisa Löyttyniemi.
[00:19] Tervetuloa.
[00:20] Kiitos, kiitos.
[00:20] minulla on jälleen biostatistikko Elisa Löyttyniemi, tervetuloa.
[00:24] Kiitos, kiitos.
[00:26] Kuulen Elisa, minun pitäisi tehdä nyt syvärityö.
[00:32] Miten minun pitäisi lähteä etenemään sen kanssa?
[00:35] No, minä sanoisin, että onko se sitten syvärityö,
[00:39] tuleva väitöskirja-ekatyö tai vanhemman tutkijan ekatyö
[00:42] tai mikä tahansa työ, niin ensimmäisenä minä tekisin itselleni tiimin.
[00:50] rakentaisin itselleeni tiimin, koska mun mielestä tutkimus on nimenomaan yhteistyötä.
[00:57] Ja siinä on hyvin hyvänä, jos sä saat biostatistikon siihen tiimiin.
[01:04] Ja useinhan, jos sä teet vaikka sitä syvärityötä tai kandityötä tai maisterityötä, niin sulla on ohjaaja.
[01:09] Niin siinä on jo hyvä perusta tiimille, jolla lähdetään miettimään, minkälaista tutkimusta kannattaa tehdä.
[01:18] Okei, no tosiaan mulla nyt ei ole hirveästi tässä mun esimerkissä vielä tietoa, että mitä mä nyt sitten tekisin, että varmaan alkuun pitäisi joku tutkimuskysymys miettiä ja sit varmaan myös tutkimusrakenne.
[01:34] Joo, nimenomaan se, että useahan ohjaajilta tulee niitä ideoita, mitä lähdetään tutkimaan.
[01:40] Ja siinä ensimmäisenä mietitään sitä, että ruvetaanko me tekemään kokeellista tutkimusta, joka tarkoittaa prospektiivista tutkimusta,
[01:49] joka tarkoittaa sitä, että me dataa kerätään tulevaisuudessa.
[01:53] Vai onko se sitten sellaista dataa, joka on jo olemassa, eli retrospektiivinen tutkimus, mennään esimerkiksi potilaspapereihin,
[02:02] mitkä on nykyisin tietenkin noissa tietokannoissa, keräämään se data, mitä sitten tullaan analysoimaan.
[02:08] Eli siinä on tavallaan se oikeasti suuri, vähän raakakin kahtiajako, että onko sitä dataa jo jossain olemassa, vai tullaanko me keräämään se.
[02:18] Ja sitten siinä on tietenkin monta muutakin tutkimuskysymystä, ja nimenomaan pitää eka miettiä sitä, että mitä sä haluat nyt tutkia,
[02:26] ja mikä on se jutun se pointti, punainen langa, mihin kysymykseen me halutaan vastata.
[02:35] Siitähän se kaikki lähtee.
[02:37] Okei.
[02:38] No, leikitään nyt sitten, että mä olen keksinyt tai mun ohjaaja on keksinyt jonkun aiheen mulle.
[02:44] Sen punaisen langan mun tutkimukselle.
[02:47] Mutta miten ihmeessä nyt, sanotaan nyt, vaikka mä haluaisin näyttää jonkun vaikka lääkkeen toimivuuden johonkin sairauteen.
[02:59] Niin miten ihmeessä mä lähden nyt sitä sitten niinku tekemään, mä varmaan tarvitsisin jotain aineistoa siihen, johon puhuttiin.
[03:08] Olemme miettineet, onko se aineisto jo olemassa vai pitääkö meidän kerätä se.
[03:13] Seuraavaksi ruvetaan miettimään, mikä on meidän päämuuttujamme.
[03:16] Millä me voidaan todistaa meidän idea tai kysymys, että saadaan siihen vastaus.
[03:25] Päämuuttujamme voi olla tietenkin hyvin monenlaisia.
[03:28] Jos tutkimme syöpäpotilaita, me halutaan tutkia aikakuolemaan tai aikasyövän uusiutumisen,
[03:36] diagnoosista tai leikkauksesta.
[03:39] Se voi olla myöskin, että me tehdään polvileikkaus ja me katsotaan,
[03:42] milloin se polvi on taas toimintakykyinen.
[03:47] Meillä on lukuisia tietenkin erilaisia kysymyksiä,
[03:52] mitä me voidaan haluta kysyä, mutta kaiken kaikkiaan meidän pitää löytää se meidän kaikista
[03:58] kiinnostaviin muuttuja, millä me tehdään se, millä me halutaan se meidän tutkimuskysymykseen vastata.
[04:04] Okei, nyt meillä on sitten kaikista kiinnostaviin muuttuja olemassa.
[04:11] Tarvitaanko me jotain muita muuttuja kuin se?
[04:14] Joo, ja tästä meidän päämuuttujastakin meidän täytyy tietenkin tunnistaa, minkälainen muuttuja se on.
[04:20] Onko se just tosiaan niin kuin äskeisessä esimerkissä oli aika johonkin, vai onko se numerinen jatkuva muuttuja, vaikka verenpaine,
[04:28] vai onko se sitten kategorinen muuttuja, onko se vaikka paranniko potilas vai ei kuukauden kuluessa, tarvitsiko potilas leikkausta kymmenen ekan päivän aikana jostain antibioottikuuresta vai ei.
[04:39] Nämä on tämmöisiä kyllä ei-kategorisia muuttuja.
[04:43] Eli siitä lähdetään liikkeelle.
[04:44] Sitten me lähdetään siitä meidän tavallaan, kun meidän pitää tuntea myöskin se ympäristö siitä pähämuuttujen ympäriltä,
[04:51] Meidän pitää tietää, mitkä muut asiat voi vaikuttaa siihen muuttujaan.
[04:57] Usein vaikka ikä ja sukupuolikin vaikuttaa jonkun muuttujen käyttäytymiseen.
[05:02] Mutta meidän täytyy miettiä myös kaikki muut taustatekijät, mitkä vaikuttaa.
[05:08] Vaikka syöpätutkimuksissa se syövän vakavuus, eli states, usein vaikuttaa siihen, että mitä siellä sitten tapahtuu.
[05:17] Nyt jos tähän mun tutkimukseen ollaan päätetty se päämuuttuja ja sitten selittäviä muuttujia,
[05:24] niin mitä tästä sitten jatketaan?
[05:27] Esimerkiksi miten paljon sitä dataa mun pitäisi kerätä?
[05:31] Joo, tosi tärkeä pointti.
[05:33] Meidän täytyy aina tutkimukseen laskea se tarvittava otoskoko,
[05:37] jotta voimme riittävällä varmuudella pystyä todistamaan meidän idea todeksi, mikäli se on totta.
[05:45] Me lasketaan tiettyjen kaavojen avulla tarvittava otoskoko meidän tutkimukseen,
[05:50] nimenomaan prospektiivisiin tutkimuksiin lähinnä.
[05:55] Siihen me tarvitaan tietoa aikaisemmista tutkimuksista,
[05:59] esimerkiksi sen muuttujen keskihajonnasta, jos on kysymys numeerisesta muuttujasta.
[06:03] Sitten meidän täytyy myös pohtia se, että mikä ero on kliinisesti merkittävä.
[06:09] Ihan vaikka keskiarvoissa tai sitten, jos me lasketaan tätä potilaan, vaikka paranemisprosenttia verrataan sitä eri ryhmissä,
[06:20] niin mikä siellä on semmoinen, millä olisi kliinistä merkitystä.
[06:27] Nämä retrospektiiviset, eli tavallaan potilaspapereista haettavat tiedot usein rajoittuu siltä,
[06:32] että jos me vaikka tilataan se rekisteri jostakin THL, Kelalta tai jotain,
[06:37] niin sitten me määrätään tai tilataan vaikka 10 vuoden ajalta,
[06:40] niin silloin se data on, mitä on, mutta usein sitä rekisteridataa on niin paljon,
[06:46] eli siinä ei ole se otoskoko usein semmoinen kriittinen asia.
[06:50] Sitä on silloin riittävästi, mutta aina näihin prospektiivisiin tutkimuksiin
[06:54] pitää laskea se otoskokokin.
[06:57] Ja siihen on ihan kaavat ja laskurit, netissä on paljon laskureita olemassa,
[07:01] joita pitää tietenkin sitten vielä varmistaa, että ne käyttää oikeita kaavoja.
[07:06] Okei.
[07:06] No nyt jos otoskokokin on hallussa, niin miten sitten, kun ruvetaan tekemään jotain niitä analyyseja siihen tutkimukseen,
[07:16] käytetäänkö me sitä koko otoskokoa vai pitäisikö jotain havaintoja esimerkiksi jättää pois siitä datasta?
[07:23] Joo, hyvä kysymys tuokin.
[07:27] Esimerkiksi jos me ajatellaan jotain prospektiivista tutkimusta taas, niin silloinhan meiltä kaikilta pitää olla suostumus.
[07:34] Ilman suostumusta me ei saada tietenkään kerätä sitä dataa, ja kuka tahansa tutkimushenkilö voi milloin tahansa lähteä siitä tutkimuksesta pois,
[07:41] ja sen jälkeen sitä dataa me ei sitten yleensä saada ollenkaan.
[07:46] Mutta meillä on paljon, paljon kimuranteja asioita, jos me ajatellaan vaikka lääketutkimusta.
[07:51] Jos me satunnaistamme potilasta saamaan tutkittavaa lääkettä, mutta ennen kuin hän saa
[07:59] ekaaka-pilleriä, niin hän päättääkin, että lopettaa tutkimuksen.
[08:02] Meidän täytyy oikeasti pohtia sitä, että pääseekö analyysiin myös ne, jotka eivät ole
[08:08] yhtäkään tabletteja tai pilleriä nielassut, eli eivät ole saaneet yhtään
[08:11] meidän altistetta tai mahdollisesti parantavaa hoitoa.
[08:17] Tutkimuksessa paljon myös määritellään tutkittaville, että mitä ne saa tehdä, saako ne ottaa muita lääkkeitä vai ei,
[08:23] ja milloin niiden pitäisi tulla takaisin visitille, mittauksille ja näin.
[08:28] Ja ainahan tämä ei mene maailman niinku strömsössä, eli ne syö ihan mitä kiellettyjä lääkkeitä tai tulevat liian myöhässä mittauksia ja muita,
[08:38] niin näitä meidän täytyy miettiä ihan yksi kerrallaan, että onko se silloin semmoista dataa,
[08:45] mikä on käyttökelpoista, mutta yleisesti ottaen me ei koskaan poisteta yhtäkään datahavaintoa,
[08:55] vaan sen takia, että datan arvo ei meitä miellytä, sitä me ei koskaan saada tehdä.
[09:01] Mutta yhtenä esimerkkinä on esimerkiksi, että jos se labranäyte on sulanut,
[09:06] niin silloinhan sieltä tulee todella väärä arvo, niin ei me semmoista voida käyttää.
[09:12] Okei.
[09:13] No, nyt rupeaa ainakin tälleen ajatuksen tasolla olemaan aika selvää, että minkälainen se mun tutkimuksen aineisto pitäisi olla.
[09:21] Niin, mitä nyt sitten, että miten, pitäisikö mun suunnitella jotenkin tehdä vähän jotain tutkimussuunnitelmaa,
[09:29] että miten mä nyt sitten konkreettisesti testaan tällä aineistolla?
[09:32] Juu, juu, tutkimussuunnitelmaa tietenkin tarvii aina tehdä, ja jos sä teet esimerkiksi syväreitä,
[09:39] niin siihenhän kirjoitetaan oikeasti syvärisuunnitelma, ja sit jos me tehdään prospektiivista,
[09:47] kliinistä tutkimusta, niin silloinhan meidän tarvii tehdä oikein todella virallinen tutkimussuunnitelma,
[09:53] joka yleensä kuitatankin, ja sit se lähetetään eettiseen toimikuntaan,
[09:56] Mehän ei saada mitään mittauksia tehdä ihmisistä ilman, että me saadaan esimerkiksi eettisiltä toimenkunnalta tai lääkeviranomaisilta lupaa.
[10:07] Nyt rupeaa kaikki olemaan esivalmistelut aika hyvin valmiina.
[10:15] Seuraavasta varmaan olisi konkreettisesti sen datan kerääminen.
[10:21] Osaisitko sinä antaa vähän neuvoa, mitä siitä pitää ottaa huomioon?
[10:25] Miten se data sitten oikeasti kerätään?
[10:27] Joo, hyvä pointti, koska se sun tutkimuksen laatu on käytännössä katsoen miltein sama kuin sun datan laatu.
[10:34] Jos sun datan laatu on huonoa, niin ei siitä mitään hyvälaatusta tulosta voi tulla.
[10:40] Eli siihen datan laatuun kannattaa todella kiinnittää huomioon.
[10:46] Meillähän on Turun yliopistossa käytössä REDCAP, joka on elektroninen tiedonkeruun lomakesysteemi,
[10:52] jolla voi kerätä mitä tahansa, myös tätä niin sanottua vanhaa potilasdataa, me voidaan syöttää sinne dataa.
[11:00] Me voidaan tehdä sillä kyselytutkimuksia ja totta kai kuinka monimutkaisempia prospektiisia tutkimuksia vaan me voidaan kerätä tämän systeemin järjestelmän avulla.
[11:11] Ja tämän järjestelmään me voidaan laittaa tämmöisiä niin sanottuja validointitarkistuksia.
[11:16] Eli otetaan nyt esimerkiksi se verenpaine, niin me voidaan laittaa sinne tämmöiset minimi ja maksimiarvot,
[11:22] minkä välillä me kuvitellaan, että melkein kaikki verenpaineet on.
[11:26] Jos me syötetään joku arvo sen yli, niin tämä kone rupeaa meille huutamaan, että ootko varma?
[11:34] Eli se säästää meidät näppäilyvirheiltä.
[11:38] Lisäksi tämä on hyvä tietokantaohjelma niin, että siellä on tämä jäljitettävyys, eli jokaikinen sinun klikkaus jää sinne, siitä jää jälki.
[11:47] Eli en suosittele Exceliä käytettäväksi käytännössä katsoen koskaan, koska ehkä Excelissä ei ole tätä.
[11:54] Ja Excelin, muutenkin tavallaan, sinä voit tehdä siellä niin paljon helpommin virheitä nuorena tutkijana,
[12:02] Jos sinulla on numerinen muuttuja, vaikka se verenpaine, niin sinun ei pitäisi kirjoittaa yhden potilaan kohdalle, että puuttuu.
[12:11] Silloin kaikki tilasto-ohjelmat automaattisesti lukevat koko sen muuttujan tekstikentäksi, ja jos sinulla on tekstikenttä, niin siitä ei keskiarvoja lasketa.
[12:19] Joten tämmöisiä onnettomia sattumia tulee sitten nimenomaan Excel-datoista.
[12:25] Mutta taas jos sä teet sen RedCapilla, niin se auttaa sua, että siitä datasta tulee paljon parempi laatuista.
[12:33] Ja jos data on parempi laatuista, niin tilastolliset analyysit, aah, ne on helpompi tehdä.
[12:38] Ja tietenkin ne on sitten oikeimmat tulokset, koska data on parempi laatuista.
[12:45] Pysähdytään hetkeksi vielä miettimään tutkimussuunnitelmaa.
[12:49] Mitä siihen suunnitelmaan oikein pitäisikö kirjoittaa?
[12:53] No jos me ajatellaan tutkimussuunnitelman tärkeimpiä kappaleita esimerkiksi,
[12:59] niin sehän aloitetaan aina introlla, eli johdanto-osalla,
[13:04] ja siihen me kootaan oikeasti mitä tästä alueesta aikaisemmin jo tiedetään,
[13:11] minkälaista tutkimusta on tehty, ja sitä siihen sitten tiivistetään.
[13:16] Joko sen kappaleen loppuun tai ihan erikseen on semmoinen kappale kuin tutkimuksen tarkoitus, the aim of the study.
[13:23] Ja siinä nimenomaan sitten kirjoitetaan, että mitä mä oikeasti, mihin kysymykseen mä haluan vastata, mitä mä haluan tällä tutkimuksella saavuttaa.
[13:33] Sen jälkeen me kerrotaan kaikki kerättävät muuttujat ja niiden tavallaan mittausmenetelmät.
[13:41] Onko ne jotain kyselybattereista, mistä me kysytään, päivän väsymystä, elämänlaatua, vai onko ne ihan mittauksia niin kuin hemoglobiini.
[13:51] Sitten me esitetään myös, joka tutkimussuunnitelmassa pitää olla se otoskoon määritelmä ja myöskin se vähän niin kuin se kaava esitettynä,
[14:00] eli joku, joka sitä katsoo sitä tutkimussuunnitelmaa, pystyisi jopa toistamaan sen niillä numeroilla.
[14:06] Ja sen lisäksi me tarvitaan se statistinen ja datasuunnitelma sinne.
[14:12] Ja jos on oikein hyvä, niin kannattaa miettiä jo niitä tulevia taulukoita sun raporttiin tai julkaisuun,
[14:20] jotta sä varmistat sen, että kaikki ne tarvittavat muut tuet tulee sitten kerättyä,
[14:26] koska sitten jälkeenpäin niitä ei sitten mistään saa.
[14:29] Lisäksi tutkimussuunnitelmassa on tietenkin muitakin kappaleita,
[14:35] Esimerkiksi eettisyydestä puhutaan ja niin poispäin.
[14:38] Okei.
[14:39] No, nyt mä uskon tietäväni, miten mä saan mun oman tutkimuksen alkuun.
[14:45] Otetaanpas teillekin tässä lopuksi vielä tiivistelmänä.
[14:51] Eli, ensimmäisenä sun pitäisi kasata itsellesi tiimi.
[14:55] Tämän jälkeen tehdä tutkimussuunnitelma huolellisesti,
[14:59] jossa mietitään huolellisesti ja täsmällisesti tutkimuskysymys, tarvittava data, datan keräys sekä analyysisuunnitelma.
[15:10] Tämän jälkeen sitten pitäisi kerätä se data, tämän jälkeen analysoida se data suunnitelman mukaisesti ja vielä lopuksi raportoida tulokset.
[15:20] Mutta tulosten raportointi on sen verran iso aihe, että siitä ei kyllä sitten puhuta tässä jaksossa sen enempää.
[15:27] Ja loppuun muistakaa, tutkimuksen laadun varmistaa hyvä data.
[15:33] Hei, kiitos sulle Elisa.
[15:34] Kiitos.
[15:35] Ja kiitos sinulle kuuntelija.
[15:37] Toivottavasti tämä jakso selvensi sulle vähän, kuinka suunnitella sun ensimmäinen tutkimuksesi.
[15:42] Kuullaan taas statistiikan aloilla.
[15:55] Tämän podcastin on tuottanut Turun yliopiston lääketieteellisen tiedekunnan biostatistiikan yksikkö.
Tässä Statistiikan aallossa kirurgian professori Paulina Salminen kertoo tutkijan urastaan ja korostaa biostatistiikan keskeistä roolia laadukkaassa tutkimuksessa aina suunnittelusta alkaen. Kuule, miksi biostatistiikan osaaminen ja moniammatillinen yhteistyö on välttämätöntä. Jakso sisältää myös tärkeän viestin tilastotieteilijöille: kliininen ymmärrys ja kyky keskustella sujuvasti kliinikoiden kanssa on tärkeä osa ammattitaitoa. Tämä jakso on suunnattu erityisesti lääketieteen, bio- ja hammaslääketieteen opiskelijoille sekä tutkijoille.
[Speaker 1]
[00:03] No niin, tervetuloa takaisin statistiikan aalloille.
[00:10] Minä olen biostatistikko Markus Riskumäki ja tällä kertaa meillä on vieraana ihan ihka oikea lääkäri, professori ja tutkija Pauliina Salminen, tervetuloa.
[00:15] Kiitos paljon.
[Speaker 2]
[00:20] Miten sä sait idean opiskella lääkäriksi?
[00:20] Aloitetaanpas ihan alusta.
[Speaker 1]
[00:23] Todella alusta siis.
[Speaker 2]
[00:26] Todella alusta siis.
[00:29] Mä sain idean opiskella lääkäriksi oikeastaan vasta ihan lukion loppuvaiheessa, joka tarkoittaa sitä, että silloin, kun siitä on muutama vuosi aikaa, kun olen hakenut lääketieteellisen tiedekuntaan,
[00:44] niin käytännössä mulla oli todella surkeat aineet lukiossa, mulla oli neljä kieltä ja lyhyt matematiikka, ei lainkaan kemiaa tai fysiikkaa.
[00:52] Ehdin ottaa yhden kemian lisäkurssin siinä kohtaa, kun ymmärsin, että ehkä haluankin hakea lääkikseen.
[00:59] Fysiikkaa en lukenut ollenkaan.
[01:02] Fysiikkaa suoritin kirjoitusten jälkeen iltalukiossa.
[01:09] Tein opettajansijaisuuksia päivällä ja menin iltalukiossa lukemaan fysiikkaa.
[01:12] Sen jälkeen tein ravintolatöitä illalla ja suoritin laajan fysiikan siinä.
[01:18] Sitten mä hain lääkikseen, mutta onneksi siinä kohtaa oli pääsyukeissa vielä niin, että fysiikasta oli neljä ainetta, oli aineisto, kemia ja fysiikka ja sitten ihmisen fysiologia ja anatomia ja huonoin niistä tiputettiin pois, mutta kaikista piti päästä läpi.
[01:33] Mä onneksi pääsin läpi siitä laajasta fysiikasta, mutta se oli niistä se heikoin, mutta jotenkin mulla tuli sitten yhtäkkiä siinä lukion lopussa sellainen olo, että ehkä musta tulee lääkäri.
[01:44] ihan varmaan vielä ollut, kun samaan aikaan, kun mä pääsin sitten lopulta sisällön lääkikseen,
[01:49] niin mä hain myöskin lukemaan englantilaista filologiaa, kun mä aina ajattelin, että musta tulee kieltenopettaja.
[01:55] Ja mä pääsinkin myös sisälle sinne, ja sitten mulla oli vielä semmoinen illuusio, että mä ajattelin, että mä teen ne molemmat.
[02:02] Mutta sitten mä kävin siellä humanistisen tiedekunnan puolelle ja totesin, että tämä ei ehkä kuitenkaan ole se mun juttu.
[02:10] jätin ja annoin sen paikan pois, joka sinänsä hauska tarina, sen sai yks mun kurssikaverini vaimoilta.
[Speaker 1]
[02:17] Okei, no sit kun sä pääsit sinne lääkikseen, niin missä vaiheessa opintoja sulle tuli ajatus, että nyt vois ihan väitöskirjaankin tästä kirjoittaa?
[Speaker 2]
[02:26] Tota, no se tuli kyllä oikeastaan vasta ehkä siinä opintojen loppuvaiheessa, että mulla ei oo siis suvussa yhtään lääkäriä, joka on aika niin kuin tyylensä hän menee vähän niin kuin perheittäin.
[02:39] Se mikä kyllä kristallisoitui oikeastaan siinä opiskelujen aikana oli jo se, että luulen, että kirurgia on se minun juttu.
[02:48] Se oli kyllä aika selkeästi.
[02:51] Muut oli aika helppo pois sulkudiagnostiikalla ja itse asiassa olin kyllä vahvasti sitä mieltä opiskelun loppuvaiheessa,
[02:58] että ilman muuta siirryn tai rupean herkostumaan kirurgiaan.
[03:02] Ja mä en itse asiassa valmistumisen jälkeen tehnyt mitään muuta kuin kirurgiaa, koska siinäkin oli tämmöinen pieni porsaareikä.
[03:08] Että mulla on vanhanmuotoinen kirurgian erikoislääkärin tutkinto ja uudenmuotoinen asetuksen gastroenterologisen kirurgian tutkinto.
[03:15] Mutta sit se oli tosiaan niin, että ei tarvinnut enää käydä terveyskeskuksessa sen jälkeen, kun oli yksi erikoislääkärin tutkinto.
[03:22] Joten mä en sit edes mennyt terveyskeskukseen valmistumisen jälkeen.
[03:26] Toki tein opiskelun loppuvaiheessa terveyskeskuksessa sijaisuuksia.
[03:30] mutta se tutkimus tuli mukaan siinä oikeastaan aika pian, että ajattelin nimenomaan, että rupean tekemään väitöskirjaa.
[03:39] Haluan tehdä yliopistosairaalassa varmaankin töitä.
[03:43] Aloitin itse asiassa väitöskirjan, jossa olisi ollut perustiedettä mukana,
[03:51] eli vähän mikroskopointia ja muuta, ja me tehtiin siitä itse asiassa kolme julkaisua,
[03:55] mutta sitten mä totesin, että ei kyllä.
[03:57] Mä rupean tekemään varmaan kliinistä väitöskirjaa.
[03:59] Mä tein ensimmäiseksi semmoisen osa-väitöskirjan, sitten mä vaihdoin aihetta,
[04:04] ja rupesin tekemään refluksitaudin kirurgisesta hoidosta.
[Speaker 1]
[04:08] Okei.
[04:08] Millaiset ohjaajat sulla oli väitöskirjaa tehdessä?
[Speaker 2]
[04:12] No itse asiassa väitöskirjan kliininen aihe tuli siitä, että nyt jo eläkkeellä oleva yksi,
[04:18] ehdottomasti eniten minulle laparoskopiaa, eli tähystyskirurgiaa opettanut kollega Jari Ovaska oli silloin ihan pioneera
[04:28] laparoskooppisessa kirugiassa Suomessa ja hän oli tehnyt silloin aikaisemmin tämmöisen avointa ja tähystyskirurgista
[04:34] leikkausta vertailevan sarjan, joka oli semmoinen mihin tarvittiin tutkia ja se osui sopivasti siihen, että olin tulossa
[04:40] tulossa tavallaan siihen töihin ja mä jotenkin itse näin itseli selkeästi enemmän semmosessa tutkimuksessa,
[04:47] minkä tuloksia voisi oikeastaan soveltaa suoraan siihen potilashoitoon.
[04:52] Ja se oli se, että Jari oli tosiaan mulla väitöskirjaohjaajana sitten siinä.
[Speaker 1]
[04:59] Okei.
[04:59] No jos sä pitäis sanoa yksi asia, mikä väitöskirjan tekeminen sulle opetti näin myöhempään uraa-aatelle,
[05:05] niin mikä se voisi olla?
[Speaker 2]
[05:08] Se, että kannattaa opetella, miten tutkimus tehdään ennen kuin aloittaa sen tekemisen.
[05:13] Tietysti sanotaan, että silloin kun on esimerkiksi juurikin tämä pitkäaikaisseuranta, mikä siinä väitöskirjassa on,
[05:21] niin se on ehdottomasti hienoa, mutta jos nyt me ajatellaan, millaista tutkimusta on tehty 80 ja 90-luvulla verrattuna siihen,
[05:29] että mitä se on.
[05:30] Tutkimuksen metodologia ja kaikki, mikä siihen liittyy, on aivan eri tasolla tällä hetkellä.
[05:39] Väitöskirjan tekeminen ehkä opetti minulle sen, että kun väistämättä tuli luettua, niin aloitin miettimään, että ei hetkinen.
[05:46] Tämä todennäköisesti pitäisikin tehdä näin ja näin.
[05:50] Jotenkin se herätti ajatuksen siitä, että metodiikka on tietysti olennainen osa tätä, mitä me tehdään.
[Speaker 1]
[05:59] Mitäs väitöskirjan jälkeen?
[06:01] Menitkö ulkomaille postdoc-kaileen, minne?
[Speaker 2]
[06:06] En itse asiassa mennyt ikinä missään vaiheessa ulkomaille postdoc-tutkijaksi.
[06:13] Nykyään tietysti kierron ympäri maailmaa ehkä keskimäärin 50-60 päivää vuodessa luennoimassa.
[06:19] Mutta mä en ikinä sitten loppujen lopuksi mennyt.
[06:22] Se osui jotenkin sellaiseen kohtaan tavallaan samanaikaisesti, kun mä tein sitä tutkimusta.
[06:28] Sitten oli oikeastaan hirveän täydellinen kohta siihen, että mä pääsin tekemään sellaista kliinistä työtä, mitä mä halusin.
[06:35] Sitä kautta me päästiin jatkamaan sitä meidän tutkimusta myöskin ja mä jatkoin sitä kliinisen tutkimuksen tekemistä ja rupesin tekemään näitä omia isoja juttuja.
[06:46] Toki silloin lapset olivat tietysti myöskin pieniä, että se olisi tarkoittanut aika isoa muutosta.
[06:52] Jotenkin se kattaus oli sellainen, että pääsin hyvin tekemään täällä.
[06:59] Sitä tarvetta ei ehkä ihan sellaisenaan syntynyt, mutta jatkoin kyllä tutkimuksen tekemistä oikeastaan siinä suoraan.
[07:06] Muistan yhden kerran, kun ohjaajani sanoi, se oli muutama päivä ennen väitöstä,
[07:11] kun mä sanoin, että mä olin keksinyt yhden seuraavan aiheen, että mitä me seuraavaksi voidaan tutkia.
[07:17] Hän sanoi, että ymmärräksi, että sulla on väitös kahden päivän päästä.
[07:20] Mä sanoin, että joo, mutta mulla tuli tämmönen mieleen, että sen jälkeen katsotaan tästä samasta aineistosta tämä ja tämä asia.
[07:28] Kyllä mä jotenkin siitä jatkoin, se oli mun mielestä semmoinen varmaan mun juttu, tai koin omakseni heti.
[Speaker 1]
[07:38] Tämmöinen kysymys, mikä varmasti meidän varsinkin tutkija-opiskelijakuulijoita voisi kiinnostaa.
[07:45] Kun sä aloitit tämän tutkimustyön tekemisen valmistumisen jälkeen tosissaan,
[07:51] niin oliko helppo saada aluksi rahoitusta?
[07:55] Mitä sun mielestä olisi parhaat vinkit tutkimuksen rahoituksen saamiseen?
[Speaker 2]
[08:02] Voi että kun mulla olisikin joku viisasten kivi tähän.
[08:05] Tämän vastaus on se, että vasta aika myöhäisellä vaiheessa tutkijauraa käytännössä on helpompi hiukan saada rahoitusta.
[08:16] Se on selvää, että semmoisen aloittelevan tutkijan rahoituksen saaminen on kyllä ihan todella kiven takana, kun se on kokenenkin tutkijan.
[08:24] Elikkä mä sanoisin, että ehkä se mun neuvo siihen innokkaille tutkijoille on se, että sun täytyy etsiä se vähän vanhempi, hyvä tutkija ja hyvä tutkimusryhmä, mihin sä pääset mukaan.
[08:36] Ja silloin tavallaan se on ehdottomasti win-win, että kaikki tekee niinku, ne meidän nuoret tutkijat tekee paljon töitä, mutta silloin vastaavasti musta se on mahtavaa, että nyt mä pystyn auttamaan heitä.
[08:46] ettei tarvitse tehdä ihan kaikkea selkänä hastaa lähtien, eikä tarvitse kantapään kautta opetella jokaista samaa virhettä.
[08:54] Eli sehän siinä on ehkä se ajatus, mikä mielestäni on tosi tärkeä tutkijoille, että meillä olisi tutkijakoulutus.
[09:02] Että oikeasti mentoroidaan näitä nuoria sen sijaan, että jos ajattelen kaikki ne virheet, mitä olen tutkimuksissa tehnyt,
[09:12] niin ne olisi tietysti iso osa ollut ohitettavissa sillä, että siinä olisi ollut joku kertomassa, että miten se kannattaa tehdä.
[09:18] Mutta toki siinä vaiheessa Suomessa ei kauheasti edes ollut tehty niin kuin kliinisiä, satunnaistettuja tutkimuksia.
[09:24] Tämä on vähän niin kuin semmoinen ollut meidän oma oppipolku, ja nyt tietysti niin kuin...
[09:29] Onneksi tällä hetkellä meillä on kohtalainen rahoitus, mutta sitä tietysti niin kuin tutkimusrahoitusta ei missään nimessä ole liikaa.
[09:36] ja se surullinen tilanne on se, että se on melkein aina se, mistä ensimmäisenä säästetään.
[09:41] Vaikkakin jos me ajatellaan, että mitä oikeasti me saadaan terveydenhuollossa säästöjä,
[09:46] niin ne asiat perustuvat tutkittuun tietoon, eikä mihinkään muuhun.
[09:50] Eli eteenpäin me ei päästä lääketieteessä, jos meillä ei ole mahdollisuutta tehdä tutkimusta.
[Speaker 1]
[09:57] Tutkimuksesta puheen ollen.
[09:58] Sulla on nyt tällä hetkellä kaksi tämmöistä suurempaa tutkimuslinjaa,
[10:02] lihavuusleikkaukset ja umpilisäkkeen tulehdukset.
[10:04] Haluaisitko lyhyesti avata niitä, ennen kuin jatketaan?
[Speaker 2]
[10:09] Voin avata ehkä lihavuuden osalta.
[10:13] Vaikean lihavuuden kirukinen hoito on Suomessa käynnistetty 20 vuotta sitten.
[10:17] Olen ollut mukana silloin alusta lähtien.
[10:21] Tällä hetkellä se on se, minkä pohjalta kierrän eniten maailmassa.
[10:26] Olen tällä hetkellä mukana myös maailman lihavuuskiruukisen järjestön hallituksessa.
[10:30] joka on sellainen 10-15 000 ihmisen järjestö.
[10:35] Tämä lihavuusepidemiahan on ihan tasaisesti edelleen valitettavasti kasvava yksi maailman suurimmista terveysongelmista tällä hetkellä,
[10:45] ja sitä kokonaisuutta me ei voida leikkaamalla hoitaa, mutta siihen pieneen potilasryhmään tämä vaikean lihavuuden kirurgian hoito on aivan olennaisen tärkeää ja erittäin kustannustehokasta ja vaikuttavaa.
[10:59] ja sitä me ollaan tutkittu vertailemalla itse asiassa kahta yleisintä leikkausta ja me aloitettiin se heti silloin oikeastaan aika lailla mun väitöksen jälkeen.
[11:07] Se on mun ensimmäinen satunnaistettu tutkimukseni ja sen pohjalta ollaan opittu monta asiaa mitä me tehtäisiin ehkä
[11:14] ja tehtiin kinssit jo seuraavissa tutkimuksissa eri tavalla ja silti se on oikeasti niin kun pitkäaikaisseurantana erittäin hyvä 10 vuoden seuranta julkaistiin juuri viime kesänä.
[11:25] Umpilisääketulehduksen osalta tämä on selkeästi vielä ehkä enemmän semmoinen kontroversiallinen aihe.
[11:31] Jotenkin kliinisesti me tiedettiin, että läheskään kaikkia lieviä umpilisääketulehduspotilaita ei välttämättä tarvitse leikata,
[11:39] mutta se on ollut vähän semmoinen kivenhakattu totuus yli 130 vuotta lääketieteessä.
[11:46] Ja me oikeastaan haluttiin selvittää, että onko se näin.
[11:50] Mitä tavallaan tapahtuu sille lievemmälle umpilisäketulehdukselle.
[11:54] Ja sillä samalla tiellä ollaan.
[11:56] Mitä enemmän me tutkitaan, sitä enemmän me keksitään uusia kysymyksiä.
[11:59] Mutta nyt ollaan jo neljännessä satunaista tuossa tutkimuksessa tällä hetkellä.
[Speaker 1]
[12:04] Joo, joo.
[12:05] Tuo onkin varmasti tutkimusrypäs, joka meidän kuulijoidenkin kiinnostaa.
[12:11] Eli nämä umpilisäkeentulehdustutkimukset.
[12:14] niin sehän on aika villi tämä tutkimusidea, niin miten ja kuka sai alunperin idean,
[12:19] tämän idean, ettei komplisoitumatonta eli lievää ompilisäkkeentulehdusta tarvisikaan leikata välttämättä?
[Speaker 2]
[12:26] No kyllä se on itse asiassa, kauhean mielellään sanotaan, että me keksittiin se, mutta se ei suinkaan pidä paikkaansa,
[12:32] vaan se itse asiassa, niin kuin tiedettiin, tämä on hyvä katsoa muutenkin lääketieteen historiaan,
[12:38] Meillähän on paljon sellaisia totuuksia, jotka perustuvat oikeasti ei mihinkään tutkittuun tietoon, vaan tällaiseen eminence-based,
[12:47] ei evidence-based, eli ihan kokemukseen.
[12:49] Ei niin, että joku olisi oikeasti tarkoilla tieteellisillä menetelmillä arvioinut jotakin.
[12:55] Tämä on yksi hyvä sellainen esimerkki.
[12:58] Se lähtee se ajatus jo siitä, että itse asiassa tiedettiin ennen appendikektomia-aikaa,
[13:05] että potilailla obduktiotutkimuksessa nähtiin merkkejä aikaisemmista tulehduksista.
[13:11] Eli se mahdollinen ajatus siitä, että se paranee itsestään, on oikeasti jo 1800-luvun ihan lopulta.
[13:17] Mutta sitten tavallaan ennen antibioottiaikaa, niin se on ihan selvää, että leikkaushoito pelasti ihmishenkiä.
[13:22] Ja siinä jotenkin ehkä kääntyi se ajatus siihen, että ajateltiin, että se aina päätyy siihen,
[13:29] että pisteestä A pisteeseen B niin, että kun se alkaa tulehtua, se puhkee lopulta, ja se jotenkin iskostui myös maallikoiden mieleen.
[13:38] Mutta kyllä me kliinisessä käytännössä tiedettiin, että näin ei ole.
[13:43] 50-60-luvulta on muutama isokin potilassarja, jotka on käytännössä vajennettu aika kuoliaksi,
[13:48] eli oikeasti konservatiivisesti hoidettuja, juurikin näitä konservatiivisesti ilmanleikkausta hoidettuja umpilisäketulehduksia.
[13:56] Ja sitten me todettiin, että tämä on kyllä semmoinen asia, että on pakko selvittää, että onko sitä oikeasti näin.
[14:03] Ja toisaalta mielestäni meillä ei ollut kenelläkään semmoinen ajatus, että me oltaisiin...
[14:07] Tämä mun tutkimusryhmä koostuu pitkälti kirugeista, niin kenelläkään ei oikeastaan ollut semmoinen ajatus,
[14:13] että olisi pakko saada joku tulos, että me halutaan nyt ehdottomasti osoittaa, että ei tarvi leikata tai tarvii leikata,
[14:20] vaan me haluttiin vaan oikeasti nähdä, että miten tässä käy.
[14:22] Minulla olisi ollut periaatteessa ihan samaa, että mikä se tulos olisi ollut, mutta se on ihan selvä, että se on sen tutkimisen väärtti.
[14:28] Jotenkin se, miksi me haluttiin tutkia, joku aina kysyi, että miksi kirurgit tutkivat sitä, että ei leikata, niin kyllä minä sanoisin, että se on minusta meidän sellainen myöskin yleinen vastuu siitä asiasta,
[14:39] että meidän täytyy tehdä vaikuttavia hoitoja, koska meidän terveydenhuollon rahat ovat tietysti rajalliset.
[14:46] Eli meidän täytyy oikeasti keskittää ne hoidot sellaisiin asioihin,
[14:50] mistä me saadaan sitten todellista hyötyä potilaille.
[Speaker 1]
[14:54] Joo.
[14:55] Sä mainitsit tästä, että toi on vähän niin kuin vuosikymmenien saatossa
[15:00] iskostunut kauhean tiukasti toi idea,
[15:02] että aina pitää umpilisäkkeen tulehdus leikata.
[15:06] Niin sitten kun te halusitte kumminkin lähteä tätä niin kuin oikein tieteellisesti tutkimaan,
[15:12] Niin oliko tähän ekaan umpilisäketulehdustutkimukseen vaikea saada rahoitusta sitten?
[15:17] Lähtikö porukka mukaan tähän?
[Speaker 2]
[15:18] Se on hauskaa, että se kysyt, että tässä on kaksi eri asiaa.
[15:21] Kohta A, oliko vaikea saada rahoitusta?
[15:24] Todella vaikea, koska meillä ei ollut mitään rahoitusta.
[15:26] Tässä on hyvä tarina, oli se, että yhdysvaltalaiskollega, joka kanssa paljon tein yhteistyötä,
[15:31] ja on tehnyt ison appedisiittitutkimuksen itse, niin hän kysyi,
[15:37] että millainen infrastruktuuri meillä oli siihen ensimmäiseen tutkimukseen?
[15:41] että ihan se, mikä siinä lukee artikkelissa, että me voidaan kaikki nimetä ne meidän infrastruktuurit.
[15:46] Että ihan oikeasti se on tehty kyllä meidän tutkijoiden selkänahdasta, että mulla ei ollut mitään rahoitusta siihen ensimmäiseen.
[15:53] Että ihan yksittäisiä, mitä sitten saatiin tutkimusvapaisiin, mutta mitään isompaa rahoitusta ei ollut siihen.
[16:02] Ja jotenkin ehkä se, että miten porukat lähtivät mukaan, niin se oli kyllä aika hankalaa.
[16:08] Se ensimmäinen tutkimus oli sellainen, että selkeästi tuli vähän semmoinen olo, että saatte olla ehkä tahoja, jotka ajattelivat, että minkä ihmeen takia te tutkitte tällaista asiaa, että aivan älytöntä, että eikö se nyt ole ihan selvä ja tämä on se tavallisin leikkaus, mitä tehdään ja selkeästi se herätti sellaista vastustusta.
[16:28] mikä minusta oli ehkä jopa hiukan yllättävää, mutta tosi positiivista oli se, että tämä ei tullut kyllä potilaiden osalta.
[16:35] Potilaat on tavallaan jotenkin Suomessa, se on yksi hyvä asia Suomessa on ehdottomasti se, että meillä on niin hyvä tämä tutkimuslupajärjestelmä ja tämä koko terveydenhuoltojärjestelmä.
[16:46] Eli potilaat luottaa kyllä siihen ja niiden kuuluukin saada luottaa, koska he on todella tarkkaan katsottu.
[16:53] Eli potilaat kyllä tosi innokkaasti lähtevät mukaan ja suomalaiset arvostavat tavallaan tieteen tekemistä ja kokevat tärkeäksi, että he voivat olla mukana auttamassa sitä.
[17:02] Se ei ollut oikeastaan se ongelma, että potilaat eivät olisi ollut innostuneita lähtemään mukaan ollenkaan, mutta sanotaan, että ehkä vähän niin kuin sen,
[17:10] että jos me verrataan, että meillä on tällä hetkellä menossa, alkaa sitten keväällä niin APAC 4, niin kyllä kakkonen ja kolmonen oli jo helpompia kuin ykkönen.
[17:20] Jopa kirurgien vastustus hiukan alkaa mennä pois, kun nyt me tiedetään oikeasti, että iso osa niistä voidaan hoitaa.
[17:28] Se sama resurssi voidaan käyttää johonkin muuhun hoitoon, koska niin kuin sanottu, ne resurssit on rajalliset.
[17:36] Pikku hiljaa.
[17:37] Keskimäärin on arvioitu, että vakiintuneiden hoitokäytäntöjen muuttaminen vie noin 17 vuotta.
[17:42] Meillä on siitä vähän vielä matkaa, mutta lähestytään sitä.
[Speaker 1]
[17:48] Mainitsit jo tuossa jossain vaiheessa, että enimmäkseen sun tutkimustiimi koostuu kirurgeista, niin ketäs muita sun tutkimustiimiin kuuluu?
[Speaker 2]
[17:58] No mun tutkimustiimiin kuuluu aivan kriittisenä osana.
[18:02] Pitkään mun kanssa töitä tehnyt biostatistikko, hurmeen saijoilta ilman, mä en missään nimessä tule toimimaan.
[18:09] Mä sanon, että hän voi tehdä ihan mitä tahansa muuta, mutta hän ei voi koskaan lopettaa mun tutkimusryhmässä olemista.
[18:16] Se on aivan olennainen osa ja se liittyy siihen, mistä sanoin alussa, eli tavallaan se ymmärrys siitä, että mikä se tieteellinen metodologia on,
[18:26] niin se on ainoa mahdollisuus, miten tehdä järkevä kliininen tutkimus, koska se hulluin tilanne on se, että me nähdään aivan jäätävä vaiva jonkun kliinisen,
[18:35] satunnaistutun tutkimuksen tekemiseen, mutta me ollaan valmiiksi osahdettu oma oksa poikki niin, että me tehdään se metodologisesti väärin,
[18:42] väärin tai meillä ei ole riittävän hyvää biostatistista pohjaa siihen, niin silloin kaikki se vaiva, mitä siihen on nähty,
[18:50] käytännössä menee hukkaan, jos meillä on tutkimus, joka on rakennettu suunnitelmaltaan sellaisella setelmalla,
[18:56] että me ei oikeasti voida sanoa siihen yhtään mitään.
[18:59] Niinpä niin.
[18:59] Eli biostatistiikka on aivan olennainen ja se pitää olla nimenomaan sieltä alusta lähtien, ei missään nimessä siinä kohtaa,
[19:07] kun me saadaan tulokset, siinä kohtaa me ollaan liian myöhässä, eli se pitää ehdottomasti olla sieltä alusta lähtien.
[19:13] Ja se mikä siinä ehkä nyt varsinkin tietysti kun Saija on ollut mun kanssa 15 vuotta, varmaan mahtaakin ihan riittääkään,
[19:22] niin siinä on jo sellainen, että se keskustelu, koska rehellisesti sanon esimerkiksi biostatistiikan osalta,
[19:28] niin välillä on se, että biostatistiikkojen aivot toimii eri tavalla kuin muiden ihmisten aivot.
[19:35] Siinä on semmoinen, että löydetään semmoinen hyvä balanssi siihen, että mikä on tavallaan oikeasti mahdollista tilastotieteellisesti ja sitä ajatellaan kliinisesti.
[19:45] Niin semmoiseen on kyllä painonsaarvoinen kulta semmoinen statistikko, joka ymmärtää myös kliinisten tutkimusten tekemisestä.
[19:52] Se on todella olennainen, ja se on ehkä semmoinen, mitä olen sanonut myös sekä syventävien opiskelijoille että väitöskirjatutkijoille,
[20:01] on se, että sen biostatistiikan ymmärtämis on semmoinen, mitä valitettavasti opetetaan aivan liian vähän lääkiksessä.
[20:07] Eli meidän pitäisi saada lääkäreitä, jotka osaavat esimerkiksi nykyinformaatiotulvassa, niin sä pystyt lukemaan tutkimuksista,
[20:16] että näet aika suoraan heti, että onko tämä oikeasti millään tavalla validita tutkimusta, nämä johtopäätökset, mitä siitä voidaan tehdä,
[20:24] koska sitä sinä et voi tehdä millään muulla kuin se, että tietysti sinun täytyy katsoa, että onko se kliininen asetelma järkevä,
[20:29] mutta myöskin se, että onko se tutkittu sillä tavoin.
[20:32] Sen lisäksi meidän tutkimusryhmässä nykyään on, itse asiassa meillä on oikeastaan vähän kaikkien erikoisalojen ja näiden alatutkimusten erityisosaajia.
[20:44] ja mikrobiologian osalta meillä on mikrobiologit, immunologian osalta immunologit ja infektiolääkärit ja niin edelleen.
[20:51] Eli meillä on myöskin aika laaja tämä translationaalinen osuus ja se on minusta nimenomaan ehkä se rikkaus.
[20:57] Eli jokainen tuo siihen ryhmään sen oman osaamisensa ja sitten kun me yhdistetään ne, niin se yksi plus yksi on selvästi enemmän kuin kaksi.
[21:05] Tämä sama logiikka on mielestäni siinä, että me tehdään kansallisia tutkimuksia, koska Suomi on niin pieni maa,
[21:10] että jos jokainen tekee itsenään jotakin, niin se ei missään nimessä riitä.
[21:14] Me ei saada riittävästi potilaita, sillä ei ole riittävää tilastovoimaa.
[21:18] Mutta sitten, kun me laitetaankin kaikki Suomen sairaalat tai iso osa yhteen,
[21:22] niin me päästäänkin siihen, että me ollaan kansainvälistä kärkeä siinä tutkimuksessa.
[21:26] Eli tämä tavallaan, että me tehdään yhdessä samaa asiaa eteenpäin,
[21:30] tuo ihan hirveästi enemmän voitettavaa kaikille.
[Speaker 1]
[21:35] Joo.
[21:35] Mainitsit, että biostatistikon on elintärkeää olla mukana siinä tutkimustiimissä,
[21:40] ihan alusta lähtien, ei pelkästään siinä analyysivaiheessa.
[21:45] Pystyisitkö avaamaan vielä meidän kuuntelijoille,
[21:48] mitä kaikkea biostatistikko tekee tutkimustiimissä?
[Speaker 2]
[21:52] Rooli on kyllä aivan kriittinen.
[21:55] Jos ajatellaan, että me tehdään tietysti se paras mahdollinen näytön aste,
[22:01] me saadaan satunnaistetuista tutkimuksista.
[22:03] Se on tavallaan se, mitä me tehdään tässä mun molemmissa tutkimusryhmissä.
[22:08] ja se isoin fokus on siinä.
[22:10] Ja se lähtee kyllä jo lähtökohtaisesti se, että mitä me pystytään sillä tutkimuksella ikinä sanomaan,
[22:17] ja ne johtopäätökset, ne perustuu täysin siihen, miten se tutkimus on suunniteltu.
[22:21] Eli meidän täytyy olla tietysti se,
[22:24] ja tämä on nimenomaan yhteistyötä ihan kokonaan tämä muutenkin, eli se on se, millä me saadaan se paras tulos kliinisenä tutkijana,
[22:33] joka siinäkin on tärkeä myös huomioida, että meillä esimerkiksi ne, ketkä tekee kliinistä työtä, sitten sä teet saman aikaan tutkimustyötä, niin sä teet käytännössä kahta työtä,
[22:42] mutta jos meillä ei ole semmoisia tutkimusrahoitusta ja mahdollisuutta, niin meidän kliininen tutkimus loppuu, koska ainoastaan kliinistä työtä tekevät ihmiset oikeasti osaa kysyä ne asianmukaiset kysymykset.
[22:54] Eli se kliininen tutkija tekee sen kysymyksen asettelun ja sen jälkeen istutaan statistiikassa alas ja ruvetaan miettimään,
[23:01] että miten ihmeessä tätä voidaan katsoa, että mikä olisi paras mahdollinen tutkimusmalli ja asetelma siihen.
[23:08] Ja sen jälkeen kun päästään siihen, että meillä on oikeasti selkeä tutkimuskysymys, mihin me halutaan vastaus,
[23:15] ja on päädytty yhdessä siihen, että mikä se tutkimuksen suunnitelma on,
[23:19] missä mallissa tehdäänkö me non-inferioriteettitutkimusta vai superioriteettitutkimusta, niin sen jälkeen sitten ruvetaan katsomaan
[23:26] statistikon kanssa sitä, että kuinka paljon me oikeasti tarvitaan potilaita, jotta meillä on mitään mahdollisuuksia vastata
[23:34] tähän kysymykseen.
[23:35] Se on joskus murheellista, kun arvioi joskus muita artikkeleita, niin katsoo jo lähtökohtaisesti,
[23:42] Tämä on lähtökohtaisesti täysin alimitotettu, jolloin tietysti se, niin kuin sanoin, että se hölmöin tilanne on se, että nähdään se kauhean vaiva kliinisen tutkimuksen tekemiseen,
[23:52] joka on jo lähtökohtaisesti ei sovellu se suunnitelma siihen.
[23:57] Eli silloin me ei oikeasti voida tehdä niitä johtopäätöksiä, mitä me on ajateltu, että siitä pystyisi tekemään.
[24:03] että sen takia statistikko on ihan kriittisen tärkeä siinä, että me ollaan jo suunniteltu kokonaan sen tutkimuksen kaikki arvioitavat päätemuuttujat.
[24:15] Me on tehty voimalaskelma sen ensisijaisen päätemuuttujan osalta niin, että me oikeasti voidaan sanoa siihen jotain.
[24:22] Me on päätetty kaikki muut asiat, mitä me katsotaan, tehty alustava analyysisuunnitelma, jolloin meillä on oikeasti semmoinen tutkimus,
[24:31] niin me voidaan sanoa jotakin, eli ne johtopäätökset on valideja, jos me päästään siihen riittävään potilasmäärään.
[24:38] Silloin se myöskin kertoo sen, että jos me nähdään, että tämä voimalaskelma kertoo, että me tarvitaan 2000 potilasta
[24:44] ja meidän reaalinen mahdollisuus on saada 200 potilasta, niin me tiedetään, että tätä tutkimusta tämmöisenään ei kannata lähteä tekemään,
[24:50] vaan silloin oikeasti pistetään fokus jonnekin muualle.
[Speaker 1]
[24:54] Okei, kiitos sulle näistä vastauksista.
[24:57] Tähän ihan loppuun.
[24:58] Haluaisitko sinulla antaa joku pieni motivaatio meidän kuuntelijoille lopuksi?
[25:03] Minkä takia kannattaa hakeutua tutkijaksi tai ylipäätään miksi kannattaa opiskella biostatistiikkaa omien opintojen ohilla?
[Speaker 2]
[25:15] Jos ajatellaan, tietysti minun on helpompi reflektoida sitä lääkäriopiskelijoiden kautta,
[25:20] mutta toki koskee myös biotieteilijöitä, kun paljon tehdään myös transsationaalista tutkimusta, niin ensinnäkin tietysti tutkimuksen tekeminen on todella mielenkiintoista.
[25:30] Jos ajatellaan kliinisen tutkijan kannalta, niin me tehdään tutkimuksia, jotka aivan suoraan on sovellettavissa sen potilaan hoitoon.
[25:38] Eli sä tavallaan saat sen konkreettisen hyödyn ja sen onnistumisen ajatuksen siitä, että sä oikeasti näet, että nyt kun me ollaan tehty tämä iso työ,
[25:49] niin me voidaan käyttää tätä hyödyksiä.
[25:51] Sitä kautta pystytään hoitamaan paremmin potilaita.
[25:55] Mutta jotta me voidaan tehdä laadukasta tutkimusta, niin sitä ei voi tehdä ilman biostatistiikkaa.
[26:01] Eli se on täysin käsi kädessä.
[26:03] Ja mä sanoisin ehkä tässä kohtaa, jos joku biostatistiikan opiskelija kuuntelee,
[26:07] niin mä sanoisin, että heidän myöskin kannattaa katsoa vähän biostatistiikan ulkopuolelle,
[26:12] ehkä millaisia tutkimuksia tehdään, koska se olennainen asia, paras, aivan kuningas biostatistikko on juuri sellainen, joka ymmärtää hiukan sen ulkopuolellakin,
[26:24] koska tämä pelkästään sen biostatistiikan, eli vähän, että mikä se kliininen aspekti esimerkiksi voisi olla, koska nämä ei ole koskaan ihan optimaalisia,
[26:36] vaikka jos ajatellaan meidän jonkun satunnaistetun tutkimuksen tilasto ja metodisuunnittelua, niin me ei löydetä ehkä ihan sitä parhainta mahdollista optimaalisinta vaihtoehtoja biostatistiikan kannalta,
[26:50] eikä myöskään sen kliinisen kannalta, vaan me yritetään löytää semmoinen järkevä balanssi, millä se tutkimus on oikeasti reaalisesti toteutettavissa niin, että siitä pystyy oikeasti sanomaan jotain johtopäätöksiä.
[27:04] Jos ajatellaan vielä biostatistiikan opiskelua senkin ulkopuolelta, jos meillä on kuuntelijoita, jotka eivät ajattele tekevänsä ehkä laajempaa tutkimusta,
[27:15] niin ainakin lääketieteen puolella, koska se meidän informaatiotulva tällä hetkellä on käytännössä artikkelit, joita julkaistaan,
[27:25] ja jotka tietysti totta kai lopulta päätyy oppikirjoihin, mutta sitä tietoa on niin paljon samasta aiheesta, että jos et ymmärrä yhtään biostatistiikasta niin et mitenkään pysty arvioimaan lukemaasi tiedettä.
[27:41] eli onko se oikeasti sellainen asia, mihin sinä voit uskoa vai ei.
[27:46] Me tarvittaisiin lääkikseen semmoinen kurssi, että nämä kaikkien pitää osata biostatistiikasta.
[27:53] Sitten voisi olla osa B, ne jotka jatkaa tutkimukseen.
[27:57] Mutta siinä on oikeasti ihan selkeästi musta sellainen selvä gäppi,
[28:02] mikä pitäisi jotenkin siinä lääkärikoulutuksessa korjata.
[Speaker 1]
[28:07] Kiitos Pauliina.
[Speaker 2]
[28:08] Kiitos paljon.
[Speaker 1]
[28:09] Kiitos myös sinulle kuuntelija.
[28:12] Toivottavasti tämä innosti sinua syventämään biostatistiikan opintoja esiin.
[28:17] Toivottavasti kuullaan taas statistiikan aalloilla.
[28:30] Tämän podcastin on tuottanut Turun yliopiston lääketieteellisen tiedekunnan biostatistiikan yksikkö.
Tässä podcastin jaksossa biostatistikko Eliisa Löyttyniemi kertoo, miten tutkimuksen otoksesta saadut tulokset yleistetään koko populaatioon. Jaksossa pureudutaan tilastollisen päättelyn ytimeen ja käsitellään peruskäsitteitä, kuten p-arvoa ja luottamusväliä. Studioisäntä Markus Riskumäki tiivistää tärkeimmät tekijät siitä, kuinka tilastollinen testi valitaan. Jos olet lääketieteen, bio- tai hammaslääketieteen opiskelija tai haluat kuunnella helposti ymmärrettävää puhetta tilastotieteen perusideasta, tämä jakso on sinulle!
[00:06] Tervetuloa takaisin statistiikan aalloille.
[00:09] Tänään meillä aiheena aiheena introjaksoa syvempi sukellus tilastolliseen päättelyyn.
[00:15] Minä olen biostatistikko Markus Riskumäki ja vierainani mulla on jälleen biostatistikko Elisa Löyttyniemi, tervetuloa.
[00:23] Kiitos kiitos ja kiva olla taas täällä.
[00:26] Haluatko alkuun ihan nopeasti kertoa, että mitä kaikkea meillä ja kuuntelijoillamme on tänään edessämme?
[00:32] No mä ajattelen, että jos me ihan lyhyesti voitaisiin käydä, mikä sen tilastollisen päättelyn salaisuus on.
[00:39] Koska mun mielestä se on oikeasti ihan tilastotieteen helmi.
[00:42] Jos tämmöisessä lukiossa juuri kukaan ei ole kuullut,
[00:46] että lukiossa opetetaan vaan varjaa sikaavaa ja blaa blaa blaa,
[00:50] mutta siellä ei opeteta tilastollista päättelyä.
[00:54] Tilastollisen päättelyyn kuitenkin perustuu hyvin voimakkaasti koko lääketieteen kehitys.
[01:00] Sitä käytetään siinä, kun mitä tahansa lääketieteellistä, terveystieteellistä tutkimusta tehdään.
[01:07] Tilastotieteen ja matikan mallinnus on aivan keskeisessä roolissa siinä.
[01:11] Tuo on hyvä pointti, minkä mainitsit, että lukiossa ei tästä päättelystä puhuta oikeastaan mitään.
[01:17] Mä muistan, että itse vihlasin yli kaiken lukijassa tilastotiedettä, mutta sitten kappas kummaa yliopistossa, nyt ollaankin sitten ihan ammattilaisia.
[01:29] Joo, mut hei, aloitetaanko sillä, että kertoisit hieman vähän tutkimuksen ideasta yleisesti.
[01:36] Sitten kun lääkäri tai tutkija keksii jonkun idean, niin totta on se, että kukaan muu maailman lääkäri tai tutkija ei usko tällaista ideaa, jolle se pystyy sitä todistaan.
[01:49] Ja se todistaminen tehdään niin, että kerät dataa eli havaintoaineistoa ja sen avulla pystyt mahdollisesti todistamaan sen idean todeksi.
[02:00] Ja nimenomaan siinä käytetään sitä matikkaa, eli todennäköisyys laskentaa apuna.
[02:05] Ja sitä kautta sä pystyt sitten sen idean tuomaan arkipäivään kaikille joukolle.
[02:14] Tähän varmasti liittyy läheisesti tämmönen monelle varmasti esimerkiksi lääkiksessä opiskelevalle vähän pelottavakin termi kuin P-arvo.
[02:29] Haluaisitko vähän kertoa siitä?
[02:32] Joo, mutta lähdetään vielä liikkeelle siitä just tästä tutkimuksesta.
[02:36] Minun piti vielä sanoa se, että siinähän on ideana just se, että minä pystyn siihen dataani keräämään vain jonkun osajoukon.
[02:44] Ja siitä osajoukosta, olkoon se sitten, että minulla on sata syöpäpotilasta, niin minä pyrin sitten tekemään päätelmiä,
[02:52] miten kaikki vastaavat syöpäpotilaat, miten heitä voitaisiin hoitaa paremmin.
[02:56] Eli meillä se pääidea on kuitenkin tutkimuksessa myös tämä, että meillä on osa joukkoista, me halutaan tehdä päätelmiä.
[03:03] Ja tilastotiede voimakkaasti on myös todennäköisyyslaskenta ja se P-arvo,
[03:08] se sanahan tulee sanasta probability, tulee tämä P lyhenne.
[03:14] Ja siinä nimenomaan sitten mitataan sitä meidän dataa suhteessa vähän mitä me populaatiosta ajatellaan.
[03:23] Eli jos me ajatellaan sitä, että mikä on todennäköisyys, että me nyt havaitaan jossakin meidän muuttujassa
[03:31] kymmenen yksikön ero keskiarvoissa, jos populaatiossa sitä eroa ei olisi lainkaan.
[03:37] Ja tämän tyyppisestä todennäköisyyslaskennasta me sitten johdetaan tää PR-vo,
[03:42] mitä julkaisuissa, melkein jokaisessa julkaisussa, käytetään.
[03:47] Eli esimerkiksi tällaisessa tutkimuksessa, jossa tutkitaan lääkkeen tehoa johonkin sairauteen,
[03:53] niin voisi sanoa, että P-arvo on tämmöinen apuväline, joka kertoo, että jos otoksessa havataan
[03:59] ero esimerkiksi tämän lumenlääkkeen ja varsinaisen lääkkeen välillä,
[04:03] niin populaatioissakin on todennäköisesti sitten eroa, eli lääketehoa yleisestikin.
[04:08] Joo, ja lääketeollisuudessa nimenomaan me tarvitaan sitten siinä loppuvaiheessa ennen lääkkeen pääsyä markkinoille,
[04:15] me tarvitaan kaksi sellaista isoa niin sanottua faasi kolmas tutkimusta ja lääkeviranomaiset vaatii, että
[04:22] kummassakin me saadaan tilastollisesti merkitsevä tulos, joka tarkoittaa yleisesti sitä, että tämä P-arvo
[04:28] pitää olla alle 0,05 eli 5 prosenttia.
[04:36] Sä puhuit tuosta merkitsevyystasosta.
[04:39] Joo, siinä se raja 0,05 tarkoittaa just sitä, että me väitetään, että lääkeryhmä eroaa vaikka lumen lääkeryhmästä,
[04:48] kun se p-arvo on alle 0,05, mutta meille jää vielä sellainen pieni riski olemassa,
[04:54] että sitä eroaa ei olekaan.
[04:56] Eli aina meille jää tutkimukseen tämä epävarmuus,
[05:00] joka me koitetaan hanskata tällä tilastotieteen avulla.
[05:04] Ja minkä takia se on nyt tämmöinen 0,05, vähän niin kuin absurdi raja.
[05:09] Mutta tällä ei ole nyt vaan tieteessä, suurin osa tutkimuksista käyttää nimenomaan tätä rajaa.
[05:15] Okei.
[05:17] No mitä sitten, jos se p-arvo on lähellä merkitsevää, esimerkiksi 0,06 tai 0,08, niin tarkoittaako se, että tulokset on täysin pilalla eikä niitä kannata edes raportoida?
[05:29] Ei toki, että julkaisussa monesti kirjataan sillä tavalla, että me sanotaan, että meillä oli vähän trendiä,
[05:37] eli me oltiin hyvin lähellä merkitsevää, ja sen takia hyvässä julkaisussa aina merkataankin ne tarkat p-arvot.
[05:44] Eli mulle on ihan eri asia, että onko se p-arvo 0,061, eli se on tosi lähellä.
[05:49] Mä olen melkein saanut todistettua sen lääkiryhmien välisen eron, vai onko se 0,61,
[05:55] joka tarkoittaa, että ei ollut muuten mitään eroa käytännössä.
[06:00] Mutta sitten täytyy myös lisätä se, että on olemassa tapauksia, jos me käytetäänkin eri rajaa kuin tämä 0,05.
[06:08] Esimerkiksi jos me testataan sytokiineja tai jotakin, missä me testataan satoja tai jopa tuhansia testejä,
[06:15] kun me etsimme vain jotakin, missä voisi olla jotakin, niin silloin me korjataan sitä p-arvoa selvästi pienemmäksi.
[06:23] jotta me tehtäisiin nimenomaan vähemmän näitä virhepäätelmiä,
[06:27] mikä meillä on aina tämä epävarmuus olemassa.
[06:30] Niin tämmöisiä korjauksia myös tehdään.
[06:33] Tämä P-arvojen merkitsevyys on aika tämmöinen,
[06:38] voisi sanoa jopa niin kuin triggeröivä puheenaihe tutkimuksessa.
[06:43] Niin tota, mitä sä voisit sanoa sitten tämmöisestä asiasta kuin P-arvojen korjaaminen?
[06:49] minkä takia sitä sitten tehdään, että onko se joku taikatemppu siihen, että saadaan sittenkin omat tulokset merkitseviksi?
[06:55] Ei vaan nimenomaan toisinpäin.
[06:59] Eli p-arvoja kiristetään nimenomaan tässäkin esimerkissä, minkä mä äsken mainitsin,
[07:03] että jos tehdään ihan hirveästi testejä, niin me halutaan välttää niitä meidän virhetulkintoja,
[07:08] niin me tosiaankin lasketaan sitä meidän p-arvorajaa.
[07:13] Okei.
[07:15] Onko P-arvo ainoa tunnusluku, jolla voisi tulkita hypoteesien testausta?
[07:20] Vai onko jotain muita yleisesti käytettyjä vaihtoehtoja?
[07:23] Ei toki, vaan nimenomaan viime aikoina on korostettu sitä, että luottamusvälit olisi melkeinpä tärkeämpiä kuin P-arvo.
[07:33] Osa on sitä mieltä, että P-arvot voidaan jopa unohtaa, että halutaan raportoida vain luottamusvälit.
[07:40] Koska luottamusväli pitäisi olla lääkärille ja tutkijoille paljon vielä tärkeämpiä,
[07:43] koska luottamusvälistä sä näet, onko siellä tilastollisesti merkitsevä tulos vai ei,
[07:49] mutta sä sen lisäksi pystyt tekemään kliinisen tulkinnan,
[07:53] kuinka suuri se efekti todennäköisesti on keskimäärin.
[07:58] Ja sehän on nimenomaan se, mikä lääkäriä ja tutkijaa oikeasti kiinnostaa.
[08:02] Okei.
[08:03] Eli sun tulkinta luottamusvälistä voisi olla, että esimerkiksi 95 prosentin todennäköisyydellä
[08:12] Tältä luottamusväliltä löytyy tutkittavan muuttojen populaation todellinen arvo,
[08:16] josta voidaan tehdä sitten kliiniset päätelmät esimerkiksi lääkkeen tehosta.
[08:20] Joo, joo.
[08:21] Ja sen takia se luottamusvälin ymmärtäminen,
[08:25] että 95 prosentin todennäköisyydellä se vaikka populaatiokeskiarvo on tällä välillä,
[08:31] niin se on erittäin tärkeää, että puhutaan nimenomaan siitä populaatiokeskiarvosta,
[08:36] siitä ikään kuin todellisesta arvosta, mitähän me ei koskaan tulla saamaan selville.
[08:40] selville, koska emme voida koskaan mitata koko populaatiota.
[08:45] Sen takia siinäkin on se epävarmuus, että kun me puhutaan 95 prosentin luottamusvälistä,
[08:51] niin meillähän on 5 prosentin mahdollisuus sitten, että se meidän populaatiokeskirjo onkin
[08:55] tämän luottamusvälin ulkopuolella, mutta se epävarmuus meidän vaan täytyy sijaittaa.
[09:03] No nämä P-arvot ja luottamusvälit, mistä me ollaan nyt tässä puhuttu, niin liittyy aika
[09:08] oleellisesti semmoiseen asiaan kuin tilastollinen testaus.
[09:12] Ja tällaisia tilastollisia testejä vilisee julkaisuissa ja erilaisia on vaikka kuinka paljon.
[09:19] Miten ihmeessä sitä sitten pystyy valitsemaan oikean testin just sun omaan tutkimukseen?
[09:24] No siihen on olemassa kyllä, mekin ollaan piirretty tämmönen tilastollinen kartta,
[09:29] joka pyrkii opiskelijoita auttamaan löytämään oikein testin.
[09:33] Mutta mun mielestä siinä on semmoiset neljä kulmakiveä, mitkä pitää ekana ymmärtää,
[09:38] miten voit hahmottaa ja löytää niitä sopivia testejä.
[09:42] Yksi on se, että kun sinulla on nyt se muuttuja, jota haluat tutkia, eli me kutsutaan sitä vasteeksi,
[09:50] minkä käyttäytyminen sinua kiinnostaa, niin sinun täytyy tietenkin tunnistaa, minkälainen se muuttuja on.
[09:55] Jos sinun kiinnostuksen kohteena on olla muuttujan hemoglobiini, niin sinulla on numeerinen, jatkuva, suhdeasteikollinen muuttuja.
[10:03] Sitten jos sulla onkin se, että onko potilas parantunut vai ei parantunut, niin sulla on kategorinen, jossa luokilla ei ole järjestystä.
[10:14] Ja jos sulla on sitten taas kipumuuttuja ykkösestä viitoseen, niin se on edelleen kategorinen muuttuja, mutta niillä luokilla onkin järjestys.
[10:22] Ja vielä on muitakin luokkia, mutta tässä on nämä yleisimmät luokat, eli sen sun täytyy tunnistaa.
[10:28] Tietenkin aloitat sillä, että tunnistat, että onko se kategorinen vai numeerinen muuttoja, koska niillä on ihan eri testit.
[10:36] Mutta kipuesimerkki, missä on luokilla joku järjestys, niin siinä on enemmän informaatiota.
[10:43] Me halutaan tietenkin hyödyntää kaikki informaatio, mikä datasta irti lähtee, niin se täytyy ottaa huomioon.
[10:51] Ja sit jos meillä on taas se hemoglobiini eli tämmöinen numeerinen jatkuva muuttuja, niin meidän täytyy tunnistaa sen jakauma.
[10:59] Eli me tutkitaan erilaisilla metodeilla sitten, että onko se kutakuinkin normaalisti jakautunut, mikä on tämä kaussi, eli kello, käyrä, rakkala, lapsella, monta nimeä.
[11:11] Koska normaaliakaumaan perustuvat testit on hyvin voimakkaita, eli me saadaan niitä eroja helpommin selville, helpommin löydettävissä.
[11:19] Sitten seuraava kohta, mikä meidän täytyy datasta ymmärtää, on se, että mikä siellä on se riippumatonta ja mikä on riippuvaa.
[11:28] Eli mikä on riippumaton tarkoittaa sitä, että mikä on meidän tilastoyksikkö.
[11:33] Jos me tehdään kliinistä tutkimusta, niin se on usein ihminen.
[11:38] Yhdestä ihmisestä mitattu verenpaine on riippumaton, toisesta ihmisestä mitattu verenpaine.
[11:43] Mutta jos mittaankin samasta ihmisestä kaksi kertaa verenpainetta, niin ne ovatkin riippuvia mittauksia.
[11:50] Minun täytyy tietenkin se huomioida analyyseissä, eli tämä on ihan oleellista, että tiedät, mikä on riippuvaa ja mikä on riippumatonta.
[11:58] Asiat tuntuvat tässä tosin yksinkertaiselta, mutta eivät ne aina ole ihan näin yksinkertaisia.
[12:03] Jos me tehdään silmätutkimusta, niin se onkin se silmä, se meidän tilastoyksikkö, koska me voidaan laittaa jopa eri lääkettä eri silmiin.
[12:11] ja näin pois päin, mutta nämä on mielestäni semmoiset neljä kulmakiveä,
[12:15] mitkä pitää ymmärtää, niin sitten sä pääset jo tosi pitkälle,
[12:19] että sä pystyt löytämään tämmöisen hyvän ja sopivan testin sun datalle.
[12:24] Okei, eli kertauksena nämä tilastollisen testin valintaan liittyvät kulmakivet olivat
[12:31] yksi, päämuuttojan tyyppi, kaksi, jos muuttoja on jatkuva, niin minkälainen jakauma sillä on,
[12:38] kolme, mikä on riippumatonta, ja neljä, mikä taas on riippuvaa.
[12:42] Jep, just näin.
[12:46] TILASTOLLISTA MALLEISTA
[12:47] No sä puhuit noista tilastollisista malleista.
[12:51] Onko niissä jotain oletuksia, joita pitäisi ottaa huomioon?
[12:55] Joo, nimenomaan se on tosi tosi tärkeetä, että tietää, että mitä taustan oletuksia näillä malleilla on.
[13:01] Mä äsken tuossa mainitsin tämmöisen normaaliakauma-oletuksen.
[13:04] jos se ei ole voimassa, niin toki sitten sä saatkin ihan väärät tulokset, jos sä vaan räiskit sellaisen mallin,
[13:13] missä oletetaan, että tämä muuttujen jakauma on normaali.
[13:18] Eli siinä pitää olla tosi tarkkana ja tutkia ennen kuin tekee mitään analyysiä, että mitkä on ne tausto-oletukset.
[13:25] Joissain on niin, että tausto-oletuksella pitää olla riittävän suuri se otosjoukko,
[13:31] tai riittävän paljon vaikka tutkittavia siellä frekvenssitaulussa,
[13:39] jotta sen voi tehdä jonkun analyysin.
[13:41] Okei.
[13:42] Tähän tilastollisten testien loppuun pieni kiteytys,
[13:48] että tilastolliset testit siis auttavat selvittämään,
[13:51] havaitaanko jokin otoksessa havaittu ero,
[13:54] todennäköisesti myös koko populaatiossa.
[13:58] Mutta nyt on tosiaan paljon puhuttu tästä otoksesta.
[14:02] Miten sitten päätetään sun omaan tutkimukseen otoskoko?
[14:06] Joo, toinenkin hyvä kysymys, että mä voisin puhua koko päivänä.
[14:13] Tutkimuksen suunnittelusta yksinään, mutta siinä yksi hyvin tärkeä osa on otoskoon määrittely.
[14:19] Kuinka paljon me tarvitaan henkilötä tutkittavia, tai jos me tehdään break cleanistä,
[14:23] ja kuinka paljon me tarvitaan hiiriä siihen meidän tutkimukseen.
[14:27] niin me tehdään tällainen laskelma etukäteen ennen tutkimuksen alkamista.
[14:33] Ja jos nyt taas vaikka otetaan se hemoglobini-esimerkki, niin meidän täytyy miettiä kliinisesti,
[14:40] mikä keskimääräinen ero olisi sitten se kliinisesti merkittävä keskiarvojen ero,
[14:45] mikä me halutaan havaita, jos nyt ajatellaan vaikka, että on lääkeryhmä ja lumelääkeryhmä.
[14:51] Että millä keskiarvojen erolla olisi oikeasti jo kliinistä merkitystä.
[14:56] Se on tosi vaikea asia, ja me usein siitä tutkijoiden kanssa joudutaan keskusteleenkin aika pitkään.
[15:01] Toinen, mikä me tarvitaan, joka kuulostaa vielä hassummalta, niin me tarvitaan esimerkiksi tämän nuversen jatkuvan muuttujen keskihajonta.
[15:10] No, eihän me sitä voida tietää ennen tutkimusta, mikä on sen vaihtelu, keskihajonta, mutta siinä me hyödynnetäänkin sitten aikaisempia tutkimuksia,
[15:19] tai pilottitutkimuksia tai aikaisempia julkaisuja, jolla me arvioidaan, minkä kokoinen hajonta tulevaisuuden tutkimuksessa meillä tässä muuttuessa tulee olemaan.
[15:29] Ja esimerkiksi tällä tavalla sitten käyttäen yhtä kaavaa, niin me voidaan arvioida sitten, kuinka paljon me tarvitaan oikeasti henkilöitä tai muita tutkittavia siihen meidän tulevaan tutkimukseen.
[15:41] Jotta me pystytään sitten todistamaan se idea todeksi, mikäli se on sitten totta.
[15:47] Ainahan ne ideat ei oikein ole totta, eli ei pystytä todistaa tietenkään, koska kaikki ei toimi.
[15:53] Joo joo.
[15:55] Muakin kiinnostaa tuossa, että miten ihmeessä sä sitten löydät jonkun aiemman tutkimuksen esimerkiksi,
[16:03] mille sä perustat sen sun Otoscore-laskennan, vai onko se vaan niin, että tutkijan kliinisen mielipiteen mukaan valitaan joku?
[16:12] No ei, että jos sä työskenteet teollisuudessa, niin hirveän usein on tehty jotain aikaisempaa tutkimusta sen osalta, että sä saat sen sieltä, että sulla on oikeasti ihan sen data olemassa.
[16:24] Jos sulla ei ole itsellä dataa, niin sitten me oikeasti tehdään julkaisujen hakua.
[16:29] Ja yksi esimerkki oli sellainen, että me löytettiin kaksi julkaisua.
[16:35] Suunniteltiin tutkimusta tehtävän Suomessa ja löysimme kaksi julkaisua, toinen oli tehty Saksassa ja toinen Saudi-Arabiassa.
[16:44] Se oli ihan erilainen keskihäjyntä jostain syystä.
[16:47] Mietimme, että kumpi näistä julkaisuista data olisi ehkä lähempänä meidän tulevaa dataa.
[16:54] Sitä kautta valkasimme Saksan tutkimuksen.
[16:57] että me ajateltiin, että se populaatio siinä tutkimuksessa se on ollut lähempänä tätä meidän tulevaa tutkimuspopulaatiota.
[17:04] Okei.
[17:05] Tässä on tullut hirveän paljon asiaa, niin osaisitko tähän loppuun vielä jotenkin mahdollisimman lyhyesti kiteyttää ihmisille tilastotieteen idean?
[17:19] Kaikki lähtee tutkia tai tutkia joukosta.
[17:23] Heillä on joku idea, ja he haluavat tietenkin sen tutkimusideansa todistaa todeksi muulle maailmalle.
[17:32] Meidän täytyy siis tehdä tutkimus.
[17:34] Tutkimus tehdään aina käytännössä katsoen otostutkimuksena, eli me lasketaan se äsken mainittu otoskoko.
[17:42] Tehdään se tutkimus, kerätään sitä dataa usein vuositolkulla ja dataan siihen havaintoaineistoon
[17:49] me tehdään sitten nämä tilastolliset mallit ja sitä kautta me voidaan tehdä tilastollinen päättely,
[17:55] käyttää nimenomaan luottamusvälejä ja p-arvoja ja sitten tämä tutkimusryhmä,
[18:01] me voidaan joko iloita, tehdä hieno julkaisu tai raportti, jossa me todetaan,
[18:04] että heidän idea taitaakin olla totta tai sitten me ollaan vähän pettyneitä ja todetaan,
[18:10] Tarvii keksiä parempia ideoita jatkossa.
[18:12] Hei kiitos sulle Elisa ja kiitos myös sinulle kuuntelijalle.
[18:17] Toivottavasti tämä pieni jakso innosti sinua syventämään biostatistiikan opintojasi.
[18:23] Toivottavasti kuullaan taas statistikan aalloilla.
[18:35] Tämän podcastin on tuottanut Turun yliopiston lääketieteellisen tiedekunnan biostatistiikan yksikkö.
Ensimmäisessä jaksossa studioisäntä Markus Riskumäen haastateltavana on biostatistikko Eliisa Löyttyniemi. Hän motivoi lääketieteen, bio- ja hammaslääketieteen opiskelijoita, joilla on edessään Havainnoista päättelyyn -kurssi. Tämä jakso sopii kuitenkin kaikille, jotka haluavat kuulla miksi jokainen lääkäri ja tutkija tarvitsee biostatistiikkaa.
[Speaker 0]
[00:03] Tervetuloa kuuntelemaan johdatusta biostatistiikan opiskeluun.
[00:10] Olit sitten lääketieteen, hammaslääketieteen tai biolääketieteen opiskelija, tutkija tai muuten vain kiinnostanut biostatistiikasta, niin hienoa, että olet täällä.
[00:21] Minä olen biostatistikko Markus Riskumäki ja tänään haastattelen kollegaani, biostatistikko Elisa Löytyniemiä.
[00:24] Tervetuloa.
[00:24] Tänään haastattelen kollegaani, biostatistikko Elisa Löyttyniemeä.
[00:28] Tervetuloa.
[00:29] Kiitos.
[00:29] Kiva olla täällä.
[00:31] Ennen kuin aloitetaan, voisitko kertoa vähän työhistoriasta?
[00:36] Sen jälkeen, kun olin opiskellut matikkaa ja tilastotiedettä yliopistossa,
[00:41] lähdin lääketeollisuuteen.
[00:42] Olin siellä yli 15 vuotta.
[00:44] Sen jälkeen tutkittiin laitteita tai kehitettiin laitteita,
[00:49] ja kehitettiin myös erilaisia laboratoriotestejä.
[00:53] Viitisen vuotta.
[00:53] Nyt olen ollut yliopistolla lääketieteen tiedekunnassa biostatistikan yksikössä reilu kymmenen vuotta.
[01:01] Sulla onkin pitkä kokemus lääkäreiden ja tutkijoiden kanssa työskentelystä.
[01:07] Puhutaanpas tänään sellaiset ihmiset mielessä pitäen, joilla ei ole välttämättä mitään kosketuspintaa vielä tilastotieteeseen.
[01:16] Otasitsä kertoa mulle, että miksi tuleva lääkäri tai tutkija tarvitsee ymmärrystä tutkimuksesta ja tulosten tulkinnasta?
[01:24] Jos nyt tässä kohtaa ajattelen vaikka sitä lääkäriä ja potilastyötä, niin toki se lääkäri haluaa, että kun hänelle tulee joku potilas,
[01:36] hän pystyisi antaa sille, mikä sairaus sitten on kyseessä, niin hyvän hoidon ja potilas joko toipuu kokonaan tai oireet paranee tai jotakin vastaavaa.
[01:48] Ja totta kai lääkäri myös haluaa, että se hoito on tehokas ja turvallinen.
[01:54] Näin ollen mehän halutaan myöskin, että tämä tuleva hoito on näyttöön perustuen todistettu turvalliseksi ja tehokkaaksi.
[02:07] Tämä näyttöön perustuva lääketiede nimenomaan perustuu siihen, että sitä on tutkittu, meillä on dataa.
[02:14] Eli se ei perustu mihinkään uskomuksiin tai luuloihin se, että se on tehokas ja turvallinen, vaan nimenomaan dataan.
[02:23] Jos me ajatellaan vaikka viime vuosina, kun tuli korona yhtäkkiä, niin kukaanhan maailmassa ei tiennyt siitä sairaudesta mitään.
[02:34] Ei tiennyt parannuskeinoa, ei tiennyt mistä se tulee, miten se tarttuu, mutta sittenhän koko maailma, tutkijat ja lääkärit,
[02:43] rupesi keräämään sitä dataa ja vasta datan kautta me ruvettiin ymmärtämään sitä myös, miten sitä voidaan hoitaa,
[02:51] miten sitä voidaan ehkäistä.
[02:53] Tähän tarvitaan nimenomaan sitä lääkärin ja tutkijan osaamista, jatkuvaa oppimista
[03:00] siihen uuden tutkimustiedon sisäistämiseen, että se ammattitaito kehittyy vuosien varrella.
[03:09] Ja siihen sitten taas tarvitaan sitä julkaisun lukutaitoa hyvin paljon, että ymmärtää sitä uutta tutkimustietoa, jotta voisit taas niitä tulevia potilaita hoitaa paremmin.
[03:23] Okei.
[03:23] No miten tämä kaikki liittyy tilastotieteeseen tai biostatistiikkaan?
[03:28] Mä mainitsin tuossa nimenomaan tämän näyttöön perustuvan lääketieteen.
[03:33] Ja se tarkoittaa sitä, että me tutkitaan jotain asiaa, kerätään jotain dataa,
[03:38] ja sitä kautta me oikeasti sitten tehdään matemaattisia malleja siihen dataan,
[03:44] eli käytetään nimenomaan tilastollisia menetelmiä.
[03:47] Ja niiden avulla me voidaan tehdä sit johtopäätöksiä siitä datasta.
[03:53] Ja ne johtopäätökset ja mallit tietenkin lukevat juuri niistä julkaisuista.
[03:59] Ja sitä kautta me biostatistikan kursseilla hirveästi korostetaan myös sitä julkaisun lukemistaitoa,
[04:07] että lukija pystyisi arvioimaan sen julkaisun laatua, että onko se hyvä julkaisu vai onko se huono julkaisu.
[04:15] Käytänkö minä siinä julkaisussa esitettyjä tietoja seuraavien potilaiden elämyshoitamiseen?
[04:21] Tai tutkijana, löytyykö siitä julkaisusta jotakin hyviä ideoita, millä voin jatkaa jotain tutkimusta.
[04:29] Sä mainitsit tuossa matemaattisen mallinnuksen, joka varmasti monelle saattaa kuulostaa hyvin pelottavalta,
[04:37] niin tulisiko siis lääkäri osata matemaattista mallinnusta, että se pystyy ymmärtämään näitä tutkimuksia?
[04:42] No sanotaan, että nyt kun olen vuosikymmeniä työskennellyt tutkijoiden ja lääkäreiden kanssa,
[04:49] niin tärkeintä on se tilastollisen päättelyn matemaattisten mallien ymmärtäminen,
[04:55] sen logiikan ymmärtäminen, niin että sä osaat vähintään tulkita niitä tuloksia julkaisuissa,
[05:01] missä niitä kirjoitetaan, niitä päättelyjä.
[05:05] Mikäli sä työskentelet teollisuudessa, niin meillä on aina tiimi.
[05:09] Meillä on se tutkijalääkäri ja biostatistikko yhdessä tekee ne raportit tai julkaisut.
[05:15] Eli siinä kohtaa se ymmärrys on kaikista tärkein ja se logiikan päättelyn tajuaminen.
[05:23] Akateemisessa maailmassa on paljon myöskin lääketietojen tutkijoita, jotka haluaa oppia vielä lisää tätä tilastollista mallintamista ja sitä kautta jopa tehdä itse ne analyysit.
[05:35] Meillä biostatistiikan kursseilla harjoitellaan analyysin tekemistä, koska sitä kautta opit ymmärtämään tilastollisen päättelyn logiikkaa.
[05:44] Mun mielestä se silloin auttaa myöskin siinä nimenomaan julkaisujen lukemisen ymmärtämisessä.
[05:51] Mutta eli siis välttämättä ei ole pakko itse osata tehdä niitä mallinnuksia, osasitsä sanoa sitten kumminkin, että antaako se jotain semmoista etuliointiasemaa, jos sä osaat itse tehdä?
[06:04] Joo, se nimenomaan auttaa myös siihen, että jos mä ajattelen tutkijaa, tutkija osaa silloin paremmin suunnitella tietokannat, tietokannat on paremmin rakennettu ja silloin sä tiedät sen, että mikä se logiikka on.
[06:21] Mutta välttämätöntä se itseanalyysin tekeminen ei ole, mutta se auttaa siihen tavallaan tilastotieteen ymmärtämisen toki hyvin paljon.
[06:28] Ja sen takia sitä kurssilla harjoitellaan.
[06:35] Sä heittelit tossa monta kertaa tämmöisiä termejä niin kuin tilastollinen mallinnus, tilastollinen päättely ja ylipäätään tilastotiede saattaa olla sanana vähän outo monille.
[06:48] niin mitä sä tarkoitat tilastollisella päättelyllä?
[06:53] No päättelyn se pääidea on se, että kun meillä tutkimuksessa on aina vaan osajoukko, eli otos,
[07:00] leikitään nyt vaikka, että me otetaan siihen tutkimukseen sata astmaatikkoa,
[07:05] niin toki me halutaan niistä sadan astmaatikon joukosta vetää päätelmät
[07:12] kaikkien astmaatikkojen joukkoon eli kaikkiin tulevaisuuden astmaatikkopotilaisiin, mitkä voit kohdata.
[07:19] Eli tavallaan se, että me halutaan vetää tutkimusjoukosta otoksesta päätelmät sinne populaatiotasolle.
[07:27] Mikä ikinä se meidän sairaspopulaatio sitten onkaan.
[07:31] Se on se keskeinen idea tilastollisessa päättelyssä.
[07:35] Siinä me hyödynnetään nimenomaan keskeiset termit on P-arvo ja luottamusväli, eli ilman niiden termien ymmärtämistä, niin ei pysty lukemaan käytännössä katsoen mitään tiedellehtiä.
[07:50] Eli nämä ovat ne kaikista keskeisimmät, ja näillä nimenomaan pyritään hanskaamaan se epävarmuus,
[07:57] joka meillä on päättelystä, kun me, eihän me sen sadan astmaatikon joukossa pystytä totuutta tietämään,
[08:04] mitä populaatiossa tapahtuu.
[08:06] Eli meille jää aina se epävarmuus olemaan, mutta me pyritään hanskaamaan
[08:10] sitä tilastotieteellä nimenomaan luottamusvälien ja p-arvon avulla.
[08:15] Okei, olipa hieno kiteytys tilastotieteestä, mutta kumminkin tämänkin jakson nimi on
[08:20] johdatus biostatistiikkaan, niin miten biostatistiikka eroaa normaalista statistiikasta tai tilastotieteestä?
[08:28] No siinä on se biosano edessä, joo.
[08:31] Eli se nimenomaan keskittyy biologisiin ongelmiin.
[08:36] Onko ne sitten kemiaa, lääketiedettä ja semmoista.
[08:41] ja siihen on sitten tavallaan optimaaliset, vähän erilaisia tilastollisia menetelmiä olemassa sitten.
[08:50] Joo, kiitos.
[08:51] No yksi semmoinen kysymys mulle tuli vielä mieleen, mikä saattaisi kiinnostaa tämän jakson kuulijoita,
[08:58] että tarviiko tällaisille biostatistiikan kursseille jotain taustatietoja?
[09:02] No ei oikeastaan, meillä on se periaate, että me lähdetään aina ihan nollasta meidän biostatistiikan kursseilla.
[09:09] Se mitä, se on lähinnä, jos mä ajattelen jotain ihan lukiokitaustaa, niin tilastotiedehän on hyvin painokkaasti todennäköisyyslaskentaa.
[09:19] Eli se sieltä niin kun kumpuaa pohjalta todennäköisyyslaskennan asiat, koska esimerkiksi tää P-arvo, minkä mä vaan nyt mainitsin kurssilla sitten enemmän,
[09:31] niin se P hän tulee sanasta probability, joten ei oo ihme, että käsitellään paljon todennäköisyyttä.
[09:38] No niin, nyt tulikin kuulemaan niin paljon asiaa, että voisin lyhyesti kerrata.
[09:44] Eli voisi sanoa, että tilastotieteelliset menetelmät ovat elintärkeitä lääketieteelliselle tutkimukselle.
[09:50] Ja vaikka työskentelisikään tutkimuksen parissa, niin ilman tilastotieteellistä osaamista on hyvin vaikea lukea alankirjallisuutta kriittisesti.
[09:58] Koska ilman tieteellistä todistamista, lainausmerkeissä, tutkimusasetelmilla ei ole todellista pohjaa.
[10:06] Ja mä sanoin tosiaan lainausmerkeissä todistamista, sillä eihän mikään todellisessa maailmassa ja tutkimuksessa ole ikinä täysin varmaa.
[10:14] Joo, tämähän se juuri on, että meille jää aina se epävarmuus ja me pyritään sitä sitten mahdollisimman hyvin kuvaamaan sitä epävarmuutta tilastotieteen keinoin.
[10:23] Niin kuitenkin, että se kliinikkotutkijalääkäri pystyisi tekemään sitten näitä kliinisiä päätelmiä kuitenkin tämän emmesluottamusvälin avulla.
[10:34] avulla.
[10:35] Eli onko se hoito tarpeeksi tehokas hänelle ja onko se sitten totta kai turvallinen myös potilaille.
[10:45] Tässä on nyt keskusteltu aika tämmöisiä teoreettisia asioita, niin kuulijoilta varmasti myös kiinnostaisi joku
[10:53] semmoinen ihan käytännön esimerkki, niin voisiko sulla antaa esimerkki, kuinka esimerkiksi joku tutkimusidea
[10:59] voi johtaa kliinisen hoidon muutoksiin?
[11:04] Tässä yhtenä hienona esimerkkinä on tämmöinen turkulainen tutkijaryhmä, joka rupesi ajattelemaan sitä, että tarvitseeko hän aina umpilisäkkeen tulehdusta,
[11:14] joka on siis tämmöinen komplisoitumaton eli lievä umpilisäkkeen tulehdus, tarviiko hän sitä aina leikata, niin kuin sitä on nyt viime vuosikymmenet aina leikattu.
[11:23] Koska he ajatteli, että no se on tulehdus, että muutkin tulehdukset hoitetaan antibiooteilla.
[11:30] Niinpä he kasasivat tutkimuksen pystyyn, jossa tutkittiin, riittääkö pelkkä antibioottihoito umpilisäkkeen hoitoon.
[11:41] Todennäköisesti he huomasivat, että suurimman osaksi se riittää, eli ei tarvinnutkaan leikata,
[11:46] joka tietenkin lyhentää sairaslomia, ei ole leikkauskomplikaatioita tietenkään, kun ei leikata.
[11:53] Tämä sai hyvin jopa maailmanlaajuista huomioon.
[11:59] Saman tien, kun nämä tutkimustulokset julkaistiin, niin se on myös Suomessakin muuttanut hoitokäytäntöjä.
[12:05] Lisäksi tarvitsee sanoa, että korona-aikana sehän oli suurin piirtein taivaan lahja, koska koronapotilaan leikkaaminen on aikamoinen juttu.
[12:14] Okei, kiitos tästä esimerkistä.
[12:17] Eikös totta, että tämä tutkimushan oli, niin kuin sanoitkin,
[12:20] ihan maailmanlaajuisesti tunnistettu, mutta myös palkittu,
[12:24] esimerkiksi Jamassa, joka on yksi maailman huippulehdistä?
[12:27] Joo, pitää paikkansa.
[12:28] Ja tämä tutkimusryhmä edelleen jatkaa näitä tutkimuksia.
[12:32] Ja nyt on tutkimuksia menossa, että tarvitaanko meille sitä antibioottia.
[12:36] Me ollaan nyt jo todistettu, että meille riittää pienempi antibioottimäärä.
[12:41] ja todistettu sitä, että se antibiootti voidaan hoitaa kotona, ei tarvitse suonensisäisesti hoitaa.
[12:45] Ja nyt tutkitaan myös sitä, että riittääkö pelkkä kipulääkäri.
[12:48] Eli tulehdus menisi vain itsellään ohi, niin kuin lasten korvatulehduksiakin usein vain nykyisin seurataan.
[12:55] Okei, hienoa Suomi ja hienoa Turku.
[12:59] Tässä olikin sitten tämä meidän lyhyt intro jaksomme.
[13:02] Kiitos sinulle kuuntelija, ja toivottavasti tämä innosti sinua opiskelemaan biostatistiikkaa.
[13:12] Toivottavasti kuullaan taas statistiikan aalloilla.
Sinua voisi kiinnostaa myös
![Tutkija pitelee pipettiä kädessään.](/sites/default/files/styles/related_content_highlight/public/media/drupal/L%C3%A4%C3%A4kis%20kuvitus.jpg?h=89db085f&itok=jFgKlrK2)
Instrumentariumin Tiedesäätiöltä 145 500 euroa apurahoja Turun yliopiston tutkijoille lääketieteelliseen tutkimukseen
![Ryo Itoshiman kuva](/sites/default/files/styles/related_content_highlight/public/media/drupal/Itoshima_Ryo.jpg?itok=c0x31Kt3)