Kuvituskuva, jossa kaksi ihmistä mikrofonin ääressä

Statistiikan aalloilla

Kiinnostaako sinua tutkimusdatan analysointi ja tilastollinen ajattelu?

Sukella tilastotieteen maailmaan uudessa Statistiikan aalloilla -podcastissa! Biostatistiikan yksikkö on kutsunut studioon asiantuntijoita jakamaan tietoa tutkimuksen tekemisestä ja datan analysoinnista. Podcastin avulla voi kehittää tilastollista ajattelua.

Kuuntele ja opi ymmärtämään tutkimusta ja dataa paremmin – Statistiikan aalto kerrallaan!

Kuuntele SoundCloudissa, Apple Podcastsissa tai Spotifyssa!

Jaksojen kuvaukset ja tekstivastineet

Tilastollisen testin valinta

Tässä tulee todellinen Statistiikan aalto täynnä tietoa tutkimusasetelmista ja tilastollisen testin valinnasta. Tutkimusasetelma ja muuttujien mitta-asteikon tunnistaminen johdattavat sopivaan tilastolliseen testiin.

Tämän podcastin sisältö sopii erinomaisesti tutkijoille ja kaikille, jotka haluavat oppia tunnistamaan erityyppiset muuttujat sekä valitsemaan sopivan tilastollisen testin yksinkertaisissa tilanteissa. Tämän jakso liittyy Turun yliopiston lääketieteen, bio- ja hammaslääketieteen opiskelijoille pakolliseen Havainnoista päättelyyn -kurssiin. Kurssi on avoin kaikille DigiCampuksella, ja sieltä löytyy podcastissa mainittu analyysikartta. Seuraavassa podcastissa avaamme tätä aihetta esimerkeillä.



[Speaker 1]

[00:00] Tervetuloa takaisin parhain kuuntelijan.
[00:07] Täällä teidän seurannanne tänään jälleen biostatistikko Markus Riskumäki.
[00:10] Ja minä olen biostatistikko Elisa Löttyniemi.

[Speaker 2]

[00:13] Ja tämä on Statistiikan aallolla podcast.

[Speaker 1]

[00:17] Olit sitten lääketieteen tai hammaslääketieteen opiskelija, tutkija,
[00:22] tai ihan muuten vain kiinnostunut biostatistiikasta, niin hienoa, että sä oot kuulolla.
[00:25] Tänään me puhumme tilastollisissa analysoissa.
[00:25] niin hienoa, että saat kuulolla.
[00:28] Tänään me puhumme tilastollisista analyyseista,
[00:31] tai jos jaksan aiheen tiivistäisiin yhteen kysymykseen,
[00:33] niin se voisi olla, että mitä ihmien testiä tähän aineistoon
[00:37] nyt pitäisi sitten käyttää.
[00:39] Mikäs meidän keskustelun aiheet on tälle päivälle?

[Speaker 2]

[00:43] No, aluksi mä ajattelin, että me voitais käydä läpi
[00:47] erilaisia tutkimusasetelmia, ja sen jälkeen näitä
[00:50] tilastollisia menetelmiä, eli näitä erilaisia testejä.
[00:53] Ja kuten sanoitkin, miten löydän sopivan testin joka erilaiseen tilanteeseen ja miksi käytän sitä testiä.
[01:07] Sitten voidaan pohtia erilaisia esimerkkejä tässä matkan varrella.
[01:12] Pitäisikö meidän aloittaa tosiaan niistä erilaisista tutkimusasetelmista?

[Speaker 1]

[01:17] Joo, mutta ennen kuin päästään niin pitkälle, niin me voitaisiin aloittaa vähän puhumalla määritelmistä, niitä aina tarvittaa.
[01:25] Eli ennen kuin päästään tutkimustyyppeihin, niin pitää meidän puhua tarkemmin kahdesta termistä.
[01:32] Ensinnäkin riskitekijä tai interventio, eli tekijä, ja toisena tutkimuksen tulokset tai kiinnostavien mittauksien arvot, eli vaste.
[01:43] Ensimmäinen termi eli riskitekijä, jonka vaikutustamme halutaan tutkia.
[01:48] Riskitekijä voi olla esimerkiksi joku tiedetty alleeli, joka nostaa vaikka diabeteksen puhkeamisen riskiä.
[01:54] Tai sitten vaikka ylipaino tai kohonnut verenpaine.
[01:58] Interventio taas on vaikka lääke, jota tutkitaan.

[Speaker 2]

[02:01] Niin, tai toisaalta interventio voi olla myöskin koulutus.
[02:04] Me tehdään paljon sellaisia tutkimuksia, joissa henkilökuntaa koulutetaan ja sitten me tutkitaan lisääntyykö henkilökunnan tietotaito tämän koulutuksen ansiosta.

[Speaker 1]

[02:14] Eli näillä riskitekijöillä tai interventioilla koetetaan selittää tuon kiinnostuksen kohteen eli sen vasteen käyttäytymistä, eikö vaan?
[02:21] Juu.
[02:22] Näitä kutsutaan monesti juuri tämän takia myös selittäväksi muuttujaksi.
[02:27] Ja sitten se toinen termi eli vaste, se on jotain, jonka arvo muuttuu tai käyttäytyy kiinnostavasti tekijän vaikutuksesta.
[02:34] Vaste on siis yleensä tutkimuksen kiinnostuksen kohteena tai voi sanoa päämuuttujana tässä tutkimuksessa.
[02:42] Esimerkkinä vasteesta voisi olla esimerkiksi diabeteksen puhkeaminen, alkoholin käytön väheneminen, suolisto-oireiden paraneminen ja niin poispäin.
[02:50] Vastetta saatetaan kutsua myös selitettäväksi muuttujaksi.
[02:55] Sitten päästäänkin niihin erilaisiin tutkimusasetelmiin.
[02:58] Aloitetaan puhumalla kahdesta erilaisesta ikään kuin pääluokasta.
[03:02] Näitä pääluokia on retrospektiivinen ja prospektiivinen tutkimus.
[03:08] Retrospektiivinen tutkimus tarkoittaa sitä, että vastenmuuttuvia
[03:11] ja luultavasti myös selittävät muuttojat on jo esiintyneet.
[03:15] Eli tutkimusdata on ikään kuin jo olemassa keruuhetkellä.

[Speaker 2]

[03:19] Tällaisia tutkimuksia muuten on suurin osa syväreistä läkiksessä
[03:24] kaikki kradutkin, että ohjaaja antaa sulle tai kertoo, mistä kerätään jo olemassa oleva data, vaikka potilaskertomuksista.

[Speaker 1]

[03:32] Joo.
[03:34] Eli siis se tieto esimerkiksi altistumisesta jollekin sairaudelle kerätään siis jälkikäteen.
[03:40] Sairauden ei ole mahdollisesti ilmaannuttua.
[03:42] Tyypillinen esimerkki voisi olla vaikka, että halutaan tutkia, mitä tupakointi aiheuttaa,
[03:47] koska me ei voida tehdä tutkimusta, jossa niin sanotusti käsketään jotain ihmisiä polttamaan askipäivässä.

[Speaker 2]

[03:53] No eipä, no eipä.

[Speaker 1]

[03:55] Tällainen tieto pitää vain kerätä niin sanotusti jälkikäteen
[03:59] semmoisilta henkilöiltä, jotka tupakoivat vakituisesti
[04:02] ja vertailla niitä sitten semmosiin, jotka ei ole polttanut.

[Speaker 2]

[04:05] Näin se menee.

[Speaker 1]

[04:07] Sitten se toinen oli prospektiivinen tutkimus.
[04:09] Ja se taas tarkoittaa tulevaisuudessa tehtävää tutkimusta.
[04:13] Eli vastetta ja mahdollisesti myöskään selittäviä muuttuja ei ole vielä esiintynyt.
[04:18] Valtistuneita ja altistumattomia seurataan siis sairauden suhteen ajankuluessa.
[04:22] Toinen tyypillinen esimerkki on lääketutkimus, jossa yksi ryhmä saa tutkimuslääkettä ja toinen ryhmä lumelääkettä.

[Speaker 2]

[04:29] Eli suomeksi tarkoittaa se, että me kirjoitetaan tutkimussuunnitelma, ja sitten me itse kerätään, tehdään ne mittaukset ja kerätään se data analyysejä varten.

[Speaker 1]

[04:40] Joo, okei.
[04:40] Mitäs muita tutkimusluokkia on olemassa, Eliisa?

[Speaker 2]

[04:45] No, mä sanoisin, että me voidaan tehdä näitä erilaisia jakoja, näitä jossakin jutuissa on vähän erilaisiakin näitä termejä, mutta me voitaisiin nyt käyttää tämmöistä luokkajakoa kuin kuvailevat, mä usein kutsun niitä myös evaluaatiotutkimuksiksi ja sitten analyyttiset tutkimukset.
[05:04] Ja kuten tämä kuvailevan tutkimuksen nimikin jo kertoo, niin me pyritään vain kuvailemaan jostakin joukosta kerättyä dataa tai aineistoa useimmiten just tunnuslukujen avulla.
[05:17] Tunnuslukuja on myös keskiarvot ja medianit ja muut.
[05:21] Eli me ei pyritä vastaamaan mihinkään meidän hienoon tutkimusideaan.
[05:28] Me ollaan kerätty jollain tavalla se tosiaan data, ja me kuvaillaan sitä dataa.
[05:34] Me ei välttämättä haluta myöskään todistaa muuttujen välistä yhteyttä, mutta nämä voi kuitenkin antaa meillä osviittajia nimenomaan ideoita seuraavinkin tutkimuksiin, ja sitä kautta me voidaan rakentaa mielenkiintoisia tutkimuskysymyksiä.
[05:51] Esimerkkejä tällaisista kuvailevista tutkimusta voisi olla myös tapauskuvaukset, joissa usein kuvataan vain yhden potilaan tarina, mitä siinä on tapahtunut.
[06:01] Tapaussarjat, joissa olemme keränneet muutaman samantyyppinen potilas esimerkiksi.
[06:08] Sitten poikkileikkaustutkimukset, joissa käytännössä aina kerätään data vain yhdestä aikapisteestä.

[Speaker 1]

[06:17] Sitten taas analyyttisissa tutkimuksissa me yritetään testata jotain tutkimushypoteesia ja osoittaa siis kausaalisia yhteyksiä muuttien välillä, eli syy-seuraussuhteita.
[06:29] Analyyttisten tutkimuksen sateenvarjon alla voisi ajatella olevan vielä kaksi alaluokkaa, sellaiset kuin havainnoivat ja kokeelliset tutkimukset.
[06:39] Ja taas, kuten jo nimikin vähän implikoi, niin havainnoivissa tutkimuksissa havainnoidaan.
[06:45] Eli tutkija ei yksinkertaisesti vaikka dokumentoi luonnollisesti tapahtuvia yhteyksiä tekijöiden ja vasteiden välillä.
[06:54] Yksi esimerkki voisi olla tämmöinen kuin tapausverrokkitutkimus,
[06:57] jossa ensin määritellään vaste, vaikkapa potilaat, joilla on keuhkosyöpä,
[07:02] verrattuna potilaisille, joilla ei ole keuhkosyöpää,
[07:04] ja sitten tutkitaan potilaiden aiempaa altistumista riskitekijöillä, esimerkiksi tupakka varmaan olisi tässä minun esimerkissä.
[07:12] Tai sitten näistä tutkitaan harvinaisia sairauksia, esimerkiksi on tehty väitöskirjoja, joissa tutkitaan syntymäepämuodostumia.
[07:19] Niissä on kerätty jokaiselle niin sanottu epämuodostuma lapselle viisi terveyttäkontrollia ja esimerkiksi vertaillaan äitien syömiä lääkkeitä tai sairauksia.

[Speaker 2]

[07:30] Tämäkin on tällainen tyypillinen esimerkki, missä olen ollut mukana.
[07:33] Meillä ei ole oikein mitään tietoa, mistä nämä lasten epämuodostumat ovat johtuneet.
[07:41] Sen takia olemme oikeasti saaneet rekisteristä kaikki näiden äitien syömät ostamat lääkkeet raskauden aikana.
[07:49] Usein olemme kiinnostuneita nimenomaan raskauden alkuvaiheesta.
[07:53] Myös me kerätään äidin sairaukset, äidin painot, bodimasindeksit ja näin, ja me koitetaan löytää joku mahdollinen tämmönen, mikä voisi aiheuttaa näitä epämuodostumia.
[08:05] Oikeasti me ollaan hirveän kiinnostuneita, mikä voisi aiheuttaa, mutta oikeasti me ei ennen tätä meidän analyysejä kunnolla tiedetä asiasta.

[Speaker 1]

[08:14] Joo.
[08:16] Eli vielä kertauksena tapausverrokkitutkimuksista.
[08:20] Niissä aloitettiin tutkimuksen lopputuloksesta, eli vasteesta.
[08:23] Jonka jälkeen tutkitaan ajassa taaksepäin ja määritellään riskitekijöitä,
[08:26] eli selittäviä muuttuja.

[Speaker 2]

[08:28] No sitten me voitaisiin ajatella toisena esimerkkinä
[08:32] tämmöisiä kohorttitutkimuksia, eli seurantatutkimuksia,
[08:35] jokaan sitten taas ihan tavallaan tehdään vähän toisinpäin.
[08:40] Eli me ollaan jollain lailla tietoisia näistä,
[08:42] että mitkä saattaisiin olla riskitekijöitä, ehkä ei ollut varmoja, koska me teemme tutkimusta, mutta meillä on joku haisu näistä mahdollisista riskitekijöistä.
[08:52] Ja sitten me kerätään sitä dataa, me otetaan myös nämä riskitekijät huomioon ja me tietenkin kerätään muitakin taustatekijöitä.
[09:02] Ja sitten me lähdetään seuraamaan näitä erilaisia ryhmiä ja katsotaan sitten, kuka sairastuu tämän seurannan aikana.
[09:09] Yksi esimerkki on Turussa tehty pitkä pitkä, ainakin 20-30 vuotta jo ollut, DIP-tutkimus, jossa siellä on mukana lapsia, joilla on erilaisia näitä diabetesriskialleleja,
[09:26] niitä vähän eri tasoisia, ja nyt me sitten seurataan, tai on seurattu heitä 2-30 vuotta, ja sitten me katsotaan, kenelle sitten tulee tämä tyyppin yksi diabetes.
[09:38] Me aloitamme mahdollisista riskitekijöistä ja saamme seurannan aikana selville, kuka sairastuu, ja koitamme tämän datan avulla tarkentaa tietoa sairauden puhkeamisesta.
[09:55] Nämä ovat samantyyppisiä, tutkimuksen tavoite on sama, saada selville lisää jostain sairauden riskitekijästä, mutta se tutkimuksen suunta oli tässä erilainen.

[Speaker 1]

[10:16] Eli tapausverrokkitutkimuksessa tosiaan aloitettiin vasteesta, jonka jälkeen katsottiin taaksepäin ja etsittiin mahdollisia altistuksia riskitekijöille eli määritellään sitten jälkikäteen selittäviä tekijöitä ja kohorttitutkimuksessa taas just toisinpäin, että saatetaan aloittaa valtavasta määrästä erilaisia altistuksia riskitekijöille, jonka jälkeen katsotaan eteenpäin ajassa ja etsitään sitten sitä vastetta eli selittävää tekijää.
[10:43] Sitten toinen suurempi luokka analyyttisten tutkimusten alla oli kokeelliset tutkimukset.
[10:49] Tämä on nyt luultavasti se tutkimusasetelma, josta meillä ja varmaan tämän podcastin kuuntelijoillakin on ehkä eniten kokemusta tai tietoa.
[10:57] Voisi sanoa, että kokeelliset tutkimukset on ihan tieteellisen tutkimuksen kulmakivi,
[11:02] joissa tutkija altistaa osan tai kaikki tutkimusjoukosta jollekin tekijälle.
[11:07] Tutuimpana esimerkkinä tällaisesta tutkimuksesta on varmaankin satunnaisesti tutut kontrolloidut tutkimukset.
[11:14] Taas esimerkkinä vaikka kaikki lääketutkimukset, joissa on usein mukana lumelääkäryhmä, jonka muutoksia verrataan lääkäryhmän muutokseen.

[Speaker 2]

[11:22] Tässä on tärkeänä asiana ymmärtää, että vain näillä kokeellisilla tutkimuksilla voidaan osoittaa todellinen, kausaalinen eli syy-seurausyhteys,
[11:31] jossa nimenomaan tutkija antaa sen altisteen tai onko se sitten lääke tai mikä on.
[11:39] Eli pakottaa tämän tutkittavan kausaalisen yhteyden tutkimuskohteille, jos ne hienosti sanotaan.
[11:46] Nyt kun me tehdään tämmöistä lääketutkimusta esimerkiksi, niin me tutkitaan sitten sitä, että tekeekö se lääke mitä me haaveillaan sen tekevän
[11:55] vai tekeekö se liian vähän mitä me haaveillaan sen tekevän.
[12:00] Jos meillä on esimerkki, jossa lääkkeellä pyritään vaikuttamaan vaikka luontihoitojen nostamaan luontihoitta,
[12:06] niin me tehdään siinä tutkimuksessa mittauksia, ja sitten me pystytään tilastollisella mallintamisella todistamaan,
[12:13] että nousiko sen lääkeryhmän luontihoidon keskiarvo enemmän kuin lumenlääkeryhmällä.
[12:20] No sitten havainnoivat tutkimukset, kuten ne tapausverokkitutkimukset ja kohorttitutkimukset, voi näyttää myös yhteyttä eli korrelaatiota näiden asioiden välillä, mutta ne ei osoita välttämättä syytä sille tapahtumalle tai vasteelle.
[12:38] Ja sen takia tämä ainut tapa osoittaa syyseuraussuhteet eli kausallisuus on tämä kokeellinen tutkimus.

[Speaker 1]

[12:45] Joo.
[12:46] Siinä oli aika tyhjentävästi käytännön erilaiset tutkimusasetelmat läpsi.

[Speaker 2]

[12:51] No niin, nyt kun ne on sitten käyty läpi, niin voitaisiinko me sitten puhua myöskin näiden eri asetelmien hyvistä ja huonoista puolista, koska tämä on aika suuri kysymys.
[13:02] Miksi esimerkiksi joku haluaisi tehdä havainnoivaa tutkimusta,
[13:06] vaikka me jo päädystiin siihen, että ainoastaan tällä kokeellisella tutkimuksella
[13:10] me voidaan osoittaa tämä kausaallinen yhteys ja syy-seuraussuhde,
[13:13] joka me oikeasti tietenkin halutaan tietää?

[Speaker 1]

[13:16] Joo, musta tuntuu, että helposti tulee ajateltua,
[13:18] että mitä ihmeen järkeä on edes tehdä havainnoivaa tutkimusta.
[13:23] Mutta uskokaa tai älkää, niin esim.
[13:25] näillä kohortti tai tapausverkkotutkimuksilla
[13:27] on ehdottomasti myös hyviä puolia.
[13:30] Kohorttitutkimusten eli seurantatutkimusten hyötyä on esimerkiksi se, että sä voit olla varma siitä ajankohdasta.
[13:36] Sä voit olla varma siitä, milloin jotain tapahtui ja milloin se seuraava asia sitten tapahtui.
[13:42] Sitten sä voit myös tutkia useampaa lopputulosta annetulle altistukselle ja tutkia useampaa altistusta samassa kohortissa.
[13:49] Sitten sä voit myös määrittää lopputuloksen suhteellisen riskin annetulla altistuksella.
[13:55] Sitten tämä toinen, eli tapausverrokkitutkimukset, niiden hyödyt taas on esimerkiksi, että sä voit valita tapaukset juuri sulle sopiviksi.
[14:03] Se voi potentiaalisesti vähentää sekoittavien tekijöiden harhaa, eli semmoista systemaattista virhettä siinä tutkimuksessa.
[14:10] Sä tarvit kokonaisuudessaan paljon pienemmän otoksen mahdollisesti, ja pienemmät otokset tietysti tarkoittaa pienempiä tutkimuskuluja.

[Speaker 2]

[14:18] Joo, todella paljon pienempiä tutkimuskuluja.

[Speaker 1]

[14:21] Joo, mitäs vielä.
[14:24] Niin, sä voit tarkastella useita altistumisia lopputuloksille.
[14:29] Ja tapausverkkotutkimukset on todella hyviä myös harvinaisille taudeille, koska usein on tosi vaikeaa selvittää,
[14:35] että kuka nyt sitten sairastuu näihin harvinaisiin tauteihin, jos niitä tapahtuu esimerkiksi vain yhdessä miljoonasta tapauksesta.

[Speaker 2]

[14:42] Joo joo, mä voin kertoa myös yhden esimerkin, kun mä olin yhdessä laitekehitysfirmassa töissä,
[14:48] Me kehitettiin tällaista testiä tällaiseen skits-sairauteen, jota tulee noin yhdelle syntyvälle lapselle 60 000 syntyvään lapseen.
[15:01] Viranomaiset sanoivat, että meidän pitää löytää 15 tällaista sairaslabranäytettä.
[15:09] Suomessa meidän pitäisi kerätä dataa noin 20 vuotta, niin se on täysin mahdoton tehtävä firmalle.
[15:15] Joten ainoa tapaus on mennä keräämään ympäri Eurooppaa pakkasista näitä sairasnäytteitä.
[15:21] Se on yksi esimerkki, että me ei pystytä vaan käytännössä tekemään mitään prospektiivista tutkimusta tämmöisille harvinaisille sairauksille.
[15:30] No sitten kohortti ja tapausverkkotutkimuksessa on tietysti myöskin haittoja tai huonoja puolia.
[15:38] Esimerkiksi kohorttitutkimuksilla varjopuoli tietenkin on se sama kuin äskeisessä esimerkissä, että meidän pitäisi tehdä tätä seurantaa tosi pitkään, mikä ei ole aina käytännössä mahdollista.
[15:54] Tietenkin niissä voi olla myös semmoisia sekoittavia tekijöitä, mitä me emme halua.
[16:03] Sitten tapausverokkitutkimuksessa taas meillä voi olla haittojakin sellaisia, että meillä on joskus vaikeaa löytää niitä sopivia verokkeja,
[16:12] koska ne pitäisi olla muuten ihan samanlaisia, mutta niiltä pitäisi puuttua vain se MS-sairaus, koska me halutaan tietenkin mahdollisimman paljon vähentää tätä harhaalisystemaattista virhettä.
[16:26] Varsinkin, jos tutkimus on kyselytutkimus tai haastattelu, niin meille voi tulla muistiharhaa, että ihmiset eivät muista asioita.

[Speaker 1]

[16:38] Muistiharhaan oli sitä, että joku tutkittava potilas, kun siltä kysellään haastattelussa mitattavia asioita, muistaa väärin tai ei muista ollenkaan, mitä hän on vaikka syönyt.

[Speaker 2]

[16:53] Ja sitten meillä on myöskin tämmöisiä, että mitä kaikkea me voidaan laskea näistä erilaisista tutkimuksista.
[17:00] Että tapausverokkitutkimuksessa me ei oikein voida määrittää suhteellista riskiä,
[17:04] mutta me voidaan laskea tämmöinen ristisuhde, eli odds ratio,
[17:08] mikä on hyvin paljon käytetty erilaisissa julkaisuissa.

[Speaker 1]

[17:13] Joo.
[17:13] Sitten kuten me jo painotettiin monta kertaa aiemmin,
[17:17] Sitten taas kokeellisten tutkimusten kohdalla hyödyt on, että voit selvittää todellisen kausaalisuhteen eli syy-seuraussuhteen.
[17:26] Ja jos sä satunnaistat potilaat kokeellisissa tutkimuksissa tai koehenkilöissä,
[17:31] niin sä pääset todennäköisesti eroon niistä sekoittavista tekijöistä, joista olemme helposti huolestuneita muilla tutkimustyypeillä.
[17:39] Sä voit myös tarkastella altistumista ja lopputulosta paljon eristetymmällä tai lainausmerkeissä laboratorio-olosuhteisemmalla tavalla ja sillä lailla sitten taas vähentää jonkin verran aineiston sitä niin sanottua melua tai kohinaa.

[Speaker 2]

[17:53] Tästä yhtenä esimerkkinä on vaikka lääkkeen imeytymistutkimukset,
[17:58] jossa tutkimushenkilöltä kielletään liikunta, saunominen.
[18:02] He jopa syövät samaa ruokaa, saavat juoda vettä tietyn standardin määrän.
[18:08] Tällä tavalla yritetään juuri melua kohinaa, eli vaihtelua vähentää.

[Speaker 1]

[18:16] Tietysti kokeellisilla tutkimuksilla on myös haittoja.
[18:20] Kuten kaikilla tutkimustyypeillä.
[18:23] Kokeelliset tutkimukset voivat olla helposti tosi kalliita.
[18:26] Rekrytointi voi olla todella vaikeaa, vähän riippuen siitä, mitä yrittää tutkia.
[18:31] Sitten tietysti jotain sairauksia tai lopputuloksia ei voida oikein eettisesti arvioida kokeellisilla tutkimuksilla.
[18:37] Esimerkkinä just se, että ei voida pakottaa ketään polttamaan askeja ja tupakkaa päivässä,
[18:42] ja sitten katsoa, miten se vaikuttaa hänen keuhkoihin.
[18:46] Sitten tietysti kokeelliset tutkimukset voivat viedä hyvin kauan aikaa.

[Speaker 2]

[18:51] Sitten täytyy myös tajuta se, että kokeelliset tutkimukset usein käytännössä katsomaan maksaa miljoonia ja ne vaatii ihan valtavan koneiston ympärilleen.
[19:02] Olen juuri ollut mukana parissa tutkimuksissa, joissa näitä tutkittavia koehenkilöitä rekrytoitiin ympäri maailman.
[19:12] Ja tämmöiseen hallinnointiin vaaditaan tietenkin hirveästi ihmisiä ja sitten tutkimuksen luvat haetaan niistä joka ikisestä maasta ja se vaatii myöskin hirveästi byrokratiaa ja muuta.
[19:25] Ja jos nyt ajatellaan tämmöistä akateemista yliopistoympäristöä niin eihän tutkijoilla ole semmoisia rahoja varsinkaan Suomessa.

[Speaker 1]

[19:35] Okei, eli kaikki, mitä tähän mennessä ollaan käyty läpi, niin on varmasti monelle kuuntelijalle ollut vähän semmoista kertausta.
[19:43] Mutta seuraava askel onkin sitten itse podcastin aihe, että okei, sulla on tutkimus, sä oot käynyt aineiston.
[19:51] Miten ihmeessä sä nyt sitten analysoit sitä sun aineistoa?

[Speaker 2]

[19:54] Joo, no mä aloittaisin miettimällä siitä sun datasta niinku ne kulmakivet.
[20:01] Eli mun mielestä dataa tarvitsee nimenomaan ymmärtää sen datan tärkeimmät ominaisuudet.
[20:08] Ja me ollaan jo puhuttu siitä vasteesta, eli se kiinnostuksen kohteena oleva muuttujan havainnot,
[20:14] ja sitten tekijä, jolla me koitetaan selittää sitä vasteen käyttäytymistä.
[20:18] Mutta tämä tarvitsee ensimmäisenä ymmärtää.
[20:22] Mutta sitten meillä on muitakin tärkeitä näitä kulmakiviasioita.
[20:28] Vastaista minun pitää vielä täydentää se, että siitä kiinnostuksen kohtenolla muuttujasta sinun pitää ymmärtää, minkälainen se muuttuja on.
[20:37] Tämän kurssin puitteissa usein riittää näitä analyysejä varten se, että sinun pitää ymmärtää, onko se sinun kiinnostuksen kohtenolla muuttuja kategorinen vai onko se jatkuva eli numeerinen.
[20:48] Sitten vielä sun täytyy ymmärtää, mitä siinä sun datassa on riippumatonta.
[20:55] Onko siellä havaintoja, jotka onkin riippuvia.
[20:59] Tyypillinen esimerkki tästä on se, että kun me mitataan eri henkilöiltä arvoa, vaikka verenpainesulta ja multa, Markus,
[21:07] niin totta kai ne on riippumattomia havaintoja.
[21:10] Mutta jos multa mitataan kaksi kertaa se verenpaine, niin ne on riippuvia mittauksia.
[21:17] Ja kumpaankin näihin tapaukseen tehdään siis erilaiset tilastolliset testit, eli meidän täytyy ymmärtää onko meidän havainnot riippumattomia vai riippuvia.
[21:28] Koska muuten sä voit tehdä ihan vääriä testejä.
[21:32] Ja sit jos sulla on vastenumerinen jatkuva muuttuja, niin sun täytyy saada tietoa siitä minkälainen sen jakauma on.

[Speaker 1]

[21:41] Joo.
[21:43] Nyt me jatketaan sit sillä lailla, että me yritetään käydä läpi tämmönen erittäin hyvä, mutta ensi vilkausulla varmasti aika pelottava taulukko,
[21:51] jolla voi tarkastella kerättyä dataa ja valita lopulta sit oikea tilastollinen testi just sun tilanteeseen.

[Speaker 2]

[21:57] Niin se tarkoitat sitä meidän kaksi sivusta analyysikarttaa?

[Speaker 1]

[22:00] Joo, kyllä.
[22:01] Juuri näin.
[22:02] Eli mennään ihan kurssin aiheeseen.
[22:05] Me ei nyt voida tässä jaksossa kuvailla, miten käytännössä jokainen testi suoritetaan,
[22:11] koska siinä on ihan liikaa informaatiota yhteen jaksoon, mutta tämä lyhyt läpikäynti toivottavasti
[22:17] auttaa vähintäänkin esittämään ne peruskysymykset, joiden perusteella sä voit katsoa sun aineistoa
[22:22] ja ajatella, että okei, tähän mun pitäisi kiinnittää huomiota, kun suunnittelen analyysejäni.
[22:28] Okei, eli tosiaan, niin kuin Elisa mainitsi, niin käydään läpi sitä kurssin sivuilta löytyvää kahden sivun analyysikarttaa.
[22:36] Ihan ensimmäinen kysymys on, mitä tyyppiä sun aineiston vastemuuttuja on.
[22:41] Eli niin kuin Elisa tuossa jo aiemmin mainitsi, niin tässä on kaksi kaaraa.
[22:45] Vaste on joko jatkuva, eli numeerinen, tai sitten se on kategorinen.
[22:50] Joten kertauksena jatkuvan muuttujan kohdalla on siis kyse asioista, jotka liikkuvat jatkumossa.
[22:56] Esimerkiksi ikä, BMI, paino, ja tämä siis tarkoittaa sitä, että esimerkiksi se paino voi olla 100 kiloa, 101 kiloa, 102 kiloa, yksitoisensa jälkeen, eli liikkuvat jatkumossa.
[23:09] Jatkuvat muuttujat ovat hieman monimutkaisempia kuin seuraava tietotyyppi, joten palataan niiden varsinaiseen analyysiin ihan hetken päästä.

[Speaker 2]

[23:17] Tämä toinen yleinen tietotyyppi, johon me kaikki törmätään, on tosiaan kategorinamuuttuja.
[23:27] Kategorisen muuttujien analyysi löydät sieltä analyysikartalta sivulta 2.
[23:33] Nimensä mukaisesti kategorinan data on dataa, joka on jaoteltu useisiin diskreteihin luokkiin tai kategorioihin.
[23:42] Esimerkiksi meillä voi olla sukupuoli, mies, nainen, muu.
[23:46] Siinä on kolme kategoriaa.
[23:49] Kyllä, ei on tietenkin kategorisointitapa.
[23:54] Eli johkin kysymykseen voi vastata vain kyllä tai ei.
[23:59] Ja jos sinulla on kategorinen vastemuuttuja ja kategorinen tekijä,
[24:05] eli sinulla on tilanne niin sanotusti cut-cut,
[24:09] niin me voidaan tällaista kahden kategorisen muuttujan välistä yhteyttä tutkia esimerkiksi kiinneljötestillä.
[24:19] Yksinkertaisesti sanottuna se testi määrittää, onko siellä tilastollisesti merkitsevää eroa vaikka näissä luokissa mies-nainen-muu, vaikka nyt tupakoinnin suhteen.
[24:33] Tai sitten meillä voi olla erilainen tilanne, että me halutaan tutkia yhteyttä esimerkiksi polvi ja lonkkakivun välillä, jotka olisivat kyllä ei muut vastauksemahdollisuuksia.
[24:46] Jos taas tässä taulukossa on aika pieniä frekvenssejä, eli suomeksi vähän henkilöitä,
[24:54] niin me joudutaan käyttämään Fischerin exaktia testiä, joka periaatteessa tutkii ihan samaa asiaa kuin tämä kiinnelijotesti,
[25:03] mutta se on todellakin tarkka testi, se laskee tarkat todennäköisyydet yhteen.
[25:08] Eli sitä voi käyttää aina, se on aina parastesti.
[25:13] Mutta mikä sen haittaa on, että se tietokoneen vaatima laskuaika voi olla tosi tosi pitkä, jos sulla niitä kategorioita on paljon.
[25:24] Mulla pisin laskuaika on ollut tosiaan noin viikon verran.
[25:28] Ja sen takia mä pelkään, että moni podcastin kuuntelijakin luulee, että tietokone on jäänyt jumiin.
[25:33] Ei jää jumiin, vaan se vaan kestää pitkän aikaa.

[Speaker 1]

[25:37] Sitten voisit miettiä, miten monimutkainen lasku on kyseessä, jos tietokoneeltakin kestää viikko.

[Speaker 2]

[25:42] Joo, ja sen takia me opetetaan myös nämä kaksi testiä, että voi käyttää suuriin lukuihin aina.
[25:50] JMP, meidän CHAMP-ohjelma, antaa myös varoituksen, milloin se kiinneliötesti ei ole sopiva testi.
[25:56] Silloin on tietenkin ainakin pakko käyttää sitä Fisherin Exactia-testiä.
[26:01] Nämä testit voi tehdä tämän kurssin puitteissa sekä nominaaliasteikollisille kuin ordinaaliasteikollisille muuttujille.
[26:09] Taas kertauksena vähän.
[26:10] Nominaaliasteikollinenhan oli semmoinen, jos kategorisessa muuttujissa luokilla ei ole järjestystä, niin kuin vaikka mies-nainen muu.
[26:18] Ja ordinaaliasteikollinen on semmoinen kategorinen muuttoja, kuten vaikka mielipide kysytty asteikolla 1-5 täysin eri mieltä, täysin samaa mieltä.
[26:27] eli missä on se järjestys.
[26:30] Okei, mutta otetaan vähän takapakkia.
[26:33] Mennään takaisin jatkuviin muuttujiin.
[26:36] Mitä me silloin tehdään, Markus, jos se vastenmuuttoja on jatkuva?

[Speaker 1]

[26:40] Joo, eli jos vastenmuuttoja on jatkuva, eli numeerinen,
[26:43] niin seuraavaksi täytyy miettiä, että millainen jakauma sillä on.
[26:47] Ja muistettava taas se, mitä sä sanoitkin jo,
[26:50] että on vain yksi havainto per tutkimushenkilö,
[26:54] Eli havainnot on tosiaan riippumattomia toisistaan.
[26:58] Eli tämä nyt oli taas esimerkiksi se, että jos mitataan minun verenpaineeni ja Eliisan verenpaineeni, niin ne ei liity toisiinsa millään lailla.
[27:06] Jakaumatarkastelussa sun pitää päättää, että onko sun data normaalisti jakautunutta vai ei.
[27:12] Mutta käydään näitä vähän tarkemmin läpi ennen sinne analyysikaavioon siirtymistä.
[27:18] Eli riippumattomuus siis tilastotieteessä tarkoitti sitä, että yhden asian esiintyminen ei vaikuta toisen asian todennäköisyyteen esiintyä.
[27:27] Esimerkkinä juuri esimerkiksi tämä mun ja Elisan verenpaineet tai sitten yksinkertaisesti nopan heitto.
[27:33] Eli ihan sama kuinka monta kertaa sä heität noppaa, niin todennäköisyys saada silmäluvuksi esimerkiksi yksi tulee olemaan aina täysin sama.

[Speaker 2]

[27:43] Sitten siirrytään siihen toiseen kriteeriin, eli onko se data normaalisti jakautunutta vai ei.
[27:53] Me ollaan kaikki kuultu siitä normaaliakaumasta, kellokäyrästä, normaalikäyrästä, kaussinkäyrästä.
[28:02] Se tulee siitä, kun se muistuttaa vähän tämmöistä kelloa, se muoto.
[28:10] Helpoin tapa aloittaa datan tutkimista on piirtää muuttujasta histogrammi ja katsoa visuaalisesti, muistuttaako se tällaista kaussinkäyrää eli kellokäyrää.
[28:26] Histogrammista hirveän usein näkee jo, että jos se on jotain ihan muuta, eli se ei ole ollenkaan symmetrinen, miten aina kaussinkäyrä on.
[28:37] Silloin voin tehdä jo aika nopeastikin sen johtopäätöksen, että data ei ole normaalisti jakautunutta.
[28:43] Mitäs sitten, jos se on tämmöinen vähän sinne päin?
[28:48] Eli se muistuttaa vähän sitä kaussinkäyrää, mutta et ole kuitenkaan ihan siitä varma, että voinko nyt sanoa, että tämä on normaalisti jakautunut.
[28:58] Täytyy aina muistaa se, että kun me katsotaan datastiakaumaa, niin se ei ole sellainen kuin näissä kauniissa oppikirjoissa tai Wikipediassa,
[29:08] mikä kuvaa täydellistä normaaliakaumaa, eli sitä teoreettista normaaliakaumaa.
[29:12] Me pyritään katsoa sitä, että onko se likimain kohtuullisen lähellä sitä normaaliakaumaa.
[29:19] Mutta meillähän oli siinä paljon tämmöisiä apukeinoja, mitä me voidaan katsoa.
[29:24] Yksi parhaita on se QQ-plotti, minkä JMPstäkin saa, ja siellä on myöskin ne katkoviivat, että onko ne havaintopisteet katkoviivan sisällä.
[29:35] Meillä on vinous ja huipukkuusluvut, mutta nyt ei tässä podcastissa mennä ihan niin syvälle kertomaan, mitä ne kaikki oli.
[29:47] Mutta sitten täytyy vielä pistää vähän korvan taakse se, että jos me näemme, että se on vinojakauma, mikä on hirveän useimmissa labbramuuttujissa jostakin syystä, ne tuppaa olevan vinojen jakaumia,
[29:58] niin me voidaan myöskin muuntaa sitä dataa, eli tehdä joka havainnolle logaritmin tai neliöiden muunnos, ja sitä kautta hirveän useimmin saadaan se jakauma normaalisti jakautuneeksi.
[30:09] Sitten meillä on vielä lisää näitä oletuksia analyyseilla, eli meidän täytyy ymmärtää, siinä analyysikartassa yritetään hyvin kuvata sitä meidän taustaoletuksia, mitä meidän täytyy ensin selvittää, ennen kuin me päästään tekemään sitä varsinaista testiä.
[30:25] Me oletetaan aina, että näillä eri ryhmillä on kutakuinkin saman verran hajontaa, mutta tähänkin on sitten oma taustatesti, mitä me ollaan kurssillakin tehty.
[30:37] Mutta tässä oli nyt sitten tärkeämpiä pohjatietoja.
[30:39] Mitäs me sitten tehdään, Markus?

[Speaker 1]

[30:41] Okei, eli nyt sulla on siis jatkuva vastenmuuttuja,
[30:44] ja näillä Elisa mainitsemilla tarkasteluilla me ollaan nyt päätetty,
[30:48] että se on normaalisti jakautunut.
[30:51] Okei, seuraavaksi täytyy miettiä, että millaista kysymystä me kysytään.
[30:55] Ja tämä jakautuu laajasti kahteen kysymykseen,
[30:58] että haluatko sä tietää suhteista muuttujien välillä,
[31:02] vai haluatko tietää eroista eri ryhmien keskiarvojen välillä.

[Speaker 2]

[31:05] Ja suhteessa tarvitaan nimenomaan semmoista yhteyttä.
[31:11] Niin,

[Speaker 1]

[31:12] Eli vaikuttaako yksi muuttuja toiseen muuttujaan.
[31:16] Eli tässä kohtaa sun täytyy ensiksi pohtia, että minkälainen muuttujaa sun tekijä on.
[31:21] Eli se selittävä muuttuja.
[31:23] Onko sun tekijä sukupuoli vai BMI, eli onko se kategorinen vai numeerinen.
[31:29] Jos sä haluat tietää suhteista, eli niistä kahden muuttujan välisistä yhteydestä,
[31:34] eli vaikuttaako muuttuja x, joka on jatkuva muuttuja, muuttujaan y jollakin tavalla.
[31:40] Sä voit käyttää jotain nimeltä regressioanalyysi.
[31:44] Ja nyt me siis katsotaan jatkuvien muuttujien kaaviota sieltä analyysikartan sivulta 2.
[31:50] Tämmöisessä regressioanalyysissä se yhteysmuoto on siis num num,
[31:54] tai sitten num on yhtä kuin kat plus num.
[31:59] Eli vasteena on numeerinen muuttuja ja tekijöinä joko pelkkiä numeerisiä muuttujia tai sekä kategorisia että numeerisiä muuttujia.

[Speaker 2]

[32:07] Ja usein silloin, jos meillä on sekä numeerisiä että kategorisia muuttujia, niin sittenhän me puhutaan myöskin lineaarisista malleista.

[Speaker 1]

[32:14] Joo.

[Speaker 2]

[32:15] Mutta me ennää vielä tämä yksinkertainen, niin kuin meillä on vain yksi tekijä mukana siellä, yksi numeerinen tekijä.
[32:22] Joo,

[Speaker 1]

[32:23] Eli yksinkertaisin versio tästä regressiosta on lineaarinen regressio,
[32:27] jossa muuttujien välillä on lineaarinen yhteys, eli yläasteeltakin tutuin termein
[32:33] jana y on yhtä kuin a x plus b.
[32:37] Tällöin yhteys oli siis num num.
[32:40] Eli koordinaatistossa näkyy suora viiva, joka näyttää muuttujien x ja y-välisen yhteyden.

[Speaker 2]

[32:46] Muistetaan vielä, että kun me tehdään tätä datasta,
[32:50] niin me sovitetaan siihen dataan suora, joka parhaiten kuvaa sitä yhteyttä.
[32:55] Eihän ne havaintopisteet kaikki sillä suoralla viivalla ole.

[Speaker 1]

[32:58] Niin, jep.
[33:00] Jälleen kerran, tosi elämässä ei löydy niitä Wikipediaan teoreettisia,
[33:05] kauniita kuvioita.
[33:07] Ja tietysti tämän yhteyden ei myöskään tarvitse olla lineaarinen,
[33:11] vaan se voi olla esimerkiksi kaareva tai eksponentiaalinen.
[33:16] Eli regressioanalyyseja on myös monelle selittävälle muuttujalle tai ylipäätään epälineaarisille yhteyksille.
[33:22] Eli sä voit käyttää regressioanalyysiä, kun haluat selvittää, minkälainen funktio parhaiten kuvaisi kahden muuttujan välistä yhteyttä.
[33:31] Lineaarisessa regressiossa sä näet, että jos x-muuttuja muuttuu yhden yksikön verran, kuinka paljon keskimäärin y muuttuu.

[Speaker 2]

[33:38] Otetaan tästä vaikka tuon ihan käytännön esimerkkinä, että jos me tutkitaan painon ja kolesterolin välistä yhteyttä,
[33:46] niin me voitaisiin ikään kuin potilallekin sanoa, että jos sä pystyt pudottaa painoa 10 kg, niin sun kolesteroli keskimäärin tippuu tämän ja tämän verran.
[33:56] Ja sit sä et ehkä tarvitse enää vaikka kolesterolilääkitystä.
[33:59] Eli tätä voi ihan hyödyntää tämmöisissä potilastöissä.
[34:04] Ja totta kai labra-hommissa, mitä paljon biolääketieteen tutkijat tekevät,
[34:10] niin tämä on hyvin yleinen metodi.

[Speaker 1]

[34:12] Joo.
[34:13] No, mutta mitä sitten, jos sinä et selkeästi pysty erottamaan,
[34:16] että kumpi näistä sinun muuttujista on vasta ja kumpi tekijä,
[34:20] mutta sinä haluat kuitenkin tietää, onko näiden muuttujien välillä yhteyttä
[34:23] ja kuinka voimakasta se on.
[34:25] Niin silloin sinun pitää käyttää erilaista analyysimallia nimeltään korrelaatioanalyysi.
[34:31] Nyt puhutaan kahden jatkuvan muuttujan välisestä yhteydestä, eli yhteystyyppi on taas NumNum.
[34:38] Jos se datana noudattaa normaaliakaumaa, niin silloin käytetään tämmöistä kuin Pearsonin korrelaatio,
[34:43] ja jos taas data ei ole normaalisti jakautunut, niin käytetään epäparametristä versiota, eli Spearmanin korrelaatiota.
[34:51] Jälleen me ei nyt tässä jaksossa pureuduta näihin testeihin tämän tarkemmin.

[Speaker 2]

[34:55] Okei, nyt me siis tutkittiin tota NumNum-tilannetta, mutta meillä on aika paljon yleisempi semmoinen tilanne,
[35:04] että me halutaankin vertailla eri ryhmien välillä vaikka keskiarvoja.
[35:11] Eli me halutaan katsoa, että onko siellä ryhmässä A erilainen keskiarvo kuin ryhmässä B.
[35:17] Huomaa, että tämä ryhmä on nyt kategorinen muuttuja A ja B2-luokkaa.
[35:23] Nyt me ollaan sitten analyysikartalla sivulla yksi, ja esimerkkinä me voidaan vaikka tutkia, että onko tutkimusryhmässä erilainen podimasi-indeksi kuin kontrolliryhmässä, ja nimenomaan keskiarvojen suhteen.
[35:41] Eli tässä tapauksessa meidän vaste on podimasi-indeksi, numeroinen jatkuva muuttuja, ja tekijä on kategorinen, jossa on vielä kaksi luokkaa.
[35:51] Eli nyt me kutsutaan tätä analyysimallia NUMCAT-malliksi.
[35:57] Ja tuossa mun esimerkissä oli äsken kaksi ryhmää, mutta ensinnäisenä sun pitää tuossa analyysikartan sivulta yksikin selvittää, että kuinka monta ryhmää sulla on, kuinka monta keskiarvoa sä haluat vertailla.
[36:09] Ja taas tausto-oletuksia, kun me äskenkin pohdittiin, niin nyt meidän pitää katsoa sitä normaaliakauma-oletusta molemmissa ryhmissä.
[36:20] sinne JMP-henkisen by-group, eli kummassakin ryhmässä katsotaan erikseen sitä normaaliakauma-oletusta.
[36:25] Ja nyt jos meillä on kaksi vertailtavaa ryhmää ja kummassakin ryhmässä data noudattaa normaaliakaumaa,
[36:33] niin silloin me voidaan käyttää studentin t-testiä, jota me usein kutsutaan myös kahden riippumattoman ryhmän t-testiksi,
[36:42] jossa nimenomaan verrataan tätä keskiarvoja kahdessa eri ryhmässä.
[36:48] No, jos se data ei noudata normaaliakaumaa, niin meidän täytyy tehdä erilainen testi, joka ei sitä sitten edellytä.
[36:56] Eli silloin me käytetään Wilcoxonin järjestyssummatestiä, jota me usein kurssillakin kutsutaan Wilcoxon RankSum-testiksi.
[37:04] Ihan näin väännetään se englantia suomeksi, koska julkaisussa nämä kaikki testien nimet on käytännössä katsoen englanniksi, niin sen takia me käydään nekin läpi.
[37:13] Synonyymi tälle testille on Manwethin U-testi ja kaikissa näissäkin tutkitaan kahta riippumatonta ryhmää.
[37:21] Silloin kun me mennään epäparametrisiin testeihin, me ajatellaan yleensä, että me verrataan mediaania, koska nimenomaan kun me ei oleteta sitä normaaliakaumaa,
[37:31] niin silloinhän me ei voida verrata keskiarvoa,
[37:34] koska keskiarvo ei ollut optimaalinen tunnusluku,
[37:37] jos meillä on tosi tosi vino tai muuten outo jakauma.
[37:41] No, mitä me sitten tehdään, jos ryhmiä onkin enemmän kuin kaksi,
[37:45] vaikka sitten sukupuolimies, nainen, muut?
[37:51] Nämä teetestit ja näiden epäparametsit vastineet ei yleisty.
[37:56] Ne toimivat vain tälle kahden ryhmän tilanteessa.
[38:00] Mutta jos meillä on enemmän kuin kaksi ryhmää, niin silloin, jos data noudattaa normaalia kaumaa, niin me voidaan käyttää yksisuuntaista ANOVA-testiä, One Way ANOVA, joka suomeksi on siis varianssianalyysi.
[38:17] Mutta kannattaa huomioida, että tämä nimi on vähän monella tapaa jännä.
[38:22] Me verrataan keskiarvoja, mutta me tutkitaan tätä keskiarvon eroa tutkimalla datassa olevaa vaihtelua.
[38:31] Ja varianssihan on keskihajonta toiseen, joten me tutkitaan sitä sen vaihtelun avulla.
[38:37] Mutta jos se vaste ei ole normaalisti jakautunut näissä ryhmissä,
[38:42] niin silloin meidän epäparametrinen testin nimi on kruskalvalisin testi.
[38:51] Aletaanko me olla, Markus, aika täällä ylärajoilla meidän tilastollisessa ajattelukyvyssämme?

[Speaker 1]

[38:58] Joo, ehdottomasti.
[38:59] Tässä on nyt kyllä tullut ihan infoa mohan täydeltä, niin sanotusti.
[39:05] mutta muistakaa tosiaan, että kaikki tämä tieto mitä me käydään läpi on siellä kurssin sivujen analyysikartassa mitä kannattaa pitää silmällä tässä jatkuvasti.

[Speaker 2]

[39:14] Juu, ja sit vielä tosi tosi tärkeä pointti, mitä mä haluan muistuttaa, että jos siltä henkilöltä on mitattu joku asia kaksi kertaa, niin ne havainnot ei ole riippumattomia.
[39:26] Silloin edellä mainitut testit eivät tietenkään sovi.
[39:30] Silloin me käytämme parittaista t-testiä tai Wilcoxon SineTrank-testiä, joka on suomeksi Wilcoxonin merkittyjen sijalukujen testi.
[39:39] Eli yleensä me lasketaan, jos me mitataan kaksi kertaa, me lasketaan vielä niiden erotus eli esimerkiksi sen muutos muuttuja.
[39:47] Mutta mennään vielä yksi vähän monimutkaisempi asia läpi, vai mitä, joka liittyy myös näihin meidän mainitsemiin juttuihin.

[Speaker 1]

[39:55] Juu, eli tämä viimeinen asia on melko monimutkainen ja se on nyt täysin ok, jos sä haluat antaa tämän mieluummin tutkimusryhmänsä tilastotieteilijälle tehtäväksi, mutta voi olla ihan hyvä olla edes perusymmärrys.
[40:08] Yksi kysymys, joka tulee aina esiin tutkimuksia suunniteltaessa, että noh, entä jos sä haluat ottaa huomioon useampia tekijöitä siinä mallinnuksessa kuin vaan kahta.
[40:17] Niin kuin tässä ollaan nyt puhuttu näistä kaikissa analyysissä on ollut vain kaksi muuttujaa.
[40:23] Eli nyt siis puhutaan siitä aiemmin ohimenen mainitusta NUM on yhtä kuin CAT plus NUM yhteydestä.
[40:30] Eli että vastenmuuttoja on jatkuva ja sitten ne selittävät voi olla sekä kategorisia että jatkuvia.

[Speaker 2]

[40:37] Joo ja tämähän on tosi tosi tyypillinen meidän jokapäiväisessä elämässä.
[40:43] Meidän tutkimusdata on niin monimutkainen, että ei sinne riitä vaan yksi tekijä selittämään sen vasteen käyttäytymistä.
[40:50] vaan me halutaan laittaa sinne monta tekijää, jotka voi olla kategorisia tai numeerisia tai molempia tosiaan.
[40:59] Mä annan esimerkin tästä yhdestä väitöskirjatutkimusjulkaisusta.
[41:05] Me haluttiin tutkia, mitkä tekijät on yhteydessä elämänlaatuun ja sitten me haluttiin myös tutkia, mitkä tekijät on yhteydessä työkykyyn.
[41:16] Me tutkittiin unenlaadun yhteyttä, parisuhteen yhteyttä,
[41:20] podimasindeksin yhteyttä, tupakoinnin yhteyttä, koulutustason yhteyttä,
[41:24] masennuksen ja ahdistuksen yhteyttä, kolmivuorotyötä ja niin edelleen.
[41:27] Niitä oli aika paljon, koska ymmärrätte sitä, että jos me puhutaan elämänlaadusta,
[41:33] työkyvystä, niin ei yksi tekijä millään riitä selittämään sitä.
[41:37] Ja tässäkin tutkimuksessa oli mukana yli 700 Porin kaupungissa työskentelevää ihmistä.

[Speaker 1]

[41:44] Joo, mutta vaikka sitä elämänlaatua tutkiessa tosiaan tarvitaan hirveä määrä niitä mahdollisia selittäviä muuttuja,
[41:52] niin onneksi sitäkin voidaan analysoida ihan tilastollisella mallinnuksella.
[41:57] Ja nyt, koska mukana tässä esimerkissä on sekä jatkuvia että kategorisia tekijöitä,
[42:02] niin me sanottaisiin tätä mallia monisuuntaiseksi tai monentekijän varianssianalyysiksi.
[42:08] Tai yleisemmin voidaan sanoa vain lineaarinen malli, johon voidaan lisätä muuttuja, joita sä haluat kontrolloida.
[42:15] Ja kategoristen muuttujien tapauksessa sä voit käyttää logistista regressiota.

[Speaker 2]

[42:19] Nimenomaan silloin, kun vaste on se kategorinen muuttuja.
[42:23] Usein vieläpä binäärinen kyllä ei, lonkkamurtuma kyllä ei.

[Speaker 1]

[42:27] Joo, kyllä.
[42:27] Hyvä huomio.
[42:29] Eli jos sun vastenmuuttoja onkin sitten kategoriina, niin sä voit käyttää tosiaan logistista regressiota, joka lisää malliin muuttujat, joita sä aloit kontrolloida.
[42:38] Ja tämmönen logistinen regressio antaa sulle eräänlaisen ristisuhteen, eli odds ration.
[42:45] Eli vertailuluvun, jossa esimerkiksi vertaillaan lääkkeen merkitystä lonkkamurtumien vähenemiseen verrattuna johonkin lumelääkkeeseen.
[42:52] Joo, siinä tuli taas paljon asiaa.
[42:57] Meidän piti harjoitella vielä oikean tilastollisen testin valintaa käytännön esimerkeillä,
[43:03] mutta ehkä me voitaisiin siirtää se omaan jaksoonsa, koska tässä on jo puhuttu aika pitkään.
[43:09] Mutta tiivistetään tähän nopeasti vielä loppuun, että mistä kaikesta tänään on oikein puhuttu.

[Speaker 2]

[43:14] No tänään me aloitettiin käymällä läpi paljon määritelmiä, puhuttiin riskitekijästä tai interventiosta,
[43:20] jonka vaikutusta tutkitaan, ja tuloksista, jotka saadaan sen riskitekijän tai intervention seurauksena, eli se vaste, mitä me halutaan oikeasti tutkia.
[43:32] Sitten me keskusteltiin eri tutkimustyypeistä, jotka myös vaikuttavat siihen tilastollisen testin valintaan.
[43:38] Eli ne retrospektiiviset tutkimukset versus prospektiiviset tutkimukset.
[43:43] Eli kerätäänkö se data, joka on jo olemassa, vai aloitetaanko me tutkimus ja tehdään ne mittaukset itse tulevaisuudessa.
[43:51] Ja sitten me puhuttiin havainnoivista versus kokeelliset tutkimukset.
[43:55] Ja sitten me korostettiin sitä, että vain kokeellisesta tutkimusta voidaan tehdä nämä syysseurauspäätelmät.

[Speaker 1]

[44:01] Sen jälkeen me hypättiin yleisiin tilastollisiin testeihin.
[44:06] Joten testeistä puhuttaessa me käytettiin kurssin sitä kaksi sivuista analyysikarttaa.
[44:12] Ensimmäinen tehtävä oli tunnistaa, mikä on vaste ja mikä on tekijä siinä sun datassa.
[44:18] Myös tärkeä komponentti oli tunnistaa, että onko ne havainnot datassa riippumattomia,
[44:23] eli esimerkiksi mitattu eri ihmisistä, vai onko ne riippuvia, eli mitattu vaikka kaksi kertaa sama asia samalta ihmiseltä.
[44:33] Kun se tunnistat vasteen, niin seuraavaksi oli tunnistettava, että onko se vaste numeerinen vai kategorinen muuttuja.
[44:41] Jos vaste oli kategorinen, niin kurssilla käytettiin Kiin 4 tai Fisherin
[44:46] eksaktia testiä havaitsemaan eroja tai yhteyksiä siihen toiseen kategoriseen
[44:51] muuttujaan, eli silloin kun yhteys oli cut-cut.

[Speaker 2]

[44:55] Ja sitten taas jos sun vaste olikin se numeerinen muuttuja, niin piti ensin tutkia
[45:00] sen jakaumaa, että onko se normaalisti jakautunut vai ei, ja valita sen mukaan testi.
[45:07] Koska usein nämä testit, kuten tämä kahden riippumattoman ryhmän t-testi ja yksisuuntainen varianssianalyysi,
[45:13] oletus on nimenomaan se pakollinen taustaoletus, että se vaste on normaalisti jakautunut, ja vielä kaikissa ryhmissä.
[45:22] Ja sitten taas toisaalta, jos vaste ei ole normaalisti jakautunut, monnoksenkaan jälkeen,
[45:27] niin sitten me siirrymme näihin niin sanottuihin epäparametsiin testeihin.
[45:31] Ja niiden kaavat perustuvat vain datassa olevaan järjestykseen.
[45:36] Ja oikeasti me unohdetaan ne havaintoarvot, ne numeroarvot.
[45:41] Eli vain se järjestys merkitsee.
[45:44] Jostain sitten on myös hyötyä se, että poikkeavat arvot ei silloin hetkauta niitä datan tuloksia.
[45:50] Näitäkin testejä olisi kuitenkin erikseen kahden ryhmän vertailuun ja useamman ryhmän vertailuun.
[45:56] Näissä testeissä me aina haluttiin tutkia sitä keskiarvo tai medianitasoeroja ryhmien välillä.
[46:03] Eli siinä suhteessa tämä oli taas tämmöinen num-cat-tilanne.
[46:09] Ja sitten taas, jos me haluttiinkin tutkia kahden numeerisen muuttujan välistä yhteyttä,
[46:14] eli num-num-tilanne, niin silloin siihen sopikin korrelaatiot ja lineaariset regressiot.
[46:22] Tärkeänä yksityiskohtana erikoistapauksena meidän kurssilla oli kahden aikapisteen vertailu, joka usein on tämmöinen ennen-jälkeen vertailu, johon on pakko tehdä erilaiset testit.
[46:34] Ja kun me usein lasketaan tämä muutosmuuttuja, niin me katsotaan sen muutosmuuttujan jakaumaa, ja jos se noudattaa normaalia jakaumaa, niin me voitiin käyttää parittaista t-testiä, tai sitten jos ei noudattanut, niin Wilcoxon SineTrank-testi oli sopiva testi sille.

[Speaker 1]

[46:52] Joo, ja jälleen kerran, tämä kaikki varmasti tuntuu alkuun aivan tuhottoman monimutkaiselta,
[46:58] ja varsinkin jos teet jo omaa tutkimusta, esimerkiksi syvärityötä,
[47:01] niin se voi olla kauhean pelottavaa valita testiä sun tarkkaan kerätylle datalle.
[47:07] Mutta nämä kyllä muistuu mieleen kertaamalla, ja muista aina,
[47:11] että kannattaa pitää lähettävillä esimerkiksi juuri sitä kurssin analyysikarttaa.

[Speaker 2]

[47:16] Ja sitten kannattaa aina myös muistaa, että aina jos on epävarma tai sinulla on joku asia epäselvää,
[47:24] niin sinä voit kysyä ohjaajalta tai sitten sinä voit ottaa yhteyttä meidän biostatistiikan yksikköön.

[Speaker 1]

[47:32] Okei, siinä taisi olla sitten lopulta kaikki tällä kertaa.
[47:36] Tosiaan minä olin Markus.

[Speaker 2]

[47:38] Ja minä olin Elisa.

[Speaker 1]

[47:39] Ja tämä oli Statistiikan aloilla podcast.
[47:42] Toivottavasti tämä jakso innosti sinua oppimaan lisää tilastollisesta testauksesta tai ylipäätään biostatistiikasta.
[47:50] Kuullaan taas Statistiikan aalloilla.
[48:02] Tämän podcastin on tuottanut Turun yliopiston lääketieteellisen tiedekunnan biostatistiikan

[Speaker 2]

[48:07] Yksikkö.

Ohjeita ensimmäiseen omaan tutkimukseen

Oletko aloittamassa opinnäytetyötä? Suunnitteletko määrällistä tutkimusta? Tällä Statistiikan aallolla on selkeitä ohjeita erityisesti lääketieteen, bio- ja hammaslääketieteen opiskelijoille sekä väitöskirjatutkijoille, jotka ovat aloittamassa ensimmäistä tutkimustaan. Hyvä tutkimussuunnitelma ja huolellisesti kerätty aineisto on laadukkaan tutkimuksen perusta!


[Speaker 0]

[00:02] Tervetuloa taas statistiikan aalloille.
[00:09] Tällä kertaa kohde yleisönämme on sinä, joka suunnittelet ensimmäistä määrällistä tutkimustasi.
[00:16] Minä olen biostatistikko Markus Riskumäki ja vierainani mulla on jälleen biostatistikko Elisa Löyttyniemi.
[00:19] Tervetuloa.
[00:20] Kiitos, kiitos.
[00:20] minulla on jälleen biostatistikko Elisa Löyttyniemi, tervetuloa.
[00:24] Kiitos, kiitos.
[00:26] Kuulen Elisa, minun pitäisi tehdä nyt syvärityö.
[00:32] Miten minun pitäisi lähteä etenemään sen kanssa?
[00:35] No, minä sanoisin, että onko se sitten syvärityö,
[00:39] tuleva väitöskirja-ekatyö tai vanhemman tutkijan ekatyö
[00:42] tai mikä tahansa työ, niin ensimmäisenä minä tekisin itselleni tiimin.
[00:50] rakentaisin itselleeni tiimin, koska mun mielestä tutkimus on nimenomaan yhteistyötä.
[00:57] Ja siinä on hyvin hyvänä, jos sä saat biostatistikon siihen tiimiin.
[01:04] Ja useinhan, jos sä teet vaikka sitä syvärityötä tai kandityötä tai maisterityötä, niin sulla on ohjaaja.
[01:09] Niin siinä on jo hyvä perusta tiimille, jolla lähdetään miettimään, minkälaista tutkimusta kannattaa tehdä.
[01:18] Okei, no tosiaan mulla nyt ei ole hirveästi tässä mun esimerkissä vielä tietoa, että mitä mä nyt sitten tekisin, että varmaan alkuun pitäisi joku tutkimuskysymys miettiä ja sit varmaan myös tutkimusrakenne.
[01:34] Joo, nimenomaan se, että useahan ohjaajilta tulee niitä ideoita, mitä lähdetään tutkimaan.
[01:40] Ja siinä ensimmäisenä mietitään sitä, että ruvetaanko me tekemään kokeellista tutkimusta, joka tarkoittaa prospektiivista tutkimusta,
[01:49] joka tarkoittaa sitä, että me dataa kerätään tulevaisuudessa.
[01:53] Vai onko se sitten sellaista dataa, joka on jo olemassa, eli retrospektiivinen tutkimus, mennään esimerkiksi potilaspapereihin,
[02:02] mitkä on nykyisin tietenkin noissa tietokannoissa, keräämään se data, mitä sitten tullaan analysoimaan.
[02:08] Eli siinä on tavallaan se oikeasti suuri, vähän raakakin kahtiajako, että onko sitä dataa jo jossain olemassa, vai tullaanko me keräämään se.
[02:18] Ja sitten siinä on tietenkin monta muutakin tutkimuskysymystä, ja nimenomaan pitää eka miettiä sitä, että mitä sä haluat nyt tutkia,
[02:26] ja mikä on se jutun se pointti, punainen langa, mihin kysymykseen me halutaan vastata.
[02:35] Siitähän se kaikki lähtee.
[02:37] Okei.
[02:38] No, leikitään nyt sitten, että mä olen keksinyt tai mun ohjaaja on keksinyt jonkun aiheen mulle.
[02:44] Sen punaisen langan mun tutkimukselle.
[02:47] Mutta miten ihmeessä nyt, sanotaan nyt, vaikka mä haluaisin näyttää jonkun vaikka lääkkeen toimivuuden johonkin sairauteen.
[02:59] Niin miten ihmeessä mä lähden nyt sitä sitten niinku tekemään, mä varmaan tarvitsisin jotain aineistoa siihen, johon puhuttiin.
[03:08] Olemme miettineet, onko se aineisto jo olemassa vai pitääkö meidän kerätä se.
[03:13] Seuraavaksi ruvetaan miettimään, mikä on meidän päämuuttujamme.
[03:16] Millä me voidaan todistaa meidän idea tai kysymys, että saadaan siihen vastaus.
[03:25] Päämuuttujamme voi olla tietenkin hyvin monenlaisia.
[03:28] Jos tutkimme syöpäpotilaita, me halutaan tutkia aikakuolemaan tai aikasyövän uusiutumisen,
[03:36] diagnoosista tai leikkauksesta.
[03:39] Se voi olla myöskin, että me tehdään polvileikkaus ja me katsotaan,
[03:42] milloin se polvi on taas toimintakykyinen.
[03:47] Meillä on lukuisia tietenkin erilaisia kysymyksiä,
[03:52] mitä me voidaan haluta kysyä, mutta kaiken kaikkiaan meidän pitää löytää se meidän kaikista
[03:58] kiinnostaviin muuttuja, millä me tehdään se, millä me halutaan se meidän tutkimuskysymykseen vastata.
[04:04] Okei, nyt meillä on sitten kaikista kiinnostaviin muuttuja olemassa.
[04:11] Tarvitaanko me jotain muita muuttuja kuin se?
[04:14] Joo, ja tästä meidän päämuuttujastakin meidän täytyy tietenkin tunnistaa, minkälainen muuttuja se on.
[04:20] Onko se just tosiaan niin kuin äskeisessä esimerkissä oli aika johonkin, vai onko se numerinen jatkuva muuttuja, vaikka verenpaine,
[04:28] vai onko se sitten kategorinen muuttuja, onko se vaikka paranniko potilas vai ei kuukauden kuluessa, tarvitsiko potilas leikkausta kymmenen ekan päivän aikana jostain antibioottikuuresta vai ei.
[04:39] Nämä on tämmöisiä kyllä ei-kategorisia muuttuja.
[04:43] Eli siitä lähdetään liikkeelle.
[04:44] Sitten me lähdetään siitä meidän tavallaan, kun meidän pitää tuntea myöskin se ympäristö siitä pähämuuttujen ympäriltä,
[04:51] Meidän pitää tietää, mitkä muut asiat voi vaikuttaa siihen muuttujaan.
[04:57] Usein vaikka ikä ja sukupuolikin vaikuttaa jonkun muuttujen käyttäytymiseen.
[05:02] Mutta meidän täytyy miettiä myös kaikki muut taustatekijät, mitkä vaikuttaa.
[05:08] Vaikka syöpätutkimuksissa se syövän vakavuus, eli states, usein vaikuttaa siihen, että mitä siellä sitten tapahtuu.
[05:17] Nyt jos tähän mun tutkimukseen ollaan päätetty se päämuuttuja ja sitten selittäviä muuttujia,
[05:24] niin mitä tästä sitten jatketaan?
[05:27] Esimerkiksi miten paljon sitä dataa mun pitäisi kerätä?
[05:31] Joo, tosi tärkeä pointti.
[05:33] Meidän täytyy aina tutkimukseen laskea se tarvittava otoskoko,
[05:37] jotta voimme riittävällä varmuudella pystyä todistamaan meidän idea todeksi, mikäli se on totta.
[05:45] Me lasketaan tiettyjen kaavojen avulla tarvittava otoskoko meidän tutkimukseen,
[05:50] nimenomaan prospektiivisiin tutkimuksiin lähinnä.
[05:55] Siihen me tarvitaan tietoa aikaisemmista tutkimuksista,
[05:59] esimerkiksi sen muuttujen keskihajonnasta, jos on kysymys numeerisesta muuttujasta.
[06:03] Sitten meidän täytyy myös pohtia se, että mikä ero on kliinisesti merkittävä.
[06:09] Ihan vaikka keskiarvoissa tai sitten, jos me lasketaan tätä potilaan, vaikka paranemisprosenttia verrataan sitä eri ryhmissä,
[06:20] niin mikä siellä on semmoinen, millä olisi kliinistä merkitystä.
[06:27] Nämä retrospektiiviset, eli tavallaan potilaspapereista haettavat tiedot usein rajoittuu siltä,
[06:32] että jos me vaikka tilataan se rekisteri jostakin THL, Kelalta tai jotain,
[06:37] niin sitten me määrätään tai tilataan vaikka 10 vuoden ajalta,
[06:40] niin silloin se data on, mitä on, mutta usein sitä rekisteridataa on niin paljon,
[06:46] eli siinä ei ole se otoskoko usein semmoinen kriittinen asia.
[06:50] Sitä on silloin riittävästi, mutta aina näihin prospektiivisiin tutkimuksiin
[06:54] pitää laskea se otoskokokin.
[06:57] Ja siihen on ihan kaavat ja laskurit, netissä on paljon laskureita olemassa,
[07:01] joita pitää tietenkin sitten vielä varmistaa, että ne käyttää oikeita kaavoja.
[07:06] Okei.
[07:06] No nyt jos otoskokokin on hallussa, niin miten sitten, kun ruvetaan tekemään jotain niitä analyyseja siihen tutkimukseen,
[07:16] käytetäänkö me sitä koko otoskokoa vai pitäisikö jotain havaintoja esimerkiksi jättää pois siitä datasta?
[07:23] Joo, hyvä kysymys tuokin.
[07:27] Esimerkiksi jos me ajatellaan jotain prospektiivista tutkimusta taas, niin silloinhan meiltä kaikilta pitää olla suostumus.
[07:34] Ilman suostumusta me ei saada tietenkään kerätä sitä dataa, ja kuka tahansa tutkimushenkilö voi milloin tahansa lähteä siitä tutkimuksesta pois,
[07:41] ja sen jälkeen sitä dataa me ei sitten yleensä saada ollenkaan.
[07:46] Mutta meillä on paljon, paljon kimuranteja asioita, jos me ajatellaan vaikka lääketutkimusta.
[07:51] Jos me satunnaistamme potilasta saamaan tutkittavaa lääkettä, mutta ennen kuin hän saa
[07:59] ekaaka-pilleriä, niin hän päättääkin, että lopettaa tutkimuksen.
[08:02] Meidän täytyy oikeasti pohtia sitä, että pääseekö analyysiin myös ne, jotka eivät ole
[08:08] yhtäkään tabletteja tai pilleriä nielassut, eli eivät ole saaneet yhtään
[08:11] meidän altistetta tai mahdollisesti parantavaa hoitoa.
[08:17] Tutkimuksessa paljon myös määritellään tutkittaville, että mitä ne saa tehdä, saako ne ottaa muita lääkkeitä vai ei,
[08:23] ja milloin niiden pitäisi tulla takaisin visitille, mittauksille ja näin.
[08:28] Ja ainahan tämä ei mene maailman niinku strömsössä, eli ne syö ihan mitä kiellettyjä lääkkeitä tai tulevat liian myöhässä mittauksia ja muita,
[08:38] niin näitä meidän täytyy miettiä ihan yksi kerrallaan, että onko se silloin semmoista dataa,
[08:45] mikä on käyttökelpoista, mutta yleisesti ottaen me ei koskaan poisteta yhtäkään datahavaintoa,
[08:55] vaan sen takia, että datan arvo ei meitä miellytä, sitä me ei koskaan saada tehdä.
[09:01] Mutta yhtenä esimerkkinä on esimerkiksi, että jos se labranäyte on sulanut,
[09:06] niin silloinhan sieltä tulee todella väärä arvo, niin ei me semmoista voida käyttää.
[09:12] Okei.
[09:13] No, nyt rupeaa ainakin tälleen ajatuksen tasolla olemaan aika selvää, että minkälainen se mun tutkimuksen aineisto pitäisi olla.
[09:21] Niin, mitä nyt sitten, että miten, pitäisikö mun suunnitella jotenkin tehdä vähän jotain tutkimussuunnitelmaa,
[09:29] että miten mä nyt sitten konkreettisesti testaan tällä aineistolla?
[09:32] Juu, juu, tutkimussuunnitelmaa tietenkin tarvii aina tehdä, ja jos sä teet esimerkiksi syväreitä,
[09:39] niin siihenhän kirjoitetaan oikeasti syvärisuunnitelma, ja sit jos me tehdään prospektiivista,
[09:47] kliinistä tutkimusta, niin silloinhan meidän tarvii tehdä oikein todella virallinen tutkimussuunnitelma,
[09:53] joka yleensä kuitatankin, ja sit se lähetetään eettiseen toimikuntaan,
[09:56] Mehän ei saada mitään mittauksia tehdä ihmisistä ilman, että me saadaan esimerkiksi eettisiltä toimenkunnalta tai lääkeviranomaisilta lupaa.
[10:07] Nyt rupeaa kaikki olemaan esivalmistelut aika hyvin valmiina.
[10:15] Seuraavasta varmaan olisi konkreettisesti sen datan kerääminen.
[10:21] Osaisitko sinä antaa vähän neuvoa, mitä siitä pitää ottaa huomioon?
[10:25] Miten se data sitten oikeasti kerätään?
[10:27] Joo, hyvä pointti, koska se sun tutkimuksen laatu on käytännössä katsoen miltein sama kuin sun datan laatu.
[10:34] Jos sun datan laatu on huonoa, niin ei siitä mitään hyvälaatusta tulosta voi tulla.
[10:40] Eli siihen datan laatuun kannattaa todella kiinnittää huomioon.
[10:46] Meillähän on Turun yliopistossa käytössä REDCAP, joka on elektroninen tiedonkeruun lomakesysteemi,
[10:52] jolla voi kerätä mitä tahansa, myös tätä niin sanottua vanhaa potilasdataa, me voidaan syöttää sinne dataa.
[11:00] Me voidaan tehdä sillä kyselytutkimuksia ja totta kai kuinka monimutkaisempia prospektiisia tutkimuksia vaan me voidaan kerätä tämän systeemin järjestelmän avulla.
[11:11] Ja tämän järjestelmään me voidaan laittaa tämmöisiä niin sanottuja validointitarkistuksia.
[11:16] Eli otetaan nyt esimerkiksi se verenpaine, niin me voidaan laittaa sinne tämmöiset minimi ja maksimiarvot,
[11:22] minkä välillä me kuvitellaan, että melkein kaikki verenpaineet on.
[11:26] Jos me syötetään joku arvo sen yli, niin tämä kone rupeaa meille huutamaan, että ootko varma?
[11:34] Eli se säästää meidät näppäilyvirheiltä.
[11:38] Lisäksi tämä on hyvä tietokantaohjelma niin, että siellä on tämä jäljitettävyys, eli jokaikinen sinun klikkaus jää sinne, siitä jää jälki.
[11:47] Eli en suosittele Exceliä käytettäväksi käytännössä katsoen koskaan, koska ehkä Excelissä ei ole tätä.
[11:54] Ja Excelin, muutenkin tavallaan, sinä voit tehdä siellä niin paljon helpommin virheitä nuorena tutkijana,
[12:02] Jos sinulla on numerinen muuttuja, vaikka se verenpaine, niin sinun ei pitäisi kirjoittaa yhden potilaan kohdalle, että puuttuu.
[12:11] Silloin kaikki tilasto-ohjelmat automaattisesti lukevat koko sen muuttujan tekstikentäksi, ja jos sinulla on tekstikenttä, niin siitä ei keskiarvoja lasketa.
[12:19] Joten tämmöisiä onnettomia sattumia tulee sitten nimenomaan Excel-datoista.
[12:25] Mutta taas jos sä teet sen RedCapilla, niin se auttaa sua, että siitä datasta tulee paljon parempi laatuista.
[12:33] Ja jos data on parempi laatuista, niin tilastolliset analyysit, aah, ne on helpompi tehdä.
[12:38] Ja tietenkin ne on sitten oikeimmat tulokset, koska data on parempi laatuista.
[12:45] Pysähdytään hetkeksi vielä miettimään tutkimussuunnitelmaa.
[12:49] Mitä siihen suunnitelmaan oikein pitäisikö kirjoittaa?
[12:53] No jos me ajatellaan tutkimussuunnitelman tärkeimpiä kappaleita esimerkiksi,
[12:59] niin sehän aloitetaan aina introlla, eli johdanto-osalla,
[13:04] ja siihen me kootaan oikeasti mitä tästä alueesta aikaisemmin jo tiedetään,
[13:11] minkälaista tutkimusta on tehty, ja sitä siihen sitten tiivistetään.
[13:16] Joko sen kappaleen loppuun tai ihan erikseen on semmoinen kappale kuin tutkimuksen tarkoitus, the aim of the study.
[13:23] Ja siinä nimenomaan sitten kirjoitetaan, että mitä mä oikeasti, mihin kysymykseen mä haluan vastata, mitä mä haluan tällä tutkimuksella saavuttaa.
[13:33] Sen jälkeen me kerrotaan kaikki kerättävät muuttujat ja niiden tavallaan mittausmenetelmät.
[13:41] Onko ne jotain kyselybattereista, mistä me kysytään, päivän väsymystä, elämänlaatua, vai onko ne ihan mittauksia niin kuin hemoglobiini.
[13:51] Sitten me esitetään myös, joka tutkimussuunnitelmassa pitää olla se otoskoon määritelmä ja myöskin se vähän niin kuin se kaava esitettynä,
[14:00] eli joku, joka sitä katsoo sitä tutkimussuunnitelmaa, pystyisi jopa toistamaan sen niillä numeroilla.
[14:06] Ja sen lisäksi me tarvitaan se statistinen ja datasuunnitelma sinne.
[14:12] Ja jos on oikein hyvä, niin kannattaa miettiä jo niitä tulevia taulukoita sun raporttiin tai julkaisuun,
[14:20] jotta sä varmistat sen, että kaikki ne tarvittavat muut tuet tulee sitten kerättyä,
[14:26] koska sitten jälkeenpäin niitä ei sitten mistään saa.
[14:29] Lisäksi tutkimussuunnitelmassa on tietenkin muitakin kappaleita,
[14:35] Esimerkiksi eettisyydestä puhutaan ja niin poispäin.
[14:38] Okei.
[14:39] No, nyt mä uskon tietäväni, miten mä saan mun oman tutkimuksen alkuun.
[14:45] Otetaanpas teillekin tässä lopuksi vielä tiivistelmänä.
[14:51] Eli, ensimmäisenä sun pitäisi kasata itsellesi tiimi.
[14:55] Tämän jälkeen tehdä tutkimussuunnitelma huolellisesti,
[14:59] jossa mietitään huolellisesti ja täsmällisesti tutkimuskysymys, tarvittava data, datan keräys sekä analyysisuunnitelma.
[15:10] Tämän jälkeen sitten pitäisi kerätä se data, tämän jälkeen analysoida se data suunnitelman mukaisesti ja vielä lopuksi raportoida tulokset.
[15:20] Mutta tulosten raportointi on sen verran iso aihe, että siitä ei kyllä sitten puhuta tässä jaksossa sen enempää.
[15:27] Ja loppuun muistakaa, tutkimuksen laadun varmistaa hyvä data.
[15:33] Hei, kiitos sulle Elisa.
[15:34] Kiitos.
[15:35] Ja kiitos sinulle kuuntelija.
[15:37] Toivottavasti tämä jakso selvensi sulle vähän, kuinka suunnitella sun ensimmäinen tutkimuksesi.
[15:42] Kuullaan taas statistiikan aloilla.
[15:55] Tämän podcastin on tuottanut Turun yliopiston lääketieteellisen tiedekunnan biostatistiikan yksikkö.

Biostatistiikan rooli tutkijan uralla – Vieraana kirurgian professori Paulina Salminen

Tässä Statistiikan aallossa kirurgian professori Paulina Salminen kertoo tutkijan urastaan ja korostaa biostatistiikan keskeistä roolia laadukkaassa tutkimuksessa aina suunnittelusta alkaen. Kuule, miksi biostatistiikan osaaminen ja moniammatillinen yhteistyö on välttämätöntä. Jakso sisältää myös tärkeän viestin tilastotieteilijöille: kliininen ymmärrys ja kyky keskustella sujuvasti kliinikoiden kanssa on tärkeä osa ammattitaitoa. Tämä jakso on suunnattu erityisesti lääketieteen, bio- ja hammaslääketieteen opiskelijoille sekä tutkijoille.



[Speaker 1]

[00:03] No niin, tervetuloa takaisin statistiikan aalloille.
[00:10] Minä olen biostatistikko Markus Riskumäki ja tällä kertaa meillä on vieraana ihan ihka oikea lääkäri, professori ja tutkija Pauliina Salminen, tervetuloa.
[00:15] Kiitos paljon.

[Speaker 2]

[00:20] Miten sä sait idean opiskella lääkäriksi?
[00:20] Aloitetaanpas ihan alusta.

[Speaker 1]

[00:23] Todella alusta siis.

[Speaker 2]

[00:26] Todella alusta siis.
[00:29] Mä sain idean opiskella lääkäriksi oikeastaan vasta ihan lukion loppuvaiheessa, joka tarkoittaa sitä, että silloin, kun siitä on muutama vuosi aikaa, kun olen hakenut lääketieteellisen tiedekuntaan,
[00:44] niin käytännössä mulla oli todella surkeat aineet lukiossa, mulla oli neljä kieltä ja lyhyt matematiikka, ei lainkaan kemiaa tai fysiikkaa.
[00:52] Ehdin ottaa yhden kemian lisäkurssin siinä kohtaa, kun ymmärsin, että ehkä haluankin hakea lääkikseen.
[00:59] Fysiikkaa en lukenut ollenkaan.
[01:02] Fysiikkaa suoritin kirjoitusten jälkeen iltalukiossa.
[01:09] Tein opettajansijaisuuksia päivällä ja menin iltalukiossa lukemaan fysiikkaa.
[01:12] Sen jälkeen tein ravintolatöitä illalla ja suoritin laajan fysiikan siinä.
[01:18] Sitten mä hain lääkikseen, mutta onneksi siinä kohtaa oli pääsyukeissa vielä niin, että fysiikasta oli neljä ainetta, oli aineisto, kemia ja fysiikka ja sitten ihmisen fysiologia ja anatomia ja huonoin niistä tiputettiin pois, mutta kaikista piti päästä läpi.
[01:33] Mä onneksi pääsin läpi siitä laajasta fysiikasta, mutta se oli niistä se heikoin, mutta jotenkin mulla tuli sitten yhtäkkiä siinä lukion lopussa sellainen olo, että ehkä musta tulee lääkäri.
[01:44] ihan varmaan vielä ollut, kun samaan aikaan, kun mä pääsin sitten lopulta sisällön lääkikseen,
[01:49] niin mä hain myöskin lukemaan englantilaista filologiaa, kun mä aina ajattelin, että musta tulee kieltenopettaja.
[01:55] Ja mä pääsinkin myös sisälle sinne, ja sitten mulla oli vielä semmoinen illuusio, että mä ajattelin, että mä teen ne molemmat.
[02:02] Mutta sitten mä kävin siellä humanistisen tiedekunnan puolelle ja totesin, että tämä ei ehkä kuitenkaan ole se mun juttu.
[02:10] jätin ja annoin sen paikan pois, joka sinänsä hauska tarina, sen sai yks mun kurssikaverini vaimoilta.

[Speaker 1]

[02:17] Okei, no sit kun sä pääsit sinne lääkikseen, niin missä vaiheessa opintoja sulle tuli ajatus, että nyt vois ihan väitöskirjaankin tästä kirjoittaa?

[Speaker 2]

[02:26] Tota, no se tuli kyllä oikeastaan vasta ehkä siinä opintojen loppuvaiheessa, että mulla ei oo siis suvussa yhtään lääkäriä, joka on aika niin kuin tyylensä hän menee vähän niin kuin perheittäin.
[02:39] Se mikä kyllä kristallisoitui oikeastaan siinä opiskelujen aikana oli jo se, että luulen, että kirurgia on se minun juttu.
[02:48] Se oli kyllä aika selkeästi.
[02:51] Muut oli aika helppo pois sulkudiagnostiikalla ja itse asiassa olin kyllä vahvasti sitä mieltä opiskelun loppuvaiheessa,
[02:58] että ilman muuta siirryn tai rupean herkostumaan kirurgiaan.
[03:02] Ja mä en itse asiassa valmistumisen jälkeen tehnyt mitään muuta kuin kirurgiaa, koska siinäkin oli tämmöinen pieni porsaareikä.
[03:08] Että mulla on vanhanmuotoinen kirurgian erikoislääkärin tutkinto ja uudenmuotoinen asetuksen gastroenterologisen kirurgian tutkinto.
[03:15] Mutta sit se oli tosiaan niin, että ei tarvinnut enää käydä terveyskeskuksessa sen jälkeen, kun oli yksi erikoislääkärin tutkinto.
[03:22] Joten mä en sit edes mennyt terveyskeskukseen valmistumisen jälkeen.
[03:26] Toki tein opiskelun loppuvaiheessa terveyskeskuksessa sijaisuuksia.
[03:30] mutta se tutkimus tuli mukaan siinä oikeastaan aika pian, että ajattelin nimenomaan, että rupean tekemään väitöskirjaa.
[03:39] Haluan tehdä yliopistosairaalassa varmaankin töitä.
[03:43] Aloitin itse asiassa väitöskirjan, jossa olisi ollut perustiedettä mukana,
[03:51] eli vähän mikroskopointia ja muuta, ja me tehtiin siitä itse asiassa kolme julkaisua,
[03:55] mutta sitten mä totesin, että ei kyllä.
[03:57] Mä rupean tekemään varmaan kliinistä väitöskirjaa.
[03:59] Mä tein ensimmäiseksi semmoisen osa-väitöskirjan, sitten mä vaihdoin aihetta,
[04:04] ja rupesin tekemään refluksitaudin kirurgisesta hoidosta.

[Speaker 1]

[04:08] Okei.
[04:08] Millaiset ohjaajat sulla oli väitöskirjaa tehdessä?

[Speaker 2]

[04:12] No itse asiassa väitöskirjan kliininen aihe tuli siitä, että nyt jo eläkkeellä oleva yksi,
[04:18] ehdottomasti eniten minulle laparoskopiaa, eli tähystyskirurgiaa opettanut kollega Jari Ovaska oli silloin ihan pioneera
[04:28] laparoskooppisessa kirugiassa Suomessa ja hän oli tehnyt silloin aikaisemmin tämmöisen avointa ja tähystyskirurgista
[04:34] leikkausta vertailevan sarjan, joka oli semmoinen mihin tarvittiin tutkia ja se osui sopivasti siihen, että olin tulossa
[04:40] tulossa tavallaan siihen töihin ja mä jotenkin itse näin itseli selkeästi enemmän semmosessa tutkimuksessa,
[04:47] minkä tuloksia voisi oikeastaan soveltaa suoraan siihen potilashoitoon.
[04:52] Ja se oli se, että Jari oli tosiaan mulla väitöskirjaohjaajana sitten siinä.

[Speaker 1]

[04:59] Okei.
[04:59] No jos sä pitäis sanoa yksi asia, mikä väitöskirjan tekeminen sulle opetti näin myöhempään uraa-aatelle,
[05:05] niin mikä se voisi olla?

[Speaker 2]

[05:08] Se, että kannattaa opetella, miten tutkimus tehdään ennen kuin aloittaa sen tekemisen.
[05:13] Tietysti sanotaan, että silloin kun on esimerkiksi juurikin tämä pitkäaikaisseuranta, mikä siinä väitöskirjassa on,
[05:21] niin se on ehdottomasti hienoa, mutta jos nyt me ajatellaan, millaista tutkimusta on tehty 80 ja 90-luvulla verrattuna siihen,
[05:29] että mitä se on.
[05:30] Tutkimuksen metodologia ja kaikki, mikä siihen liittyy, on aivan eri tasolla tällä hetkellä.
[05:39] Väitöskirjan tekeminen ehkä opetti minulle sen, että kun väistämättä tuli luettua, niin aloitin miettimään, että ei hetkinen.
[05:46] Tämä todennäköisesti pitäisikin tehdä näin ja näin.
[05:50] Jotenkin se herätti ajatuksen siitä, että metodiikka on tietysti olennainen osa tätä, mitä me tehdään.

[Speaker 1]

[05:59] Mitäs väitöskirjan jälkeen?
[06:01] Menitkö ulkomaille postdoc-kaileen, minne?

[Speaker 2]

[06:06] En itse asiassa mennyt ikinä missään vaiheessa ulkomaille postdoc-tutkijaksi.
[06:13] Nykyään tietysti kierron ympäri maailmaa ehkä keskimäärin 50-60 päivää vuodessa luennoimassa.
[06:19] Mutta mä en ikinä sitten loppujen lopuksi mennyt.
[06:22] Se osui jotenkin sellaiseen kohtaan tavallaan samanaikaisesti, kun mä tein sitä tutkimusta.
[06:28] Sitten oli oikeastaan hirveän täydellinen kohta siihen, että mä pääsin tekemään sellaista kliinistä työtä, mitä mä halusin.
[06:35] Sitä kautta me päästiin jatkamaan sitä meidän tutkimusta myöskin ja mä jatkoin sitä kliinisen tutkimuksen tekemistä ja rupesin tekemään näitä omia isoja juttuja.
[06:46] Toki silloin lapset olivat tietysti myöskin pieniä, että se olisi tarkoittanut aika isoa muutosta.
[06:52] Jotenkin se kattaus oli sellainen, että pääsin hyvin tekemään täällä.
[06:59] Sitä tarvetta ei ehkä ihan sellaisenaan syntynyt, mutta jatkoin kyllä tutkimuksen tekemistä oikeastaan siinä suoraan.
[07:06] Muistan yhden kerran, kun ohjaajani sanoi, se oli muutama päivä ennen väitöstä,
[07:11] kun mä sanoin, että mä olin keksinyt yhden seuraavan aiheen, että mitä me seuraavaksi voidaan tutkia.
[07:17] Hän sanoi, että ymmärräksi, että sulla on väitös kahden päivän päästä.
[07:20] Mä sanoin, että joo, mutta mulla tuli tämmönen mieleen, että sen jälkeen katsotaan tästä samasta aineistosta tämä ja tämä asia.
[07:28] Kyllä mä jotenkin siitä jatkoin, se oli mun mielestä semmoinen varmaan mun juttu, tai koin omakseni heti.

[Speaker 1]

[07:38] Tämmöinen kysymys, mikä varmasti meidän varsinkin tutkija-opiskelijakuulijoita voisi kiinnostaa.
[07:45] Kun sä aloitit tämän tutkimustyön tekemisen valmistumisen jälkeen tosissaan,
[07:51] niin oliko helppo saada aluksi rahoitusta?
[07:55] Mitä sun mielestä olisi parhaat vinkit tutkimuksen rahoituksen saamiseen?

[Speaker 2]

[08:02] Voi että kun mulla olisikin joku viisasten kivi tähän.
[08:05] Tämän vastaus on se, että vasta aika myöhäisellä vaiheessa tutkijauraa käytännössä on helpompi hiukan saada rahoitusta.
[08:16] Se on selvää, että semmoisen aloittelevan tutkijan rahoituksen saaminen on kyllä ihan todella kiven takana, kun se on kokenenkin tutkijan.
[08:24] Elikkä mä sanoisin, että ehkä se mun neuvo siihen innokkaille tutkijoille on se, että sun täytyy etsiä se vähän vanhempi, hyvä tutkija ja hyvä tutkimusryhmä, mihin sä pääset mukaan.
[08:36] Ja silloin tavallaan se on ehdottomasti win-win, että kaikki tekee niinku, ne meidän nuoret tutkijat tekee paljon töitä, mutta silloin vastaavasti musta se on mahtavaa, että nyt mä pystyn auttamaan heitä.
[08:46] ettei tarvitse tehdä ihan kaikkea selkänä hastaa lähtien, eikä tarvitse kantapään kautta opetella jokaista samaa virhettä.
[08:54] Eli sehän siinä on ehkä se ajatus, mikä mielestäni on tosi tärkeä tutkijoille, että meillä olisi tutkijakoulutus.
[09:02] Että oikeasti mentoroidaan näitä nuoria sen sijaan, että jos ajattelen kaikki ne virheet, mitä olen tutkimuksissa tehnyt,
[09:12] niin ne olisi tietysti iso osa ollut ohitettavissa sillä, että siinä olisi ollut joku kertomassa, että miten se kannattaa tehdä.
[09:18] Mutta toki siinä vaiheessa Suomessa ei kauheasti edes ollut tehty niin kuin kliinisiä, satunnaistettuja tutkimuksia.
[09:24] Tämä on vähän niin kuin semmoinen ollut meidän oma oppipolku, ja nyt tietysti niin kuin...
[09:29] Onneksi tällä hetkellä meillä on kohtalainen rahoitus, mutta sitä tietysti niin kuin tutkimusrahoitusta ei missään nimessä ole liikaa.
[09:36] ja se surullinen tilanne on se, että se on melkein aina se, mistä ensimmäisenä säästetään.
[09:41] Vaikkakin jos me ajatellaan, että mitä oikeasti me saadaan terveydenhuollossa säästöjä,
[09:46] niin ne asiat perustuvat tutkittuun tietoon, eikä mihinkään muuhun.
[09:50] Eli eteenpäin me ei päästä lääketieteessä, jos meillä ei ole mahdollisuutta tehdä tutkimusta.

[Speaker 1]

[09:57] Tutkimuksesta puheen ollen.
[09:58] Sulla on nyt tällä hetkellä kaksi tämmöistä suurempaa tutkimuslinjaa,
[10:02] lihavuusleikkaukset ja umpilisäkkeen tulehdukset.
[10:04] Haluaisitko lyhyesti avata niitä, ennen kuin jatketaan?

[Speaker 2]

[10:09] Voin avata ehkä lihavuuden osalta.
[10:13] Vaikean lihavuuden kirukinen hoito on Suomessa käynnistetty 20 vuotta sitten.
[10:17] Olen ollut mukana silloin alusta lähtien.
[10:21] Tällä hetkellä se on se, minkä pohjalta kierrän eniten maailmassa.
[10:26] Olen tällä hetkellä mukana myös maailman lihavuuskiruukisen järjestön hallituksessa.
[10:30] joka on sellainen 10-15 000 ihmisen järjestö.
[10:35] Tämä lihavuusepidemiahan on ihan tasaisesti edelleen valitettavasti kasvava yksi maailman suurimmista terveysongelmista tällä hetkellä,
[10:45] ja sitä kokonaisuutta me ei voida leikkaamalla hoitaa, mutta siihen pieneen potilasryhmään tämä vaikean lihavuuden kirurgian hoito on aivan olennaisen tärkeää ja erittäin kustannustehokasta ja vaikuttavaa.
[10:59] ja sitä me ollaan tutkittu vertailemalla itse asiassa kahta yleisintä leikkausta ja me aloitettiin se heti silloin oikeastaan aika lailla mun väitöksen jälkeen.
[11:07] Se on mun ensimmäinen satunnaistettu tutkimukseni ja sen pohjalta ollaan opittu monta asiaa mitä me tehtäisiin ehkä
[11:14] ja tehtiin kinssit jo seuraavissa tutkimuksissa eri tavalla ja silti se on oikeasti niin kun pitkäaikaisseurantana erittäin hyvä 10 vuoden seuranta julkaistiin juuri viime kesänä.
[11:25] Umpilisääketulehduksen osalta tämä on selkeästi vielä ehkä enemmän semmoinen kontroversiallinen aihe.
[11:31] Jotenkin kliinisesti me tiedettiin, että läheskään kaikkia lieviä umpilisääketulehduspotilaita ei välttämättä tarvitse leikata,
[11:39] mutta se on ollut vähän semmoinen kivenhakattu totuus yli 130 vuotta lääketieteessä.
[11:46] Ja me oikeastaan haluttiin selvittää, että onko se näin.
[11:50] Mitä tavallaan tapahtuu sille lievemmälle umpilisäketulehdukselle.
[11:54] Ja sillä samalla tiellä ollaan.
[11:56] Mitä enemmän me tutkitaan, sitä enemmän me keksitään uusia kysymyksiä.
[11:59] Mutta nyt ollaan jo neljännessä satunaista tuossa tutkimuksessa tällä hetkellä.

[Speaker 1]

[12:04] Joo, joo.
[12:05] Tuo onkin varmasti tutkimusrypäs, joka meidän kuulijoidenkin kiinnostaa.
[12:11] Eli nämä umpilisäkeentulehdustutkimukset.
[12:14] niin sehän on aika villi tämä tutkimusidea, niin miten ja kuka sai alunperin idean,
[12:19] tämän idean, ettei komplisoitumatonta eli lievää ompilisäkkeentulehdusta tarvisikaan leikata välttämättä?

[Speaker 2]

[12:26] No kyllä se on itse asiassa, kauhean mielellään sanotaan, että me keksittiin se, mutta se ei suinkaan pidä paikkaansa,
[12:32] vaan se itse asiassa, niin kuin tiedettiin, tämä on hyvä katsoa muutenkin lääketieteen historiaan,
[12:38] Meillähän on paljon sellaisia totuuksia, jotka perustuvat oikeasti ei mihinkään tutkittuun tietoon, vaan tällaiseen eminence-based,
[12:47] ei evidence-based, eli ihan kokemukseen.
[12:49] Ei niin, että joku olisi oikeasti tarkoilla tieteellisillä menetelmillä arvioinut jotakin.
[12:55] Tämä on yksi hyvä sellainen esimerkki.
[12:58] Se lähtee se ajatus jo siitä, että itse asiassa tiedettiin ennen appendikektomia-aikaa,
[13:05] että potilailla obduktiotutkimuksessa nähtiin merkkejä aikaisemmista tulehduksista.
[13:11] Eli se mahdollinen ajatus siitä, että se paranee itsestään, on oikeasti jo 1800-luvun ihan lopulta.
[13:17] Mutta sitten tavallaan ennen antibioottiaikaa, niin se on ihan selvää, että leikkaushoito pelasti ihmishenkiä.
[13:22] Ja siinä jotenkin ehkä kääntyi se ajatus siihen, että ajateltiin, että se aina päätyy siihen,
[13:29] että pisteestä A pisteeseen B niin, että kun se alkaa tulehtua, se puhkee lopulta, ja se jotenkin iskostui myös maallikoiden mieleen.
[13:38] Mutta kyllä me kliinisessä käytännössä tiedettiin, että näin ei ole.
[13:43] 50-60-luvulta on muutama isokin potilassarja, jotka on käytännössä vajennettu aika kuoliaksi,
[13:48] eli oikeasti konservatiivisesti hoidettuja, juurikin näitä konservatiivisesti ilmanleikkausta hoidettuja umpilisäketulehduksia.
[13:56] Ja sitten me todettiin, että tämä on kyllä semmoinen asia, että on pakko selvittää, että onko sitä oikeasti näin.
[14:03] Ja toisaalta mielestäni meillä ei ollut kenelläkään semmoinen ajatus, että me oltaisiin...
[14:07] Tämä mun tutkimusryhmä koostuu pitkälti kirugeista, niin kenelläkään ei oikeastaan ollut semmoinen ajatus,
[14:13] että olisi pakko saada joku tulos, että me halutaan nyt ehdottomasti osoittaa, että ei tarvi leikata tai tarvii leikata,
[14:20] vaan me haluttiin vaan oikeasti nähdä, että miten tässä käy.
[14:22] Minulla olisi ollut periaatteessa ihan samaa, että mikä se tulos olisi ollut, mutta se on ihan selvä, että se on sen tutkimisen väärtti.
[14:28] Jotenkin se, miksi me haluttiin tutkia, joku aina kysyi, että miksi kirurgit tutkivat sitä, että ei leikata, niin kyllä minä sanoisin, että se on minusta meidän sellainen myöskin yleinen vastuu siitä asiasta,
[14:39] että meidän täytyy tehdä vaikuttavia hoitoja, koska meidän terveydenhuollon rahat ovat tietysti rajalliset.
[14:46] Eli meidän täytyy oikeasti keskittää ne hoidot sellaisiin asioihin,
[14:50] mistä me saadaan sitten todellista hyötyä potilaille.

[Speaker 1]

[14:54] Joo.
[14:55] Sä mainitsit tästä, että toi on vähän niin kuin vuosikymmenien saatossa
[15:00] iskostunut kauhean tiukasti toi idea,
[15:02] että aina pitää umpilisäkkeen tulehdus leikata.
[15:06] Niin sitten kun te halusitte kumminkin lähteä tätä niin kuin oikein tieteellisesti tutkimaan,
[15:12] Niin oliko tähän ekaan umpilisäketulehdustutkimukseen vaikea saada rahoitusta sitten?
[15:17] Lähtikö porukka mukaan tähän?

[Speaker 2]

[15:18] Se on hauskaa, että se kysyt, että tässä on kaksi eri asiaa.
[15:21] Kohta A, oliko vaikea saada rahoitusta?
[15:24] Todella vaikea, koska meillä ei ollut mitään rahoitusta.
[15:26] Tässä on hyvä tarina, oli se, että yhdysvaltalaiskollega, joka kanssa paljon tein yhteistyötä,
[15:31] ja on tehnyt ison appedisiittitutkimuksen itse, niin hän kysyi,
[15:37] että millainen infrastruktuuri meillä oli siihen ensimmäiseen tutkimukseen?
[15:41] että ihan se, mikä siinä lukee artikkelissa, että me voidaan kaikki nimetä ne meidän infrastruktuurit.
[15:46] Että ihan oikeasti se on tehty kyllä meidän tutkijoiden selkänahdasta, että mulla ei ollut mitään rahoitusta siihen ensimmäiseen.
[15:53] Että ihan yksittäisiä, mitä sitten saatiin tutkimusvapaisiin, mutta mitään isompaa rahoitusta ei ollut siihen.
[16:02] Ja jotenkin ehkä se, että miten porukat lähtivät mukaan, niin se oli kyllä aika hankalaa.
[16:08] Se ensimmäinen tutkimus oli sellainen, että selkeästi tuli vähän semmoinen olo, että saatte olla ehkä tahoja, jotka ajattelivat, että minkä ihmeen takia te tutkitte tällaista asiaa, että aivan älytöntä, että eikö se nyt ole ihan selvä ja tämä on se tavallisin leikkaus, mitä tehdään ja selkeästi se herätti sellaista vastustusta.
[16:28] mikä minusta oli ehkä jopa hiukan yllättävää, mutta tosi positiivista oli se, että tämä ei tullut kyllä potilaiden osalta.
[16:35] Potilaat on tavallaan jotenkin Suomessa, se on yksi hyvä asia Suomessa on ehdottomasti se, että meillä on niin hyvä tämä tutkimuslupajärjestelmä ja tämä koko terveydenhuoltojärjestelmä.
[16:46] Eli potilaat luottaa kyllä siihen ja niiden kuuluukin saada luottaa, koska he on todella tarkkaan katsottu.
[16:53] Eli potilaat kyllä tosi innokkaasti lähtevät mukaan ja suomalaiset arvostavat tavallaan tieteen tekemistä ja kokevat tärkeäksi, että he voivat olla mukana auttamassa sitä.
[17:02] Se ei ollut oikeastaan se ongelma, että potilaat eivät olisi ollut innostuneita lähtemään mukaan ollenkaan, mutta sanotaan, että ehkä vähän niin kuin sen,
[17:10] että jos me verrataan, että meillä on tällä hetkellä menossa, alkaa sitten keväällä niin APAC 4, niin kyllä kakkonen ja kolmonen oli jo helpompia kuin ykkönen.
[17:20] Jopa kirurgien vastustus hiukan alkaa mennä pois, kun nyt me tiedetään oikeasti, että iso osa niistä voidaan hoitaa.
[17:28] Se sama resurssi voidaan käyttää johonkin muuhun hoitoon, koska niin kuin sanottu, ne resurssit on rajalliset.
[17:36] Pikku hiljaa.
[17:37] Keskimäärin on arvioitu, että vakiintuneiden hoitokäytäntöjen muuttaminen vie noin 17 vuotta.
[17:42] Meillä on siitä vähän vielä matkaa, mutta lähestytään sitä.

[Speaker 1]

[17:48] Mainitsit jo tuossa jossain vaiheessa, että enimmäkseen sun tutkimustiimi koostuu kirurgeista, niin ketäs muita sun tutkimustiimiin kuuluu?

[Speaker 2]

[17:58] No mun tutkimustiimiin kuuluu aivan kriittisenä osana.
[18:02] Pitkään mun kanssa töitä tehnyt biostatistikko, hurmeen saijoilta ilman, mä en missään nimessä tule toimimaan.
[18:09] Mä sanon, että hän voi tehdä ihan mitä tahansa muuta, mutta hän ei voi koskaan lopettaa mun tutkimusryhmässä olemista.
[18:16] Se on aivan olennainen osa ja se liittyy siihen, mistä sanoin alussa, eli tavallaan se ymmärrys siitä, että mikä se tieteellinen metodologia on,
[18:26] niin se on ainoa mahdollisuus, miten tehdä järkevä kliininen tutkimus, koska se hulluin tilanne on se, että me nähdään aivan jäätävä vaiva jonkun kliinisen,
[18:35] satunnaistutun tutkimuksen tekemiseen, mutta me ollaan valmiiksi osahdettu oma oksa poikki niin, että me tehdään se metodologisesti väärin,
[18:42] väärin tai meillä ei ole riittävän hyvää biostatistista pohjaa siihen, niin silloin kaikki se vaiva, mitä siihen on nähty,
[18:50] käytännössä menee hukkaan, jos meillä on tutkimus, joka on rakennettu suunnitelmaltaan sellaisella setelmalla,
[18:56] että me ei oikeasti voida sanoa siihen yhtään mitään.
[18:59] Niinpä niin.
[18:59] Eli biostatistiikka on aivan olennainen ja se pitää olla nimenomaan sieltä alusta lähtien, ei missään nimessä siinä kohtaa,
[19:07] kun me saadaan tulokset, siinä kohtaa me ollaan liian myöhässä, eli se pitää ehdottomasti olla sieltä alusta lähtien.
[19:13] Ja se mikä siinä ehkä nyt varsinkin tietysti kun Saija on ollut mun kanssa 15 vuotta, varmaan mahtaakin ihan riittääkään,
[19:22] niin siinä on jo sellainen, että se keskustelu, koska rehellisesti sanon esimerkiksi biostatistiikan osalta,
[19:28] niin välillä on se, että biostatistiikkojen aivot toimii eri tavalla kuin muiden ihmisten aivot.
[19:35] Siinä on semmoinen, että löydetään semmoinen hyvä balanssi siihen, että mikä on tavallaan oikeasti mahdollista tilastotieteellisesti ja sitä ajatellaan kliinisesti.
[19:45] Niin semmoiseen on kyllä painonsaarvoinen kulta semmoinen statistikko, joka ymmärtää myös kliinisten tutkimusten tekemisestä.
[19:52] Se on todella olennainen, ja se on ehkä semmoinen, mitä olen sanonut myös sekä syventävien opiskelijoille että väitöskirjatutkijoille,
[20:01] on se, että sen biostatistiikan ymmärtämis on semmoinen, mitä valitettavasti opetetaan aivan liian vähän lääkiksessä.
[20:07] Eli meidän pitäisi saada lääkäreitä, jotka osaavat esimerkiksi nykyinformaatiotulvassa, niin sä pystyt lukemaan tutkimuksista,
[20:16] että näet aika suoraan heti, että onko tämä oikeasti millään tavalla validita tutkimusta, nämä johtopäätökset, mitä siitä voidaan tehdä,
[20:24] koska sitä sinä et voi tehdä millään muulla kuin se, että tietysti sinun täytyy katsoa, että onko se kliininen asetelma järkevä,
[20:29] mutta myöskin se, että onko se tutkittu sillä tavoin.
[20:32] Sen lisäksi meidän tutkimusryhmässä nykyään on, itse asiassa meillä on oikeastaan vähän kaikkien erikoisalojen ja näiden alatutkimusten erityisosaajia.
[20:44] ja mikrobiologian osalta meillä on mikrobiologit, immunologian osalta immunologit ja infektiolääkärit ja niin edelleen.
[20:51] Eli meillä on myöskin aika laaja tämä translationaalinen osuus ja se on minusta nimenomaan ehkä se rikkaus.
[20:57] Eli jokainen tuo siihen ryhmään sen oman osaamisensa ja sitten kun me yhdistetään ne, niin se yksi plus yksi on selvästi enemmän kuin kaksi.
[21:05] Tämä sama logiikka on mielestäni siinä, että me tehdään kansallisia tutkimuksia, koska Suomi on niin pieni maa,
[21:10] että jos jokainen tekee itsenään jotakin, niin se ei missään nimessä riitä.
[21:14] Me ei saada riittävästi potilaita, sillä ei ole riittävää tilastovoimaa.
[21:18] Mutta sitten, kun me laitetaankin kaikki Suomen sairaalat tai iso osa yhteen,
[21:22] niin me päästäänkin siihen, että me ollaan kansainvälistä kärkeä siinä tutkimuksessa.
[21:26] Eli tämä tavallaan, että me tehdään yhdessä samaa asiaa eteenpäin,
[21:30] tuo ihan hirveästi enemmän voitettavaa kaikille.

[Speaker 1]

[21:35] Joo.
[21:35] Mainitsit, että biostatistikon on elintärkeää olla mukana siinä tutkimustiimissä,
[21:40] ihan alusta lähtien, ei pelkästään siinä analyysivaiheessa.
[21:45] Pystyisitkö avaamaan vielä meidän kuuntelijoille,
[21:48] mitä kaikkea biostatistikko tekee tutkimustiimissä?

[Speaker 2]

[21:52] Rooli on kyllä aivan kriittinen.
[21:55] Jos ajatellaan, että me tehdään tietysti se paras mahdollinen näytön aste,
[22:01] me saadaan satunnaistetuista tutkimuksista.
[22:03] Se on tavallaan se, mitä me tehdään tässä mun molemmissa tutkimusryhmissä.
[22:08] ja se isoin fokus on siinä.
[22:10] Ja se lähtee kyllä jo lähtökohtaisesti se, että mitä me pystytään sillä tutkimuksella ikinä sanomaan,
[22:17] ja ne johtopäätökset, ne perustuu täysin siihen, miten se tutkimus on suunniteltu.
[22:21] Eli meidän täytyy olla tietysti se,
[22:24] ja tämä on nimenomaan yhteistyötä ihan kokonaan tämä muutenkin, eli se on se, millä me saadaan se paras tulos kliinisenä tutkijana,
[22:33] joka siinäkin on tärkeä myös huomioida, että meillä esimerkiksi ne, ketkä tekee kliinistä työtä, sitten sä teet saman aikaan tutkimustyötä, niin sä teet käytännössä kahta työtä,
[22:42] mutta jos meillä ei ole semmoisia tutkimusrahoitusta ja mahdollisuutta, niin meidän kliininen tutkimus loppuu, koska ainoastaan kliinistä työtä tekevät ihmiset oikeasti osaa kysyä ne asianmukaiset kysymykset.
[22:54] Eli se kliininen tutkija tekee sen kysymyksen asettelun ja sen jälkeen istutaan statistiikassa alas ja ruvetaan miettimään,
[23:01] että miten ihmeessä tätä voidaan katsoa, että mikä olisi paras mahdollinen tutkimusmalli ja asetelma siihen.
[23:08] Ja sen jälkeen kun päästään siihen, että meillä on oikeasti selkeä tutkimuskysymys, mihin me halutaan vastaus,
[23:15] ja on päädytty yhdessä siihen, että mikä se tutkimuksen suunnitelma on,
[23:19] missä mallissa tehdäänkö me non-inferioriteettitutkimusta vai superioriteettitutkimusta, niin sen jälkeen sitten ruvetaan katsomaan
[23:26] statistikon kanssa sitä, että kuinka paljon me oikeasti tarvitaan potilaita, jotta meillä on mitään mahdollisuuksia vastata
[23:34] tähän kysymykseen.
[23:35] Se on joskus murheellista, kun arvioi joskus muita artikkeleita, niin katsoo jo lähtökohtaisesti,
[23:42] Tämä on lähtökohtaisesti täysin alimitotettu, jolloin tietysti se, niin kuin sanoin, että se hölmöin tilanne on se, että nähdään se kauhean vaiva kliinisen tutkimuksen tekemiseen,
[23:52] joka on jo lähtökohtaisesti ei sovellu se suunnitelma siihen.
[23:57] Eli silloin me ei oikeasti voida tehdä niitä johtopäätöksiä, mitä me on ajateltu, että siitä pystyisi tekemään.
[24:03] että sen takia statistikko on ihan kriittisen tärkeä siinä, että me ollaan jo suunniteltu kokonaan sen tutkimuksen kaikki arvioitavat päätemuuttujat.
[24:15] Me on tehty voimalaskelma sen ensisijaisen päätemuuttujan osalta niin, että me oikeasti voidaan sanoa siihen jotain.
[24:22] Me on päätetty kaikki muut asiat, mitä me katsotaan, tehty alustava analyysisuunnitelma, jolloin meillä on oikeasti semmoinen tutkimus,
[24:31] niin me voidaan sanoa jotakin, eli ne johtopäätökset on valideja, jos me päästään siihen riittävään potilasmäärään.
[24:38] Silloin se myöskin kertoo sen, että jos me nähdään, että tämä voimalaskelma kertoo, että me tarvitaan 2000 potilasta
[24:44] ja meidän reaalinen mahdollisuus on saada 200 potilasta, niin me tiedetään, että tätä tutkimusta tämmöisenään ei kannata lähteä tekemään,
[24:50] vaan silloin oikeasti pistetään fokus jonnekin muualle.

[Speaker 1]

[24:54] Okei, kiitos sulle näistä vastauksista.
[24:57] Tähän ihan loppuun.
[24:58] Haluaisitko sinulla antaa joku pieni motivaatio meidän kuuntelijoille lopuksi?
[25:03] Minkä takia kannattaa hakeutua tutkijaksi tai ylipäätään miksi kannattaa opiskella biostatistiikkaa omien opintojen ohilla?

[Speaker 2]

[25:15] Jos ajatellaan, tietysti minun on helpompi reflektoida sitä lääkäriopiskelijoiden kautta,
[25:20] mutta toki koskee myös biotieteilijöitä, kun paljon tehdään myös transsationaalista tutkimusta, niin ensinnäkin tietysti tutkimuksen tekeminen on todella mielenkiintoista.
[25:30] Jos ajatellaan kliinisen tutkijan kannalta, niin me tehdään tutkimuksia, jotka aivan suoraan on sovellettavissa sen potilaan hoitoon.
[25:38] Eli sä tavallaan saat sen konkreettisen hyödyn ja sen onnistumisen ajatuksen siitä, että sä oikeasti näet, että nyt kun me ollaan tehty tämä iso työ,
[25:49] niin me voidaan käyttää tätä hyödyksiä.
[25:51] Sitä kautta pystytään hoitamaan paremmin potilaita.
[25:55] Mutta jotta me voidaan tehdä laadukasta tutkimusta, niin sitä ei voi tehdä ilman biostatistiikkaa.
[26:01] Eli se on täysin käsi kädessä.
[26:03] Ja mä sanoisin ehkä tässä kohtaa, jos joku biostatistiikan opiskelija kuuntelee,
[26:07] niin mä sanoisin, että heidän myöskin kannattaa katsoa vähän biostatistiikan ulkopuolelle,
[26:12] ehkä millaisia tutkimuksia tehdään, koska se olennainen asia, paras, aivan kuningas biostatistikko on juuri sellainen, joka ymmärtää hiukan sen ulkopuolellakin,
[26:24] koska tämä pelkästään sen biostatistiikan, eli vähän, että mikä se kliininen aspekti esimerkiksi voisi olla, koska nämä ei ole koskaan ihan optimaalisia,
[26:36] vaikka jos ajatellaan meidän jonkun satunnaistetun tutkimuksen tilasto ja metodisuunnittelua, niin me ei löydetä ehkä ihan sitä parhainta mahdollista optimaalisinta vaihtoehtoja biostatistiikan kannalta,
[26:50] eikä myöskään sen kliinisen kannalta, vaan me yritetään löytää semmoinen järkevä balanssi, millä se tutkimus on oikeasti reaalisesti toteutettavissa niin, että siitä pystyy oikeasti sanomaan jotain johtopäätöksiä.
[27:04] Jos ajatellaan vielä biostatistiikan opiskelua senkin ulkopuolelta, jos meillä on kuuntelijoita, jotka eivät ajattele tekevänsä ehkä laajempaa tutkimusta,
[27:15] niin ainakin lääketieteen puolella, koska se meidän informaatiotulva tällä hetkellä on käytännössä artikkelit, joita julkaistaan,
[27:25] ja jotka tietysti totta kai lopulta päätyy oppikirjoihin, mutta sitä tietoa on niin paljon samasta aiheesta, että jos et ymmärrä yhtään biostatistiikasta niin et mitenkään pysty arvioimaan lukemaasi tiedettä.
[27:41] eli onko se oikeasti sellainen asia, mihin sinä voit uskoa vai ei.
[27:46] Me tarvittaisiin lääkikseen semmoinen kurssi, että nämä kaikkien pitää osata biostatistiikasta.
[27:53] Sitten voisi olla osa B, ne jotka jatkaa tutkimukseen.
[27:57] Mutta siinä on oikeasti ihan selkeästi musta sellainen selvä gäppi,
[28:02] mikä pitäisi jotenkin siinä lääkärikoulutuksessa korjata.

[Speaker 1]

[28:07] Kiitos Pauliina.

[Speaker 2]

[28:08] Kiitos paljon.

[Speaker 1]

[28:09] Kiitos myös sinulle kuuntelija.
[28:12] Toivottavasti tämä innosti sinua syventämään biostatistiikan opintoja esiin.
[28:17] Toivottavasti kuullaan taas statistiikan aalloilla.
[28:30] Tämän podcastin on tuottanut Turun yliopiston lääketieteellisen tiedekunnan biostatistiikan yksikkö.

Tilastollisen päättelyn perusteet

Tässä podcastin jaksossa biostatistikko Eliisa Löyttyniemi kertoo, miten tutkimuksen otoksesta saadut tulokset yleistetään koko populaatioon. Jaksossa pureudutaan tilastollisen päättelyn ytimeen ja käsitellään peruskäsitteitä, kuten p-arvoa ja luottamusväliä. Studioisäntä Markus Riskumäki tiivistää tärkeimmät tekijät siitä, kuinka tilastollinen testi valitaan. Jos olet lääketieteen, bio- tai hammaslääketieteen opiskelija tai haluat kuunnella helposti ymmärrettävää puhetta tilastotieteen perusideasta, tämä jakso on sinulle!


[00:06] Tervetuloa takaisin statistiikan aalloille.
[00:09] Tänään meillä aiheena aiheena introjaksoa syvempi sukellus tilastolliseen päättelyyn.
[00:15] Minä olen biostatistikko Markus Riskumäki ja vierainani mulla on jälleen biostatistikko Elisa Löyttyniemi, tervetuloa.
[00:23] Kiitos kiitos ja kiva olla taas täällä.
[00:26] Haluatko alkuun ihan nopeasti kertoa, että mitä kaikkea meillä ja kuuntelijoillamme on tänään edessämme?
[00:32] No mä ajattelen, että jos me ihan lyhyesti voitaisiin käydä, mikä sen tilastollisen päättelyn salaisuus on.
[00:39] Koska mun mielestä se on oikeasti ihan tilastotieteen helmi.
[00:42] Jos tämmöisessä lukiossa juuri kukaan ei ole kuullut,
[00:46] että lukiossa opetetaan vaan varjaa sikaavaa ja blaa blaa blaa,
[00:50] mutta siellä ei opeteta tilastollista päättelyä.
[00:54] Tilastollisen päättelyyn kuitenkin perustuu hyvin voimakkaasti koko lääketieteen kehitys.
[01:00] Sitä käytetään siinä, kun mitä tahansa lääketieteellistä, terveystieteellistä tutkimusta tehdään.
[01:07] Tilastotieteen ja matikan mallinnus on aivan keskeisessä roolissa siinä.
[01:11] Tuo on hyvä pointti, minkä mainitsit, että lukiossa ei tästä päättelystä puhuta oikeastaan mitään.
[01:17] Mä muistan, että itse vihlasin yli kaiken lukijassa tilastotiedettä, mutta sitten kappas kummaa yliopistossa, nyt ollaankin sitten ihan ammattilaisia.
[01:29] Joo, mut hei, aloitetaanko sillä, että kertoisit hieman vähän tutkimuksen ideasta yleisesti.
[01:36] Sitten kun lääkäri tai tutkija keksii jonkun idean, niin totta on se, että kukaan muu maailman lääkäri tai tutkija ei usko tällaista ideaa, jolle se pystyy sitä todistaan.
[01:49] Ja se todistaminen tehdään niin, että kerät dataa eli havaintoaineistoa ja sen avulla pystyt mahdollisesti todistamaan sen idean todeksi.
[02:00] Ja nimenomaan siinä käytetään sitä matikkaa, eli todennäköisyys laskentaa apuna.
[02:05] Ja sitä kautta sä pystyt sitten sen idean tuomaan arkipäivään kaikille joukolle.
[02:14] Tähän varmasti liittyy läheisesti tämmönen monelle varmasti esimerkiksi lääkiksessä opiskelevalle vähän pelottavakin termi kuin P-arvo.
[02:29] Haluaisitko vähän kertoa siitä?
[02:32] Joo, mutta lähdetään vielä liikkeelle siitä just tästä tutkimuksesta.
[02:36] Minun piti vielä sanoa se, että siinähän on ideana just se, että minä pystyn siihen dataani keräämään vain jonkun osajoukon.
[02:44] Ja siitä osajoukosta, olkoon se sitten, että minulla on sata syöpäpotilasta, niin minä pyrin sitten tekemään päätelmiä,
[02:52] miten kaikki vastaavat syöpäpotilaat, miten heitä voitaisiin hoitaa paremmin.
[02:56] Eli meillä se pääidea on kuitenkin tutkimuksessa myös tämä, että meillä on osa joukkoista, me halutaan tehdä päätelmiä.
[03:03] Ja tilastotiede voimakkaasti on myös todennäköisyyslaskenta ja se P-arvo,
[03:08] se sanahan tulee sanasta probability, tulee tämä P lyhenne.
[03:14] Ja siinä nimenomaan sitten mitataan sitä meidän dataa suhteessa vähän mitä me populaatiosta ajatellaan.
[03:23] Eli jos me ajatellaan sitä, että mikä on todennäköisyys, että me nyt havaitaan jossakin meidän muuttujassa
[03:31] kymmenen yksikön ero keskiarvoissa, jos populaatiossa sitä eroa ei olisi lainkaan.
[03:37] Ja tämän tyyppisestä todennäköisyyslaskennasta me sitten johdetaan tää PR-vo,
[03:42] mitä julkaisuissa, melkein jokaisessa julkaisussa, käytetään.
[03:47] Eli esimerkiksi tällaisessa tutkimuksessa, jossa tutkitaan lääkkeen tehoa johonkin sairauteen,
[03:53] niin voisi sanoa, että P-arvo on tämmöinen apuväline, joka kertoo, että jos otoksessa havataan
[03:59] ero esimerkiksi tämän lumenlääkkeen ja varsinaisen lääkkeen välillä,
[04:03] niin populaatioissakin on todennäköisesti sitten eroa, eli lääketehoa yleisestikin.
[04:08] Joo, ja lääketeollisuudessa nimenomaan me tarvitaan sitten siinä loppuvaiheessa ennen lääkkeen pääsyä markkinoille,
[04:15] me tarvitaan kaksi sellaista isoa niin sanottua faasi kolmas tutkimusta ja lääkeviranomaiset vaatii, että
[04:22] kummassakin me saadaan tilastollisesti merkitsevä tulos, joka tarkoittaa yleisesti sitä, että tämä P-arvo
[04:28] pitää olla alle 0,05 eli 5 prosenttia.
[04:36] Sä puhuit tuosta merkitsevyystasosta.
[04:39] Joo, siinä se raja 0,05 tarkoittaa just sitä, että me väitetään, että lääkeryhmä eroaa vaikka lumen lääkeryhmästä,
[04:48] kun se p-arvo on alle 0,05, mutta meille jää vielä sellainen pieni riski olemassa,
[04:54] että sitä eroaa ei olekaan.
[04:56] Eli aina meille jää tutkimukseen tämä epävarmuus,
[05:00] joka me koitetaan hanskata tällä tilastotieteen avulla.
[05:04] Ja minkä takia se on nyt tämmöinen 0,05, vähän niin kuin absurdi raja.
[05:09] Mutta tällä ei ole nyt vaan tieteessä, suurin osa tutkimuksista käyttää nimenomaan tätä rajaa.
[05:15] Okei.
[05:17] No mitä sitten, jos se p-arvo on lähellä merkitsevää, esimerkiksi 0,06 tai 0,08, niin tarkoittaako se, että tulokset on täysin pilalla eikä niitä kannata edes raportoida?
[05:29] Ei toki, että julkaisussa monesti kirjataan sillä tavalla, että me sanotaan, että meillä oli vähän trendiä,
[05:37] eli me oltiin hyvin lähellä merkitsevää, ja sen takia hyvässä julkaisussa aina merkataankin ne tarkat p-arvot.
[05:44] Eli mulle on ihan eri asia, että onko se p-arvo 0,061, eli se on tosi lähellä.
[05:49] Mä olen melkein saanut todistettua sen lääkiryhmien välisen eron, vai onko se 0,61,
[05:55] joka tarkoittaa, että ei ollut muuten mitään eroa käytännössä.
[06:00] Mutta sitten täytyy myös lisätä se, että on olemassa tapauksia, jos me käytetäänkin eri rajaa kuin tämä 0,05.
[06:08] Esimerkiksi jos me testataan sytokiineja tai jotakin, missä me testataan satoja tai jopa tuhansia testejä,
[06:15] kun me etsimme vain jotakin, missä voisi olla jotakin, niin silloin me korjataan sitä p-arvoa selvästi pienemmäksi.
[06:23] jotta me tehtäisiin nimenomaan vähemmän näitä virhepäätelmiä,
[06:27] mikä meillä on aina tämä epävarmuus olemassa.
[06:30] Niin tämmöisiä korjauksia myös tehdään.
[06:33] Tämä P-arvojen merkitsevyys on aika tämmöinen,
[06:38] voisi sanoa jopa niin kuin triggeröivä puheenaihe tutkimuksessa.
[06:43] Niin tota, mitä sä voisit sanoa sitten tämmöisestä asiasta kuin P-arvojen korjaaminen?
[06:49] minkä takia sitä sitten tehdään, että onko se joku taikatemppu siihen, että saadaan sittenkin omat tulokset merkitseviksi?
[06:55] Ei vaan nimenomaan toisinpäin.
[06:59] Eli p-arvoja kiristetään nimenomaan tässäkin esimerkissä, minkä mä äsken mainitsin,
[07:03] että jos tehdään ihan hirveästi testejä, niin me halutaan välttää niitä meidän virhetulkintoja,
[07:08] niin me tosiaankin lasketaan sitä meidän p-arvorajaa.
[07:13] Okei.
[07:15] Onko P-arvo ainoa tunnusluku, jolla voisi tulkita hypoteesien testausta?
[07:20] Vai onko jotain muita yleisesti käytettyjä vaihtoehtoja?
[07:23] Ei toki, vaan nimenomaan viime aikoina on korostettu sitä, että luottamusvälit olisi melkeinpä tärkeämpiä kuin P-arvo.
[07:33] Osa on sitä mieltä, että P-arvot voidaan jopa unohtaa, että halutaan raportoida vain luottamusvälit.
[07:40] Koska luottamusväli pitäisi olla lääkärille ja tutkijoille paljon vielä tärkeämpiä,
[07:43] koska luottamusvälistä sä näet, onko siellä tilastollisesti merkitsevä tulos vai ei,
[07:49] mutta sä sen lisäksi pystyt tekemään kliinisen tulkinnan,
[07:53] kuinka suuri se efekti todennäköisesti on keskimäärin.
[07:58] Ja sehän on nimenomaan se, mikä lääkäriä ja tutkijaa oikeasti kiinnostaa.
[08:02] Okei.
[08:03] Eli sun tulkinta luottamusvälistä voisi olla, että esimerkiksi 95 prosentin todennäköisyydellä
[08:12] Tältä luottamusväliltä löytyy tutkittavan muuttojen populaation todellinen arvo,
[08:16] josta voidaan tehdä sitten kliiniset päätelmät esimerkiksi lääkkeen tehosta.
[08:20] Joo, joo.
[08:21] Ja sen takia se luottamusvälin ymmärtäminen,
[08:25] että 95 prosentin todennäköisyydellä se vaikka populaatiokeskiarvo on tällä välillä,
[08:31] niin se on erittäin tärkeää, että puhutaan nimenomaan siitä populaatiokeskiarvosta,
[08:36] siitä ikään kuin todellisesta arvosta, mitähän me ei koskaan tulla saamaan selville.
[08:40] selville, koska emme voida koskaan mitata koko populaatiota.
[08:45] Sen takia siinäkin on se epävarmuus, että kun me puhutaan 95 prosentin luottamusvälistä,
[08:51] niin meillähän on 5 prosentin mahdollisuus sitten, että se meidän populaatiokeskirjo onkin
[08:55] tämän luottamusvälin ulkopuolella, mutta se epävarmuus meidän vaan täytyy sijaittaa.
[09:03] No nämä P-arvot ja luottamusvälit, mistä me ollaan nyt tässä puhuttu, niin liittyy aika
[09:08] oleellisesti semmoiseen asiaan kuin tilastollinen testaus.
[09:12] Ja tällaisia tilastollisia testejä vilisee julkaisuissa ja erilaisia on vaikka kuinka paljon.
[09:19] Miten ihmeessä sitä sitten pystyy valitsemaan oikean testin just sun omaan tutkimukseen?
[09:24] No siihen on olemassa kyllä, mekin ollaan piirretty tämmönen tilastollinen kartta,
[09:29] joka pyrkii opiskelijoita auttamaan löytämään oikein testin.
[09:33] Mutta mun mielestä siinä on semmoiset neljä kulmakiveä, mitkä pitää ekana ymmärtää,
[09:38] miten voit hahmottaa ja löytää niitä sopivia testejä.
[09:42] Yksi on se, että kun sinulla on nyt se muuttuja, jota haluat tutkia, eli me kutsutaan sitä vasteeksi,
[09:50] minkä käyttäytyminen sinua kiinnostaa, niin sinun täytyy tietenkin tunnistaa, minkälainen se muuttuja on.
[09:55] Jos sinun kiinnostuksen kohteena on olla muuttujan hemoglobiini, niin sinulla on numeerinen, jatkuva, suhdeasteikollinen muuttuja.
[10:03] Sitten jos sulla onkin se, että onko potilas parantunut vai ei parantunut, niin sulla on kategorinen, jossa luokilla ei ole järjestystä.
[10:14] Ja jos sulla on sitten taas kipumuuttuja ykkösestä viitoseen, niin se on edelleen kategorinen muuttuja, mutta niillä luokilla onkin järjestys.
[10:22] Ja vielä on muitakin luokkia, mutta tässä on nämä yleisimmät luokat, eli sen sun täytyy tunnistaa.
[10:28] Tietenkin aloitat sillä, että tunnistat, että onko se kategorinen vai numeerinen muuttoja, koska niillä on ihan eri testit.
[10:36] Mutta kipuesimerkki, missä on luokilla joku järjestys, niin siinä on enemmän informaatiota.
[10:43] Me halutaan tietenkin hyödyntää kaikki informaatio, mikä datasta irti lähtee, niin se täytyy ottaa huomioon.
[10:51] Ja sit jos meillä on taas se hemoglobiini eli tämmöinen numeerinen jatkuva muuttuja, niin meidän täytyy tunnistaa sen jakauma.
[10:59] Eli me tutkitaan erilaisilla metodeilla sitten, että onko se kutakuinkin normaalisti jakautunut, mikä on tämä kaussi, eli kello, käyrä, rakkala, lapsella, monta nimeä.
[11:11] Koska normaaliakaumaan perustuvat testit on hyvin voimakkaita, eli me saadaan niitä eroja helpommin selville, helpommin löydettävissä.
[11:19] Sitten seuraava kohta, mikä meidän täytyy datasta ymmärtää, on se, että mikä siellä on se riippumatonta ja mikä on riippuvaa.
[11:28] Eli mikä on riippumaton tarkoittaa sitä, että mikä on meidän tilastoyksikkö.
[11:33] Jos me tehdään kliinistä tutkimusta, niin se on usein ihminen.
[11:38] Yhdestä ihmisestä mitattu verenpaine on riippumaton, toisesta ihmisestä mitattu verenpaine.
[11:43] Mutta jos mittaankin samasta ihmisestä kaksi kertaa verenpainetta, niin ne ovatkin riippuvia mittauksia.
[11:50] Minun täytyy tietenkin se huomioida analyyseissä, eli tämä on ihan oleellista, että tiedät, mikä on riippuvaa ja mikä on riippumatonta.
[11:58] Asiat tuntuvat tässä tosin yksinkertaiselta, mutta eivät ne aina ole ihan näin yksinkertaisia.
[12:03] Jos me tehdään silmätutkimusta, niin se onkin se silmä, se meidän tilastoyksikkö, koska me voidaan laittaa jopa eri lääkettä eri silmiin.
[12:11] ja näin pois päin, mutta nämä on mielestäni semmoiset neljä kulmakiveä,
[12:15] mitkä pitää ymmärtää, niin sitten sä pääset jo tosi pitkälle,
[12:19] että sä pystyt löytämään tämmöisen hyvän ja sopivan testin sun datalle.
[12:24] Okei, eli kertauksena nämä tilastollisen testin valintaan liittyvät kulmakivet olivat
[12:31] yksi, päämuuttojan tyyppi, kaksi, jos muuttoja on jatkuva, niin minkälainen jakauma sillä on,
[12:38] kolme, mikä on riippumatonta, ja neljä, mikä taas on riippuvaa.
[12:42] Jep, just näin.
[12:46] TILASTOLLISTA MALLEISTA
[12:47] No sä puhuit noista tilastollisista malleista.
[12:51] Onko niissä jotain oletuksia, joita pitäisi ottaa huomioon?
[12:55] Joo, nimenomaan se on tosi tosi tärkeetä, että tietää, että mitä taustan oletuksia näillä malleilla on.
[13:01] Mä äsken tuossa mainitsin tämmöisen normaaliakauma-oletuksen.
[13:04] jos se ei ole voimassa, niin toki sitten sä saatkin ihan väärät tulokset, jos sä vaan räiskit sellaisen mallin,
[13:13] missä oletetaan, että tämä muuttujen jakauma on normaali.
[13:18] Eli siinä pitää olla tosi tarkkana ja tutkia ennen kuin tekee mitään analyysiä, että mitkä on ne tausto-oletukset.
[13:25] Joissain on niin, että tausto-oletuksella pitää olla riittävän suuri se otosjoukko,
[13:31] tai riittävän paljon vaikka tutkittavia siellä frekvenssitaulussa,
[13:39] jotta sen voi tehdä jonkun analyysin.
[13:41] Okei.
[13:42] Tähän tilastollisten testien loppuun pieni kiteytys,
[13:48] että tilastolliset testit siis auttavat selvittämään,
[13:51] havaitaanko jokin otoksessa havaittu ero,
[13:54] todennäköisesti myös koko populaatiossa.
[13:58] Mutta nyt on tosiaan paljon puhuttu tästä otoksesta.
[14:02] Miten sitten päätetään sun omaan tutkimukseen otoskoko?
[14:06] Joo, toinenkin hyvä kysymys, että mä voisin puhua koko päivänä.
[14:13] Tutkimuksen suunnittelusta yksinään, mutta siinä yksi hyvin tärkeä osa on otoskoon määrittely.
[14:19] Kuinka paljon me tarvitaan henkilötä tutkittavia, tai jos me tehdään break cleanistä,
[14:23] ja kuinka paljon me tarvitaan hiiriä siihen meidän tutkimukseen.
[14:27] niin me tehdään tällainen laskelma etukäteen ennen tutkimuksen alkamista.
[14:33] Ja jos nyt taas vaikka otetaan se hemoglobini-esimerkki, niin meidän täytyy miettiä kliinisesti,
[14:40] mikä keskimääräinen ero olisi sitten se kliinisesti merkittävä keskiarvojen ero,
[14:45] mikä me halutaan havaita, jos nyt ajatellaan vaikka, että on lääkeryhmä ja lumelääkeryhmä.
[14:51] Että millä keskiarvojen erolla olisi oikeasti jo kliinistä merkitystä.
[14:56] Se on tosi vaikea asia, ja me usein siitä tutkijoiden kanssa joudutaan keskusteleenkin aika pitkään.
[15:01] Toinen, mikä me tarvitaan, joka kuulostaa vielä hassummalta, niin me tarvitaan esimerkiksi tämän nuversen jatkuvan muuttujen keskihajonta.
[15:10] No, eihän me sitä voida tietää ennen tutkimusta, mikä on sen vaihtelu, keskihajonta, mutta siinä me hyödynnetäänkin sitten aikaisempia tutkimuksia,
[15:19] tai pilottitutkimuksia tai aikaisempia julkaisuja, jolla me arvioidaan, minkä kokoinen hajonta tulevaisuuden tutkimuksessa meillä tässä muuttuessa tulee olemaan.
[15:29] Ja esimerkiksi tällä tavalla sitten käyttäen yhtä kaavaa, niin me voidaan arvioida sitten, kuinka paljon me tarvitaan oikeasti henkilöitä tai muita tutkittavia siihen meidän tulevaan tutkimukseen.
[15:41] Jotta me pystytään sitten todistamaan se idea todeksi, mikäli se on sitten totta.
[15:47] Ainahan ne ideat ei oikein ole totta, eli ei pystytä todistaa tietenkään, koska kaikki ei toimi.
[15:53] Joo joo.
[15:55] Muakin kiinnostaa tuossa, että miten ihmeessä sä sitten löydät jonkun aiemman tutkimuksen esimerkiksi,
[16:03] mille sä perustat sen sun Otoscore-laskennan, vai onko se vaan niin, että tutkijan kliinisen mielipiteen mukaan valitaan joku?
[16:12] No ei, että jos sä työskenteet teollisuudessa, niin hirveän usein on tehty jotain aikaisempaa tutkimusta sen osalta, että sä saat sen sieltä, että sulla on oikeasti ihan sen data olemassa.
[16:24] Jos sulla ei ole itsellä dataa, niin sitten me oikeasti tehdään julkaisujen hakua.
[16:29] Ja yksi esimerkki oli sellainen, että me löytettiin kaksi julkaisua.
[16:35] Suunniteltiin tutkimusta tehtävän Suomessa ja löysimme kaksi julkaisua, toinen oli tehty Saksassa ja toinen Saudi-Arabiassa.
[16:44] Se oli ihan erilainen keskihäjyntä jostain syystä.
[16:47] Mietimme, että kumpi näistä julkaisuista data olisi ehkä lähempänä meidän tulevaa dataa.
[16:54] Sitä kautta valkasimme Saksan tutkimuksen.
[16:57] että me ajateltiin, että se populaatio siinä tutkimuksessa se on ollut lähempänä tätä meidän tulevaa tutkimuspopulaatiota.
[17:04] Okei.
[17:05] Tässä on tullut hirveän paljon asiaa, niin osaisitko tähän loppuun vielä jotenkin mahdollisimman lyhyesti kiteyttää ihmisille tilastotieteen idean?
[17:19] Kaikki lähtee tutkia tai tutkia joukosta.
[17:23] Heillä on joku idea, ja he haluavat tietenkin sen tutkimusideansa todistaa todeksi muulle maailmalle.
[17:32] Meidän täytyy siis tehdä tutkimus.
[17:34] Tutkimus tehdään aina käytännössä katsoen otostutkimuksena, eli me lasketaan se äsken mainittu otoskoko.
[17:42] Tehdään se tutkimus, kerätään sitä dataa usein vuositolkulla ja dataan siihen havaintoaineistoon
[17:49] me tehdään sitten nämä tilastolliset mallit ja sitä kautta me voidaan tehdä tilastollinen päättely,
[17:55] käyttää nimenomaan luottamusvälejä ja p-arvoja ja sitten tämä tutkimusryhmä,
[18:01] me voidaan joko iloita, tehdä hieno julkaisu tai raportti, jossa me todetaan,
[18:04] että heidän idea taitaakin olla totta tai sitten me ollaan vähän pettyneitä ja todetaan,
[18:10] Tarvii keksiä parempia ideoita jatkossa.
[18:12] Hei kiitos sulle Elisa ja kiitos myös sinulle kuuntelijalle.
[18:17] Toivottavasti tämä pieni jakso innosti sinua syventämään biostatistiikan opintojasi.
[18:23] Toivottavasti kuullaan taas statistikan aalloilla.
[18:35] Tämän podcastin on tuottanut Turun yliopiston lääketieteellisen tiedekunnan biostatistiikan yksikkö.

Miksi jokainen lääkäri ja tutkija tarvitsee biostatistiikkaa?

Ensimmäisessä jaksossa studioisäntä Markus Riskumäen haastateltavana on biostatistikko Eliisa Löyttyniemi. Hän motivoi lääketieteen, bio- ja hammaslääketieteen opiskelijoita, joilla on edessään Havainnoista päättelyyn -kurssi. Tämä jakso sopii kuitenkin kaikille, jotka haluavat kuulla miksi jokainen lääkäri ja tutkija tarvitsee biostatistiikkaa.


[Speaker 0]

[00:03] Tervetuloa kuuntelemaan johdatusta biostatistiikan opiskeluun.
[00:10] Olit sitten lääketieteen, hammaslääketieteen tai biolääketieteen opiskelija, tutkija tai muuten vain kiinnostanut biostatistiikasta, niin hienoa, että olet täällä.
[00:21] Minä olen biostatistikko Markus Riskumäki ja tänään haastattelen kollegaani, biostatistikko Elisa Löytyniemiä.
[00:24] Tervetuloa.
[00:24] Tänään haastattelen kollegaani, biostatistikko Elisa Löyttyniemeä.
[00:28] Tervetuloa.
[00:29] Kiitos.
[00:29] Kiva olla täällä.
[00:31] Ennen kuin aloitetaan, voisitko kertoa vähän työhistoriasta?
[00:36] Sen jälkeen, kun olin opiskellut matikkaa ja tilastotiedettä yliopistossa,
[00:41] lähdin lääketeollisuuteen.
[00:42] Olin siellä yli 15 vuotta.
[00:44] Sen jälkeen tutkittiin laitteita tai kehitettiin laitteita,
[00:49] ja kehitettiin myös erilaisia laboratoriotestejä.
[00:53] Viitisen vuotta.
[00:53] Nyt olen ollut yliopistolla lääketieteen tiedekunnassa biostatistikan yksikössä reilu kymmenen vuotta.
[01:01] Sulla onkin pitkä kokemus lääkäreiden ja tutkijoiden kanssa työskentelystä.
[01:07] Puhutaanpas tänään sellaiset ihmiset mielessä pitäen, joilla ei ole välttämättä mitään kosketuspintaa vielä tilastotieteeseen.
[01:16] Otasitsä kertoa mulle, että miksi tuleva lääkäri tai tutkija tarvitsee ymmärrystä tutkimuksesta ja tulosten tulkinnasta?
[01:24] Jos nyt tässä kohtaa ajattelen vaikka sitä lääkäriä ja potilastyötä, niin toki se lääkäri haluaa, että kun hänelle tulee joku potilas,
[01:36] hän pystyisi antaa sille, mikä sairaus sitten on kyseessä, niin hyvän hoidon ja potilas joko toipuu kokonaan tai oireet paranee tai jotakin vastaavaa.
[01:48] Ja totta kai lääkäri myös haluaa, että se hoito on tehokas ja turvallinen.
[01:54] Näin ollen mehän halutaan myöskin, että tämä tuleva hoito on näyttöön perustuen todistettu turvalliseksi ja tehokkaaksi.
[02:07] Tämä näyttöön perustuva lääketiede nimenomaan perustuu siihen, että sitä on tutkittu, meillä on dataa.
[02:14] Eli se ei perustu mihinkään uskomuksiin tai luuloihin se, että se on tehokas ja turvallinen, vaan nimenomaan dataan.
[02:23] Jos me ajatellaan vaikka viime vuosina, kun tuli korona yhtäkkiä, niin kukaanhan maailmassa ei tiennyt siitä sairaudesta mitään.
[02:34] Ei tiennyt parannuskeinoa, ei tiennyt mistä se tulee, miten se tarttuu, mutta sittenhän koko maailma, tutkijat ja lääkärit,
[02:43] rupesi keräämään sitä dataa ja vasta datan kautta me ruvettiin ymmärtämään sitä myös, miten sitä voidaan hoitaa,
[02:51] miten sitä voidaan ehkäistä.
[02:53] Tähän tarvitaan nimenomaan sitä lääkärin ja tutkijan osaamista, jatkuvaa oppimista
[03:00] siihen uuden tutkimustiedon sisäistämiseen, että se ammattitaito kehittyy vuosien varrella.
[03:09] Ja siihen sitten taas tarvitaan sitä julkaisun lukutaitoa hyvin paljon, että ymmärtää sitä uutta tutkimustietoa, jotta voisit taas niitä tulevia potilaita hoitaa paremmin.
[03:23] Okei.
[03:23] No miten tämä kaikki liittyy tilastotieteeseen tai biostatistiikkaan?
[03:28] Mä mainitsin tuossa nimenomaan tämän näyttöön perustuvan lääketieteen.
[03:33] Ja se tarkoittaa sitä, että me tutkitaan jotain asiaa, kerätään jotain dataa,
[03:38] ja sitä kautta me oikeasti sitten tehdään matemaattisia malleja siihen dataan,
[03:44] eli käytetään nimenomaan tilastollisia menetelmiä.
[03:47] Ja niiden avulla me voidaan tehdä sit johtopäätöksiä siitä datasta.
[03:53] Ja ne johtopäätökset ja mallit tietenkin lukevat juuri niistä julkaisuista.
[03:59] Ja sitä kautta me biostatistikan kursseilla hirveästi korostetaan myös sitä julkaisun lukemistaitoa,
[04:07] että lukija pystyisi arvioimaan sen julkaisun laatua, että onko se hyvä julkaisu vai onko se huono julkaisu.
[04:15] Käytänkö minä siinä julkaisussa esitettyjä tietoja seuraavien potilaiden elämyshoitamiseen?
[04:21] Tai tutkijana, löytyykö siitä julkaisusta jotakin hyviä ideoita, millä voin jatkaa jotain tutkimusta.
[04:29] Sä mainitsit tuossa matemaattisen mallinnuksen, joka varmasti monelle saattaa kuulostaa hyvin pelottavalta,
[04:37] niin tulisiko siis lääkäri osata matemaattista mallinnusta, että se pystyy ymmärtämään näitä tutkimuksia?
[04:42] No sanotaan, että nyt kun olen vuosikymmeniä työskennellyt tutkijoiden ja lääkäreiden kanssa,
[04:49] niin tärkeintä on se tilastollisen päättelyn matemaattisten mallien ymmärtäminen,
[04:55] sen logiikan ymmärtäminen, niin että sä osaat vähintään tulkita niitä tuloksia julkaisuissa,
[05:01] missä niitä kirjoitetaan, niitä päättelyjä.
[05:05] Mikäli sä työskentelet teollisuudessa, niin meillä on aina tiimi.
[05:09] Meillä on se tutkijalääkäri ja biostatistikko yhdessä tekee ne raportit tai julkaisut.
[05:15] Eli siinä kohtaa se ymmärrys on kaikista tärkein ja se logiikan päättelyn tajuaminen.
[05:23] Akateemisessa maailmassa on paljon myöskin lääketietojen tutkijoita, jotka haluaa oppia vielä lisää tätä tilastollista mallintamista ja sitä kautta jopa tehdä itse ne analyysit.
[05:35] Meillä biostatistiikan kursseilla harjoitellaan analyysin tekemistä, koska sitä kautta opit ymmärtämään tilastollisen päättelyn logiikkaa.
[05:44] Mun mielestä se silloin auttaa myöskin siinä nimenomaan julkaisujen lukemisen ymmärtämisessä.
[05:51] Mutta eli siis välttämättä ei ole pakko itse osata tehdä niitä mallinnuksia, osasitsä sanoa sitten kumminkin, että antaako se jotain semmoista etuliointiasemaa, jos sä osaat itse tehdä?
[06:04] Joo, se nimenomaan auttaa myös siihen, että jos mä ajattelen tutkijaa, tutkija osaa silloin paremmin suunnitella tietokannat, tietokannat on paremmin rakennettu ja silloin sä tiedät sen, että mikä se logiikka on.
[06:21] Mutta välttämätöntä se itseanalyysin tekeminen ei ole, mutta se auttaa siihen tavallaan tilastotieteen ymmärtämisen toki hyvin paljon.
[06:28] Ja sen takia sitä kurssilla harjoitellaan.
[06:35] Sä heittelit tossa monta kertaa tämmöisiä termejä niin kuin tilastollinen mallinnus, tilastollinen päättely ja ylipäätään tilastotiede saattaa olla sanana vähän outo monille.
[06:48] niin mitä sä tarkoitat tilastollisella päättelyllä?
[06:53] No päättelyn se pääidea on se, että kun meillä tutkimuksessa on aina vaan osajoukko, eli otos,
[07:00] leikitään nyt vaikka, että me otetaan siihen tutkimukseen sata astmaatikkoa,
[07:05] niin toki me halutaan niistä sadan astmaatikon joukosta vetää päätelmät
[07:12] kaikkien astmaatikkojen joukkoon eli kaikkiin tulevaisuuden astmaatikkopotilaisiin, mitkä voit kohdata.
[07:19] Eli tavallaan se, että me halutaan vetää tutkimusjoukosta otoksesta päätelmät sinne populaatiotasolle.
[07:27] Mikä ikinä se meidän sairaspopulaatio sitten onkaan.
[07:31] Se on se keskeinen idea tilastollisessa päättelyssä.
[07:35] Siinä me hyödynnetään nimenomaan keskeiset termit on P-arvo ja luottamusväli, eli ilman niiden termien ymmärtämistä, niin ei pysty lukemaan käytännössä katsoen mitään tiedellehtiä.
[07:50] Eli nämä ovat ne kaikista keskeisimmät, ja näillä nimenomaan pyritään hanskaamaan se epävarmuus,
[07:57] joka meillä on päättelystä, kun me, eihän me sen sadan astmaatikon joukossa pystytä totuutta tietämään,
[08:04] mitä populaatiossa tapahtuu.
[08:06] Eli meille jää aina se epävarmuus olemaan, mutta me pyritään hanskaamaan
[08:10] sitä tilastotieteellä nimenomaan luottamusvälien ja p-arvon avulla.
[08:15] Okei, olipa hieno kiteytys tilastotieteestä, mutta kumminkin tämänkin jakson nimi on
[08:20] johdatus biostatistiikkaan, niin miten biostatistiikka eroaa normaalista statistiikasta tai tilastotieteestä?
[08:28] No siinä on se biosano edessä, joo.
[08:31] Eli se nimenomaan keskittyy biologisiin ongelmiin.
[08:36] Onko ne sitten kemiaa, lääketiedettä ja semmoista.
[08:41] ja siihen on sitten tavallaan optimaaliset, vähän erilaisia tilastollisia menetelmiä olemassa sitten.
[08:50] Joo, kiitos.
[08:51] No yksi semmoinen kysymys mulle tuli vielä mieleen, mikä saattaisi kiinnostaa tämän jakson kuulijoita,
[08:58] että tarviiko tällaisille biostatistiikan kursseille jotain taustatietoja?
[09:02] No ei oikeastaan, meillä on se periaate, että me lähdetään aina ihan nollasta meidän biostatistiikan kursseilla.
[09:09] Se mitä, se on lähinnä, jos mä ajattelen jotain ihan lukiokitaustaa, niin tilastotiedehän on hyvin painokkaasti todennäköisyyslaskentaa.
[09:19] Eli se sieltä niin kun kumpuaa pohjalta todennäköisyyslaskennan asiat, koska esimerkiksi tää P-arvo, minkä mä vaan nyt mainitsin kurssilla sitten enemmän,
[09:31] niin se P hän tulee sanasta probability, joten ei oo ihme, että käsitellään paljon todennäköisyyttä.
[09:38] No niin, nyt tulikin kuulemaan niin paljon asiaa, että voisin lyhyesti kerrata.
[09:44] Eli voisi sanoa, että tilastotieteelliset menetelmät ovat elintärkeitä lääketieteelliselle tutkimukselle.
[09:50] Ja vaikka työskentelisikään tutkimuksen parissa, niin ilman tilastotieteellistä osaamista on hyvin vaikea lukea alankirjallisuutta kriittisesti.
[09:58] Koska ilman tieteellistä todistamista, lainausmerkeissä, tutkimusasetelmilla ei ole todellista pohjaa.
[10:06] Ja mä sanoin tosiaan lainausmerkeissä todistamista, sillä eihän mikään todellisessa maailmassa ja tutkimuksessa ole ikinä täysin varmaa.
[10:14] Joo, tämähän se juuri on, että meille jää aina se epävarmuus ja me pyritään sitä sitten mahdollisimman hyvin kuvaamaan sitä epävarmuutta tilastotieteen keinoin.
[10:23] Niin kuitenkin, että se kliinikkotutkijalääkäri pystyisi tekemään sitten näitä kliinisiä päätelmiä kuitenkin tämän emmesluottamusvälin avulla.
[10:34] avulla.
[10:35] Eli onko se hoito tarpeeksi tehokas hänelle ja onko se sitten totta kai turvallinen myös potilaille.
[10:45] Tässä on nyt keskusteltu aika tämmöisiä teoreettisia asioita, niin kuulijoilta varmasti myös kiinnostaisi joku
[10:53] semmoinen ihan käytännön esimerkki, niin voisiko sulla antaa esimerkki, kuinka esimerkiksi joku tutkimusidea
[10:59] voi johtaa kliinisen hoidon muutoksiin?
[11:04] Tässä yhtenä hienona esimerkkinä on tämmöinen turkulainen tutkijaryhmä, joka rupesi ajattelemaan sitä, että tarvitseeko hän aina umpilisäkkeen tulehdusta,
[11:14] joka on siis tämmöinen komplisoitumaton eli lievä umpilisäkkeen tulehdus, tarviiko hän sitä aina leikata, niin kuin sitä on nyt viime vuosikymmenet aina leikattu.
[11:23] Koska he ajatteli, että no se on tulehdus, että muutkin tulehdukset hoitetaan antibiooteilla.
[11:30] Niinpä he kasasivat tutkimuksen pystyyn, jossa tutkittiin, riittääkö pelkkä antibioottihoito umpilisäkkeen hoitoon.
[11:41] Todennäköisesti he huomasivat, että suurimman osaksi se riittää, eli ei tarvinnutkaan leikata,
[11:46] joka tietenkin lyhentää sairaslomia, ei ole leikkauskomplikaatioita tietenkään, kun ei leikata.
[11:53] Tämä sai hyvin jopa maailmanlaajuista huomioon.
[11:59] Saman tien, kun nämä tutkimustulokset julkaistiin, niin se on myös Suomessakin muuttanut hoitokäytäntöjä.
[12:05] Lisäksi tarvitsee sanoa, että korona-aikana sehän oli suurin piirtein taivaan lahja, koska koronapotilaan leikkaaminen on aikamoinen juttu.
[12:14] Okei, kiitos tästä esimerkistä.
[12:17] Eikös totta, että tämä tutkimushan oli, niin kuin sanoitkin,
[12:20] ihan maailmanlaajuisesti tunnistettu, mutta myös palkittu,
[12:24] esimerkiksi Jamassa, joka on yksi maailman huippulehdistä?
[12:27] Joo, pitää paikkansa.
[12:28] Ja tämä tutkimusryhmä edelleen jatkaa näitä tutkimuksia.
[12:32] Ja nyt on tutkimuksia menossa, että tarvitaanko meille sitä antibioottia.
[12:36] Me ollaan nyt jo todistettu, että meille riittää pienempi antibioottimäärä.
[12:41] ja todistettu sitä, että se antibiootti voidaan hoitaa kotona, ei tarvitse suonensisäisesti hoitaa.
[12:45] Ja nyt tutkitaan myös sitä, että riittääkö pelkkä kipulääkäri.
[12:48] Eli tulehdus menisi vain itsellään ohi, niin kuin lasten korvatulehduksiakin usein vain nykyisin seurataan.
[12:55] Okei, hienoa Suomi ja hienoa Turku.
[12:59] Tässä olikin sitten tämä meidän lyhyt intro jaksomme.
[13:02] Kiitos sinulle kuuntelija, ja toivottavasti tämä innosti sinua opiskelemaan biostatistiikkaa.
[13:12] Toivottavasti kuullaan taas statistiikan aalloilla.