Ero sivun ”Massadata kansanterveyden edistämisessä” versioiden välillä

Kohteesta Opasnet Suomi
Loikkaa: valikkoon, hakuun
(Massadatan käyttökohteita ja menetelmiä)
(Massadatan haasteet ja kehityskohteet)
(2 välissä olevaa versiota samalta käyttäjältä ei näytetä)
Rivi 174: Rivi 174:
 
=== Suomalaisia strategioita ===
 
=== Suomalaisia strategioita ===
  
'''Sote-tieto hyötykäyttöön
+
Suomessa on parin viime vuoden aikana julkaistu massadataan liittyviä selvityksiä tai strategioita. Tieto parantaa päätöksentekoa, ja tämä on ymmärretty niin tieteen kuin politiikankin foorumeilla. Tässä tarkastellaan kansanterveydellisestä näkökulmasta kolmea raporttia, mutta aloitteita on muitakin, kuten avoimen tieteen ja tutkimuksen ATT-hanke ja avoimen tiedon ohjelma.
  
Kommentoitava evidence-based suuntausta Suomessa
+
''Sote-tieto hyötykäyttöön.
 
+
Sosiaali- ja terveystietojen tehokas käyttö on tunnistettu tärkeäksi kansanterveyttä ja myös kansantaloutta edistäväksi tekijäksi. Myös soteuudistuksessa odotetaan datanhallinnan tehostuvan ja parantavan toiminnan laatua. Strategia kohdistaa huomion tiedon keräämisestä tiedon hyödyntämiseen henkilön omassa elämässä sekä potilas- ja asiakastyössä ja tutkimuksessa. Tiedon jalostaminen, saatavuus, läpinäkyvyys, vertailukelpoisuus, ajantasaisuus ja uusiokäyttö korostuvat. Lisäksi edistetään kansalaisen mahdollisuuksia tuottaa itse tietoa omaan, terveysammattilaisten ja palveluntarjoajien käyttöön. Omadataa edistetään.
Massadatasta kannattaa erikseen mainita ihmisten itsensä keräämät terveys oire ja kuntoilutiedot, jotka hyvinkin poan saattavat olla hoitavan lääkärin käytettävissä. Miten niitä sitten käytettäisiin?
 
 
 
Sote-tieto hyötykäyttöön myös kuvattava
 
 
<ref name="sote">Tieto hyvinvoinnin ja uudistuvien palvelujen tukena. Sote-tieto hyötykäyttöön -strategia 2020. Sosiaali- ja terveysministeriön julkaisuja 2015. ISBN 978-952-00-3548-8
 
<ref name="sote">Tieto hyvinvoinnin ja uudistuvien palvelujen tukena. Sote-tieto hyötykäyttöön -strategia 2020. Sosiaali- ja terveysministeriön julkaisuja 2015. ISBN 978-952-00-3548-8
 
[http://urn.fi/URN:ISBN:978-952-00-3548-8]</ref>
 
[http://urn.fi/URN:ISBN:978-952-00-3548-8]</ref>
  
Samoin avoiment tiedon ovjelma ja avoimen tieteen ja tutkimuksen strategia sekä ATT
+
Kanta- ja muita järjestelmiä kehitetään tuottamaan kansallista vertailutietoa ja tietoa päätöksenteon tueksi. Tavoite on haastava jopa kansainvälisesti, kun tarkoitus on saada valtakunnallinen reaaliaikainen tietovarasto, josta voidaan tuottaa hyödyllistä ja konkreettista tietoa sosiaali- ja terveyssektorille ja myös sen ohjaamiseen. Sosiaali- ja terveydenhuollossa isona massadatan tuottamisen esteenä ovat olleet pirstoutunut tietojärjestelmä ja kuntakohtaiset ratkaisut sekä toimittajariippuvuus. Näitä asioita pyritään nyt sote-ratkaisulla ja mm. Kanta-hankkeella ratkomaan.
 
 
Haaste: lock-in ja toimittajariipouvuus. Suomi voisi tarjota ilmaisia peerusratkaisuja käyttöön ja saisi näin datat jalostettavaksi. Vrt Apotti (kannattaako mainita?)
 
 
 
'''Big data -strategia:
 
 
 
Suomem edut: perusrekisterit, osaaminen ja i fra ovat hyvät.
 
Massadata korostaa yhteistyön ja avoimuuden merkitystä.
 
Monialaisuus ja täydennyskoulutus tarpeen edistämisessä.  
 
Teknologia analyysimenetelmät ja substanssitieto saatava kohtaamaan.
 
Fimmin geenitiedot?
 
Suomessa olisi innovaatiotilausta erityisesti ikääntyvälle väestönosalle suunnatuille ennaltaehkäisevän terveydenhuollon ja itsehoidon palveluille. OECD:n Suo- mea koskevan raportin mukaan40 väestön ikääntymisen aiheuttamat rakenteelliset ter- veydenhuollon kustannuspaineet tulevat lähivuosina ja myös tulevaisuudessa olemaan Suomessa merkittävämpi ongelma kuin useimmissa muissa OECD-maissa.
 
 
 
Suomessa on alan osaamista esimerkiksi bioinformatiikan ja molekyylilääketieteen alalla. Toinen tärkeä alue liittyy kansalaisten omatoimiseen terveydenhoitoon ja hyvinvoinvointiin liittyvien itsemit- tausteknologioiden kehitykseen, jossa suomalaisyrityksissä on osaamista kymmenien vuosien ajalta.
 
 
 
Big datalta odotetaan terveydenhuollon laadun parantumista ja säästöjä. Data-analyysin odotetaan kehittyvän tavalla, joka auttaa yksittäisen kansalaisen terveysriskien ennus-
 
 
 
tamisessa erilaisten datavirtojen avulla sekä sairauksien ehkäi- syssä. Terveystietojen hyöty- käyttöön liittyy kuitenkin yksi- tyisyyteen, sosiaalisiin ja eetti- siin näkökulmiin liittyviä kysy-
 
 
 
”Suuret tietoaineistot parantavat omahoitoa, ennaltaehkäisevää toimintaa, valvontaa sekä tukevat ammattilaisten työtä”
 
 
 
Soteuudistus tarjoaa merkittävän mahdollisuuden
 
 
 
Omahoitomenetelmät ja suomalai en mittausteknologia luovat mahdollisuuksia.
 
 
 
Esimerkkejä:
 
 
 
Syöpälääkkeiden vaikutusta soluihin tutkitaan genominlaajuisilla matemaattisilla malleilla.
 
 
 
Lääkeaineiden tehon vaikutus soluissa ennustetaan matemaattisin mallein koneoppimisen avulla.
 
 
 
Muun muassa eri- laisen mobiilidatan, trendidatan sekä sosiaalisesta mediasta saatavan datan määrän kas- vu tuo tutkijoiden ulottuville aivan uudenlaisia aineistoja. Erimerkiksi ihmisten todellista käyttäytymistä kuvaavat verkonkäyttö- ja paikkatietoaineistot mahdollistavat merkittävi- en lisätietojen saamisen ja siten täydentävät (tai jopa korvaavat) perinteisiä kyselytutki- muksia, joilla tutkitaan muun muassa ihmisten käyttäytymisaikomuksia.
 
  
 +
''Big data -strategia.
 +
Suomen massadatastrategiassa tunnistetaan useita vahvuuksia: rekisterit ovat hyviä ja osaaminen ja infra kunnossa. Massadata korostaa yhteistyön, luottamuksen ja avoimuuden merkitystä, ja näissä asioissa Suomi on edellä useimpia muita maita, vaikka massadataprojektit toistaiseksi ovat edenneet nopeammin esimerkiksi Yhdysvalloissa ja Isossa-Britanniassa. Erityisen hyviä mahdollisuuksia tunnistetaan itsehoidon, ennaltaehkäisyn ja ikääntyvien ihmisten palveluille. Vahvuuksia on bioinformatiikan, molekyylilääketieteen ja itsemittausteknologioiden alalla (esimerkiksi Suunto, Firstbeat ja Polar ovat alan pioneereja).
 
<ref name="rastas">Taru Rastas, Emil Asp (toim.). Big datan hyödyntäminen. Liikenne- ja viestintäministeriön julkaisuja 20 / 2014. ISBN 978-952-243-407-4 [http://urn.fi/URN:ISBN:978-952-243-407-4]</ref>
 
<ref name="rastas">Taru Rastas, Emil Asp (toim.). Big datan hyödyntäminen. Liikenne- ja viestintäministeriön julkaisuja 20 / 2014. ISBN 978-952-243-407-4 [http://urn.fi/URN:ISBN:978-952-243-407-4]</ref>
  
Big datasta saatavia hyötyjä
+
Itsemittaus ja itsehoito on aiempaa helpompaa, kun ihmiset voivat mitata kotona verenpainettaan tai esimerkiksi seurata unensa laatua. Tämä voi vähitellen muuttaa terveydenhuollon painopistettä ja lääkärien työtä kohti erikoistunutta sairauksien hoitoa ja ennaltaehkäisyä.
Hallinto: Prosessien tehokkuut, paremmat palvelut, läpinäkyvyys, kustannussäästöt ja resurssien kohdentuminen, päätöksenteon laatu.
 
Yritykset: innovaatiot, markkintaosuuksien tai voittojen kasvattaminen, prosessien tehokkuus (optimointi), tuottavuusomaisuuden käyttö, tuottavuus, hävikkin vähentäminen, asiakaskokemuksen parantaminen.
 
Kansalainen: palvelujen laatu ja valintamahdollisuudet, uudet palvelut, parempi kontrolli itseä koskeviin tietoihin, vaikuttamismahdollisuudet, yhteiskunnallinen osallistuminen, kuluttajan oikeudet.
 
Tutkimus: uusien aineistojen mahdollistamat laajemmat tutkimushankkeet, tiedon yhdistlystä uutta tutkimusta, menetelmistä tutkimuksen laatua ja tehokkuutta, tutkimuksen vaikuttavuus.
 
 
 
Julkishallinnon toiminnoissa jatkuvasti kasvavan tietomäärän keskellä on tärkeää hah-mottaa tiedon mahdollisuudet kokonaisuutena ja hallita merkityksellistä tietoa, eli ym-märtää, mitä tietoa on olemassa ja mitä puuttuu. Käynnissä olevan digimurroksen keskellä data- ja asiakaslähtöisen hallinnon tulee kyetä ratkaisemaan arkipäiväisiä tiedonhal-lintaan liittyviä ongelmia: missä ja kenellä tietoa on, onko tieto käytettävässä muodossa, miten voin liittyä tietovirtaan ja ymmärränkö tiedon käyttötarkoitukseeni oikein?
 
  
Kokonaiskuva tietopääomasta, tiedon ympärille rakentuva kehitysyhtei-sö, tietokehittämisen koordinointi ja standardit järjestelmäriippumattomat menetelmät liikuttaessa tietoa ovat tärkeitä tekijöitä.
+
Massadatalla nähdään Suomessa monenlaisia hyötyjä useille toimijoille. Hallinnon prosessit tehostuvat ja palvelut paranevat, läpinäkyvyys lisääntyy ja resurssit kohdentuvat tarkemmin. Yritysten innovaatiokyky, tehokkuus ja asiakaskokemus paranevat ja voitot lisääntyvät. Kansalaisten valinnanmahdollisuudet, palvelut ja omien tietojen hallinta paranevat. Yhteiskunnallisen osallistumisen mahdollisuudet lisääntyvät. Tutkimuksessa mahdollisuudet laajoihin hankkeisiin, tietojen yhdistelyyn, laadun parantamiseen ja vaikuttavuuteen paranevat. Kaikki nämä muutokset kuitenkin edellyttävät tietokokonaisuuksien hahmottamista, asiakaslähtöisyyttä, yhteistyötä, yhteisiä käytäntöjä, järjestelmäriippumattomuutta ja muutoksen resursointia. Esimerkiksi tutkimusdata on arvokasta pääomaa ja sen jakaminen on raskas päätös tutkijalle, ellei järjestelmä sitä tue.
 +
<ref name="rastas"/>
  
Itsensä mittauksen ympärillä on paljon uusia aloitteita, joita motivoi myös terveyden-huollon toimialamuutos. Suomessa itsensä mittausteknologioita kehittäneitä, kansainväli-sillä markkinoilla toimivia yrityksiä on useita, muun muassa Firstbeat, Suunto ja Polar. Lisäksi alalla on lukuisia lupaavia start up -yrityksiä. Mittalaitteiden avulla ihmiset saavat uudenlaista tietoa itsestään. Itsehoito on aiempaa helpompaa, kun ihmiset voivat mitata kotona verenpainettaan tai esimerkiksi seurata unensa laatua. Kehityskulku voi vähitellen muuttaa terveydenhuollon painopistettä ja lääkärien työtä. Lääkärit voivat keskittyä eri-koistuneeseen sairauksien hoitoon ja ennaltaehkäisyyn, kun terveyden ylläpitoon on uu-denlaisia vaihtoehtoja.
+
''Omadata ja henkilötietojen hyödyntäminen.
 
+
Omadata tarkoittaa sellaista ihmistä koskevaa tietoa, jonka käytöstä hän voi itse päättää. Henkilötietoa syntyy ja kertyy esimerkiksi näistä aihepiireistä: terveys, liikenne, energia, hallinto, itse kerätty tieto, pankki ja vakuutus, kauppa, verkkopalvelut sekä viestintä ja media. Esimerkiksi Kanta-järjestelmään ollaan kehittämässä Omakanta-palvelua rajapinnaksi terveystietojen katsomiseen ja itsekerätyn terveystiedon tallentamiseen.  
Kannustetaan rahoituksella ja ohjauksella eri toimijoita maksimaaliseen tutki-musdatan jakamiseen ja siten tutkimuksen tehostamiseen läpi tutkimushank-keiden elinkaaren.
 
 
 
Lisätään resurssien puitteissa kansallista osallistumista tutkimuksen tietoai-neistojen jakamisen kansainväliseen kehitykseen ja standardointiin globaaleis-sa yhteistyöelimissä.
 
 
 
Sääntelyä tukevat yhteiset käytännesäännöt ja periaatteet. On luotava ns. ”big data -etiketti” siitä, miten dataa käsitellään ja hyödynnetään kunnioittaen niin kansalaisten kuin yritystenkin oikeuksia.
 
 
 
'''Omadata
 
  
 +
Omadatassa pyritään yhdistämään ihmiskeskeisyys, tietojen hyödynnettävyys, yhteentoimivyys ja hajautettavuus sekä liiketoimintamahdollisuudet. Ihmisellä on siis oikeus ja mahdollisuus hallita tietojaan, pitää ne saatavilla koneluettavasti ja hajauttaa tai siirtää tietonsa haluamlleen ylläpitäjille. Tämä avaa uusille toimijoille ja liiketoiminnalle mahdollisuuksia ja rikkoo sektorirajoja.
 
<ref name="poikola">Antti Poikola, Kai Kuikkaniemi, Ossi Kuittinen. MyData - johdatus ihmiskeskeiseen henkilötiedon hyödyntämiseen. Liikenne- ja viestintäministeriö 2014. ISBN 978-952-243-418-0 [http://urn.fi/URN:ISBN:978-952-243-418-0]</ref>
 
<ref name="poikola">Antti Poikola, Kai Kuikkaniemi, Ossi Kuittinen. MyData - johdatus ihmiskeskeiseen henkilötiedon hyödyntämiseen. Liikenne- ja viestintäministeriö 2014. ISBN 978-952-243-418-0 [http://urn.fi/URN:ISBN:978-952-243-418-0]</ref>
  
Massadata
+
Omadatasta voi tulla avointa dataa tietoja yhdistelemällä ja anonymisoimalla tai siten, että ihminen päättää avata omia tietojaan vapaasti käytettäväksi. Tällaista data-altruismia on nähty Suomessakin, kun tutkija Leena Palotie avasi sairastuttuaan omia tietojaan tutkimukselle.
Omadata
 
ReplicaX ja datan anonymisointi keinodataksi. THLn haaste Apps4Finald-kisassa.
 
Eu-direktiivi vaikeuttaa henkilötutkimusta? Kaiva esille.
 
Televisiosarjatko ratkaisuna datankeruulle jos tutkimus kielletään? Niissä ei ole henkilösuojaa eikä tarveharkintaa.
 
Erilaiset tietoaineistot. Viranomaiskäyttö eri kuin tutkimuskäyttö.
 
Biobankit ja niiden data.
 
Tietojen hyödyntäminen on menossa ristiriitaisiin suuntiin ja lähivuodet ratkaisevat toisaalta minia edistysaskeleita ja toisaalta sen tehdääkö pahoja takapakkeja.
 
  
Mydata
+
Jos omadataa opitaan integroimaan yksityisyyttä loukkaamatta ja ilman toimittajariippuvuutta, voi tuloksena olla aivan uudenlaisia palveluja ja tutkimusta. Omadataa on siis syytä tarkastella tiivisti osana massadatan kehitystä. Samalla tulee tunnistaa ja ratkaista terveystietojen hyötykäytön yksityisyyteen sekä sosiaalisiin ja eettisiin näkökulmiin liittyviä ongelmia.
  
Luku 1 periaatteet kuvataan.
+
Omadatan ihmisnäkökulma ja massadatan yritysnäkökulma täydentävät toisiaan. Omadata tuo läpinäkyvyyttä ja sitä kautta hyväksyttävyyttä henkilöihin liittyvien datamassojen käsittelyyn ja antaa konkreettisia keinoja yksityisyydensuojan toteuttamiseen. Tämä edistää massadatan kehittymistä.
S17 mydata ja avoin data
 
My Datan -ajattelun kolmea lähtökohtaa: ihmiskeskeisyyttä, tiedon hyödynnet- tävyyttä, ja liiketoimintamallien avautumista voidaan konkretisoida periaatteilla 1. yksilöiden oikeus ja mahdollisuus hallita omaa dataansa, 2. henkilötiedon kattava ja käytännöllinen saatavuus sekä 3. henkilötiedon hallinnan hajauttaminen ja yhteentoimi- vuus. Nämä periaatteet ohjaavat My Data -rajapintojen ja standardien, välittämi- seen ja hallintaan liittyvän palveluinfrastruktuurin sekä My Dataa hyödyntävien sovellusten ja palvelujen kehitystä.
 
  
Avoimen tiedon määritelmän mukaan avoin aineisto on teknisesti ja juridisesti
+
Itsensä mittaaminen on maailmanlaajuisesti nopeasti kasvava trendi, jossa ihmiset uusien laitteiden ja teknologian avulla keräävät, analysoivat ja hyödyntävät kaikkea mahdollista omaan kehoon, ympäristöön ja toimintaan liittyvää dataa. Osa tästä on terveyden edistämisen tai hoidon kannalta hyödyllistä. Askelmittareiden, verkkoyhteydellä varustettujen henkilövaakojen, aktiivisuusrannekkeiden ja näihin liittyvien palvelujen kehitys tuo arkeen aivan uudenlaisia mahdollisuuksia terveempien käytäntöjen luomiseen.
kenen tahansa vapaasti käytettävissä, uudelleen käytettävissä ja jaettavissa.
 
Vastaavasti My Data voitaisiin määritellä niin, että se on teknisesti ja juridisesti
 
datan kohteen itsensä vapaasti käytettävissä, uudelleenkäytettävissä ja jaettavissa.
 
My Datasta voi tulla avointa dataa:
 
* muunnosten kautta – Esimerkiksi suuri osa julkisista tilastoista syntyy kyselytutkimusten
 
tai muiden yksilöiden henkilötietojen pohjalta yhdistelemällä,
 
aggregoimalla ja anonymisoimalla. On tärkeää tietää, mitä haasteita
 
anonymisointiin liittyy.
 
* yksilöiden valinnan kautta – Voi olla ihmisiä, jotka ovat valmiita avaamaan
 
omaa henkilötietoaan hyödyttääkseen muita. Esimerkiksi vaikeasta sairaudesta
 
kärsivä saattaa mielellään jakaa omaa terveysdataansa, jos voi siten
 
edistää lääketieteellistä tutkimusta ja auttaa muita sairastuneita.
 
 
 
Periaate: Ihmisillä on oikeus ja käytännön mahdollisuus hallita omia henkilötietojaan.
 
 
 
Periaate: Henkilötieto on ihmisille itselleen saatavilla koneluettavasti ja riittävän ajantasaisesti
 
rajapintojen kautta.
 
 
 
Periaate: My Datan hallinnointi ja säilytys on mahdollista hajauttaa ja palvelut voidaan
 
vaihtaa, mutta kokonaisuus on yhteentoimiva ja looginen.
 
 
 
Keskeinen seuraus My Data -periaatteiden toteuttamisesta on henkilötiedon
 
arvoketjujen pilkkoutuminen ja tiedon hallinnan keskittyminen ihmisen ympärille.
 
Tämä avaa mahdollisuuksia uusille toimijoille ja rikkoo perinteisiä sektoreiden
 
ja toimialojen rajoja.
 
Henkilötiedon jalostuksen arvoketju koostuu henkilötiedon lähteistä (luominen,
 
kerääminen), välittämisestä (jalostus ja hallinta) ja hyödyntämisestä. Dataa
 
voidaan säilyttää kaikissa näissä vaiheissa.
 
 
 
Integraatioargumentti
 
Henkilötiedolla on monta lähdettä.
 
Yksi lähde sellaisenaan on heikko.
 
 
 
Yksityisyysargumentti
 
Henkilötiedon välitys ja jalostus on
 
yksityisyyden kannalta herkkä asia
 
 
 
Innovaatioargumentti
 
Uusien innovaatioiden kehittyminen
 
täytyy olla irrallista
 
vanhoista rakenteista.
 
 
 
My Datan lähteet ovat käytännössä joko organisaatioiden tai yksilöiden itse keräämää
 
henkilötietoa.
 
 
 
Henkilötietoa syntyy ja kertyy esimerkiksi näistä aihepiireistä: terveys, liikenne, energia, hallinto, itse kerätty tieto, pankki ja vakuutus, kauppa, verkkopalvelut sekä viestintä ja media.
 
 
 
Keskeinen osa
 
big datasta on ihmisten käyttäytymisdataa, joka perustuu asiakkaan tunnistamiseen.
 
Big data -keskustelussa korostetaan henkilötietojen analysoinnin ja
 
hyödyntämisen mahdollisuuksia organisaatioiden näkökulmasta. Ihmisten näkökulma
 
on supistettu usein vain vaatimukseen siitä, että yksityisyydensuoja
 
säilytetään. Asiakkaan kiinnostusta saati oikeutta omiin tietoihinsa ei big data
 
-keskustelussa ole juurikaan tuotu esille.
 
 
 
Henkilöihin liittyvässä tiedossa My Data ja big data ovat kaksi toisiaan täydentävää
 
näkökulmaa, ”ihmisnäkökulma” ja ”yritysnäkökulma”. My Data tuo läpinäkyvyyttä
 
ja sitä kautta hyväksyttävyyttä henkilöihin liittyvien datamassojen
 
käsittelyyn ja antaa konkreettisia keinoja yksityisyydensuojan toteuttamiseen.
 
Ilman tätä ihmisnäkökulmaa monet big datan hyödyntämismahdollisuudet katoavat,
 
koska ne eivät ole yksilöiden suojan kannalta hyväksyttäviä.
 
 
 
4.1.1 Itsensä mittaaminen
 
Quantified Self on maailmanlaajuisesti nopeasti kasvava trendi, jossa ihmiset
 
uusien laitteiden ja teknologian avulla keräävät, analysoivat ja hyödyntävät
 
kaikkea mahdollista omaan kehoon, ympäristöön ja toimintaan liittyvää dataa.
 
Älypuhelinsovellusten, puettavien sensorien, verkkopalveluiden ja muiden teknisten
 
apuneuvojen kanssa itsensä mittaajat keräävät dataa, joka liittyy esimerkiksi
 
ruokailuun, mielialoihin, fyysiseen ja henkiseen suorituskykyyn, ajan- ja
 
rahan käyttöön, sosiaaliseen vuorovaikutukseen, liikkumiseen, nukkumiseen
 
jne. Keskeisenä ajatuksena on yksilöllisen mittaustiedon hyötykäyttö terveyden,
 
hyvinvoinnin ja elämänlaadun parantamisessa.
 
 
 
Kyse ei ole vain terveys- ja teknologiaintoilijoiden liikkeestä. Urheilijat ovat jo
 
pitkään mitanneet muun muassa sykettä, tehoa ja omia suorituksiaan. Fysiologisessa
 
ja psykologisessa valmennuksessa ja kuntoutuksessa käytetään mittareita.
 
Tietotyöläiset saattavat mitata ajankäyttöä, stressitasoa ja erilaisen viestinnän ja
 
kommunikaation volyymeja. Askelmittareiden, verkkoyhteydellä varustettujen
 
henkilövaakojen, aktiivisuusrannekkeiden ja muiden vastaavien kulutuselektroniikkatuotteiden
 
sekä niihin liittyvien verkkopalveluiden kehittyminen on tuonut
 
itsensä mittaamisen monille osaksi arkipäivää.
 
 
 
Laki sosiaali- ja terveydenhuollon asiakastietojen sähköisestä käsittelystä
 
(Asiakastietolaki 2007) velvoittaa terveydenhuollon organisaatiot tallentamaan
 
potilastiedot valtakunnallisesti keskitettyyn arkistoon. Kansallinen Terveysarkisto
 
KanTa26 on lain pohjalta valmisteltu järjestelmä, joka mahdollistaa muun muassa
 
sähköisen reseptin ja tarjoaa kansalaisille käyttöliittymän omien potilastietojen
 
tarkasteluun. Laki ja järjestelmä eivät kuitenkaan anna potilaille mahdollisuutta
 
tallentaa omia potilastietojaan tai siirtää niitä toiseen sovellukseen. Lakia
 
ja KanTa -järjestelmän toteutusta tulisi tältä osin pikaisesti muuttaa niin, että se
 
toimisi My Data -periaatteiden mukaisesti.
 
  
 
=== Massadatan haasteet ja kehityskohteet ===
 
=== Massadatan haasteet ja kehityskohteet ===
  
Datan jakamisen haasteet. Arvostus Poldrak LUE!, Editorial. Sejnowski nn
+
Datan jakamisessa ei vielä ole vakiintuneita käytäntöjä, ja siksi siinä on omat haasteensa, joita on pohdittu paljon.  
 
 
Sejnowski nn. Big datan tärkeät aiheet tai haasteet. 1) Big dataa on runsaasti mutta se on hajanaista, tuottu useille menetelmillä ja eläinlajeilla ja vaikeasti standardoitavissa. 2) Asioita pitää oppia peilaamaan (käyttäytymis)vasteisiin, mittaaminen onkin muuttunut helpommaksi ja vähemmän invasiiviseksi. Mutta kausaalisuuksien löytäminen on haastavaa. 3) Tieto laboratorioiden välillä liikkuu yleensä kokousten ja artikkelien muodossa muuta dataa harvemmin jaetaan. 4) Datan kasvaessa sen analysointi vaikeutuu ja tarvitaan uusia algoritmejä. On myös opittava tuottamaan aineistoja, joista mielekkäiden yhteyksien löytäminen on mahdollista. 5) Nykyteoriat ovat selittäviä pikemmin kuin ennustavia ja perustuvat pieniin aineistoihin. Teorioista pitäisi tehdä selkeämpiä ja ennustavia vaikka se edellyttäisi tinkimistä matemaattisesta monimutkaisuudesta. Yleispäätelmä: tarvitaan kulttuurinmuutosta, matemaattisesti orientoituneita tutkijoita ja ennakkoluulottomia, kattavia ja testattavia teorioita.
 
 
<ref name="sejnowskia">Terrence J Sejnowski, Patricia S Churchland, and J Anthony Movshon; Putting big data to good use in neuroscience. Published as: Nat Neurosci. 2014 November ; 17(11): 1440–1441.</ref>
 
<ref name="sejnowskia">Terrence J Sejnowski, Patricia S Churchland, and J Anthony Movshon; Putting big data to good use in neuroscience. Published as: Nat Neurosci. 2014 November ; 17(11): 1440–1441.</ref>
 +
<ref name="poldrak"/>
 +
<ref name="gomez-martin">Alex Gomez-Marin, Joseph J Paton, Adam R Kampff, Rui M Costa & Zachary F Mainen; Big behavioral data: psychology, ethology and the foundations of neuroscience. Nature Neuroscience, Volume 17, number 11, November 2014, doi:10.1038/nn.3812</ref>
 +
<ref name="choudhury">Suparna Choudhury, Jennifer R. Fishman , Michelle L. McGowan and Eric T. Juengst; Big data, open science and the brain: lessons learned from genomics. doi: 10.3389/fnhum.2014.00239</ref>
 +
* Tutkimuskulttuuri ei tue datan jakamista. Esimerkiksi tietoa ryhmien välillä ei jaeta muuten kuin kokousten ja artikkelien muodossa.
 +
* Tutkijat pelkäävät muiden varastavan datassa piilottelevat skuupit.
 +
* On epäselvää, miten jaetaan meriitti jos yksi suunnittelee tutkimuksen, toinen tuottaa massadataa ja kolmas analysoi ja julkaisee tulokset.
 +
* Tutkimuslupa annettu vain alkuperäiseen tarkoitukseen ja on epäselvää, mitä voiko datalla tehdä muuta.
 +
* Big dataa on runsaasti mutta se on hajanaista, tuotettu useilla menetelmillä ja eläinlajeilla ja vaikeasti standardoitavissa.
 +
* Datan laatu on epävarma, koska on luotettava vieraaseen datantuottajaan.
 +
* Kausaalisuuksien löytäminen on haastavaa, vaikka asioita on opittu peilaamaan vasteisiin paremmin ja mittaaminen on muuttunut helpommaksi.
 +
* Henkilösuoja voi anonymisoinnista huolimatta murtua, jos datasta voidaan yksilöidä henkilöitä heidän ominaisuuksiensa perusteella. Datan kasvaessa sen analysointi vaikeutuu ja tarvitaan uusia algoritmejä ja niidenkin jakamista. On myös opittava tuottamaan aineistoja, joista mielekkäiden yhteyksien löytäminen on mahdollista.
 +
* Nykyteoriat ovat usein kuvailevia pikemmin kuin ennustavia ja perustuvat pieniin aineistoihin. Teorioista pitäisi tehdä selkeämpiä ja ennustavia vaikka se edellyttäisi tinkimistä matemaattisesta monimutkaisuudesta.
 +
* Rahoittajien ja lehtien on ruvettava vaatimaan datan jakamista tai se ei yleisty.
 +
* Yleispäätelmä: tarvitaan kulttuurinmuutosta, matemaattisesti orientoituneita tutkijoita ja ennakkoluulottomia, kattavia ja testattavia teorioita ja parempia teoreettisia viitekehyksiä sekä teknologista kehitystä.
  
 
Jotkin tekniikat tai aiheet ovat kalliita datan tuottamiseen, eikä sellaisia pysty käyttämään ellei ole tiedossa lähitulevaisuuden selkeä hyöty, jonka takia datantuottoon löytyy rahoittaja. Hankaluutena on, että usein hyödyt eivät ole etukäteen arvioitavissa. Konnektomiikka eli hermoston synapsirakenteen tutkiminen on esimerkki tällaisesta.  
 
Jotkin tekniikat tai aiheet ovat kalliita datan tuottamiseen, eikä sellaisia pysty käyttämään ellei ole tiedossa lähitulevaisuuden selkeä hyöty, jonka takia datantuottoon löytyy rahoittaja. Hankaluutena on, että usein hyödyt eivät ole etukäteen arvioitavissa. Konnektomiikka eli hermoston synapsirakenteen tutkiminen on esimerkki tällaisesta.  
 
<ref name="lichtman">Jeff W Lichtman, Hanspeter Pfister & Nir Shavit; The big data challenges of connectomics. Nature Neuroscience, Volume 17, number 11, November 2014, doi:10.1038/nn.3829</ref>
 
<ref name="lichtman">Jeff W Lichtman, Hanspeter Pfister & Nir Shavit; The big data challenges of connectomics. Nature Neuroscience, Volume 17, number 11, November 2014, doi:10.1038/nn.3829</ref>
  
Teoreettisten viitekehysten, koeasetelmien ja teknologisen kehityksen pitäisi kaikkien edistyä yhdessä tulosten saavuttamiseksi
+
Tärkeä haaste on pystyä uuttamaan merkitystä ulos jatkuvasti lisääntyvästä datasta, ja tämä näkyy monilla aloilla kuten käyttäytymmistieteellisessä neurobiologiassa. Tässä auttavat tietojen standardointi, tiedon uusiokäyttö ja syvempi yhteistyö kollegojen kanssa ovat tulevaisuuden suuntia.
<ref name="gomez-martin">Alex Gomez-Marin, Joseph J Paton, Adam R Kampff, Rui M Costa & Zachary F Mainen; Big behavioral data: psychology, ethology and the foundations of neuroscience. Nature Neuroscience, Volume 17, number 11, November 2014, doi:10.1038/nn.3812</ref>
+
<ref name="gomez-martin"/>
  
Tärkeä haaste on pystyä uuttamaan merkitystä ulos jatkuvasti lisääntyvästä datasta, ja tämä näkyy monilla aloilla kuten käyttäytymmistieteellisessä neurobiologiassa. Gomez-Marin.
+
Massadatan hyödyntäminen terveydenhuollossa tuo mahdollisuuksia sekä datan analysointiin perustuvalle tutkimukselle että diagnostiikalle. On tulossa mahdolliseksi jopa potilaskohtaiset tilastoanalyyit, jotka tuottavat henkilökohtaisia hoitosuosituksia tehokkaan laskennan, laajojen henkilöaineistojen ja tekoälyn avulla. Tässä kehityksessä tosin on monia käytännöllisiä, juridisia ja eettisiä kysymyksiä.
 +
<ref name="dilsizian"/>
  
Tietojen standardointi, tiedon uusiokäyttö ja syvempi yhteistyö kollegojen kanssa ovat tulevaisuuden suuntia. Gomez-Marin.
+
Yksityisyyttä voi suojata myös erottamalla yksilödatan ja yhteenvedot erillisiin tietojärjestelmiin.  
 +
<ref name="choudhury"/>
  
Potilastieto massadatana. Mining and advanced analysis
+
Geenitekniikat mahdollistavat entistä tarkemman analyysin, ja esimerkiksi infektioiden leviäminen yksilötasolla voidaan joskus selvittää patogeenien muuntumista tutkimalla.
of “big data” in health care provide the potential not only
 
to perform “in silico” research but also to provide “real time”
 
diagnostic and (potentially) therapeutic recommendations
 
based on empirical data. “On demand” access to highperformance
 
computing and large health care databases will
 
support and sustain our ability to achieve personalized medicine.
 
Dilsizian
 
 
 
Mahdollisuudet ja haasteen tekoälyn käytössä lääketieteessä Dilsizian
 
 
 
The combination of AI, big
 
data, and massively parallel computing offers the potential to
 
create a revolutionary way of practicing evidence-based, costeffective,
 
and personalized medicine. However, barriers to
 
adoption of AI technologies must be overcome from regulatory,
 
legal, cultural, and political perspectives––even when
 
technology solutions have matured.
 
Dilsizian
 
 
 
Open access ja data sharing on välttämätöntä. Mitä haasteita ja oppeja on löydetty.
 
<ref name="choudhury">Suparna Choudhury, Jennifer R. Fishman , Michelle L. McGowan and Eric T. Juengst; Big data, open science and the brain: lessons learned from genomics. doi: 10.3389/fnhum.2014.00239</ref>
 
 
 
Datan avaamisen haasteita Choudhury
 
* Tutkimuskulttuuri
 
* Muiden varastamat skuupit
 
* Miten jaetaan meriitti
 
* Tutkimuslupa annettu vain alkuperäiseen tarkoitukseen
 
* Potilas on vaarassa tunnistua kun kerätään paljon yksityiskohtaista dataa
 
* ym
 
 
 
Afurthersafeguardistohaveseparaterepositoriesfor
 
summaryleveldataandindividualdata,thelatterofwhichis
 
keptunderrestrictedaccess,asisspecifiedbyNIH’sGWASdata
 
accesspolicy(Kaye, 2011; McEwenetal., 2013). Thesameistrue
 
fortheHapMapprojectwhichusesCoriell’srepository,which
 
has specificaccessrulesandregulations.Oftenaccesstodata
 
is controlledbycommitteeswhomustdeterminewhetheruses
 
ofthedataareappropriate,ethical,andfollowpolicyguidelines
 
(McEwenetal., 2013).
 
Choudhury
 
 
 
Aswehaveshown,thefieldofgenomicsdoesnotprovidea
 
modelofstraightforwardsuccessindatasharingforbiomedical
 
research.However,itsexperiencesandprecedencecanhelpthe
 
neurosciencecommunityanticipatethechallengesandcomplex-
 
itiesitislikelytoface.
 
Choudhury
 
 
 
Information altruist: henkilö joka antaa oman biomedisiinisen datansa vapaaseen käyttöön (mm. Leena Palotie) Choudhury
 
{{defend|# |Etsi tietoa siitä, mitä ja miten Leena Palotie luovutti omaa dataansa tieteen käyttöön syövän tutkimiseksi|--[[Käyttäjä:Jouni|Jouni Tuomisto]] ([[Keskustelu käyttäjästä:Jouni|keskustelu]]) 31. toukokuuta 2015 kello 20.51 (UTC)}}
 
 
 
The recent advent of next-generation
 
sequencing technology allows the identification of trace-
 
able differences in the pathogen genome that are trans-
 
forming our ability to understand high-resolution disease
 
transmission, sometimes even down to the host-to-host
 
scale.
 
 
<ref name="kao">Rowland R. Kao, Daniel T. Haydon, Samantha J. Lycett, and Pablo R. Murcia; Omics: Fulfilling the Promise. [http://www.cell.com/trends/microbiology/abstract/S0966-842X%2814%2900046-8?_returnURL=http%3A%2F%2Flinkinghub.elsevier.com%2Fretrieve%2Fpii%2FS0966842X14000468%3Fshowall%3Dtrue Supersize me: how whole-genome sequencing and big data are transforming epidemiology]</ref>
 
<ref name="kao">Rowland R. Kao, Daniel T. Haydon, Samantha J. Lycett, and Pablo R. Murcia; Omics: Fulfilling the Promise. [http://www.cell.com/trends/microbiology/abstract/S0966-842X%2814%2900046-8?_returnURL=http%3A%2F%2Flinkinghub.elsevier.com%2Fretrieve%2Fpii%2FS0966842X14000468%3Fshowall%3Dtrue Supersize me: how whole-genome sequencing and big data are transforming epidemiology]</ref>
 
+
Bayes-malleja käytetään myös infektioepidemioiden tutkimisessa. Kun datankeruu ja analyysi paranevat, aletaan päästä reaaliaikaiseen seurantaan, ja tällöin esimerkiksi infektiotautien torjunnassa päästään aivan uudenlaiseen tilanteeseen.
 
+
<ref name="kao"/>
High-throughput sequencing: the technological revolution that followed the
 
Sanger sequencing technology that was used to generate the first complete
 
human genome, allowing for mass generation of sequences at increasingly
 
affordable costs. Currently broadly subdivided into next- or second-generation
 
sequencing (Illumina or 454) and now third generation (PacBio).
 
Kao
 
 
 
Bayesian model-based inference of infectious disease transmission.
 
Kao
 
 
 
Individual level
 
denominator data from at-risk populations are now being
 
collected, often on a daily basis, and also increasingly in
 
real time. Advances in computing power now provide the
 
engine for mathematical and statistical techniques by
 
which disparate datasets can be analyzed. Although we
 
are only now arriving at this point, the combination of big
 
data and tractable analytical techniques provides the opportunity
 
to transform our approach to controlling infectious
 
diseases in both epidemic and endemic contexts, with
 
whole-genome sequencing (WGS) playing a leading role.
 
Kao
 
  
 
=== Lopuksi ===
 
=== Lopuksi ===

Versio 3. kesäkuuta 2015 kello 20.52

Massadata kansanterveyden edistämisessä on katsausartikkeli Big Datasta. Se on kirjoitettu Duodecim-lehden teemanumeroon.

Kirjoitusohjeita (ks. myös N:\YMAL\Publications\In_progress\Tuomisto_Duodecim):

  • Valistuneelle kohdeyleisölle, joka ei kuitenkaan ole alan asiantuntija.
  • DL 15.5.2015 Eija Rautiaiselle ((at)duodecim.fi)
  • Teemanumeron katsauksen pituus saa olla enintään 1 800 sanaa + kuvat + taulukot.
  • Artikkelissa tulee olla otsikkosivu, jossa on tekijöiden nimet, oppiarvot ja virka-asemat sekä laitosten nimet. Yhteyskirjoittajan osalta mainitaan lisäksi postiosoite.
  • Katsausten väliotsikoinnissa käytetään kaksiportaista asteikkoa (väliotsikko ja rivinalkuinen kursivoitu alaotsikko).
  • Kuvat tulisi lähettää erillistiedostoina, mielellään giff- tai jpg -muodossa.
  • Katsausartikkelin tehtävä on kertoa lukijalle käsiteltävästä aiheesta moniulotteisesti, asiantuntevasti ja tasapainoisesti. Oppikirjamaisuutta tulee välttää ja katsauksen onkin oltava kriittinen ja tutkimushavaintoja kypsästi tulkitseva. Pelkkä tutkimusten referointi ei riitä, vaan kirjoittajan on jäsennettävä tutkimusten tuloksia mahdollisimman laajoihin yhteyksiin. Aiheen tulee kiinnostaa suurinta osaa lehden lukijoita, joten myös kirjoituksen tyylin pitää tukea yleistä ymmärrettävyyttä. Katsauksessa olisi kyettävä – aiheen mukaan – tarjoamaan tietoa ja tukea myös niihin valintoihin, joita käytännön lääkäri joutuu arkityössään tekemään, kuten hoidon porrastukseen.

Tiivistelmä

  • Tiivistelmä artikkelin sisällöstä suomeksi ja englanniksi. Maksimipituus 100 sanaa.

Johdanto

[1]

[2]

[3]

[4]

[5]

[6]

Massadata eli erittäin isot aineistot (big data) ovat yleistyneet viime vuosina nopeasti, ja tahti näyttää kiihtyvän teknologian myötä esimerkiksi molekyylibiologiassa. Kuitenkin massadatan hyödyntäminen on edennyt kliinisen lääketieteen alueella hitaammin kuin monilla muilla alueilla [7] [8]. Siksi onkin tarpeen luoda katsaus siihen, mitä massadata on, mihin sitä nykyään käytetään ja mitä haasteita ja mahdollisuuksia siihen liittyy. Artikkelissa tarkastellaan joitakin kiinnostavia ja ajankohtaisia piirteitä erityisesti kansanterveyden, lääketieteen ja yhteiskunnallisen päätöksenteon kannalta eikä niinkään pyritä koko aihepiirin kattamiseen.

Aluksi esitellään joitakin keskeisiä termejä ja nykyään käytössä olevia tietokantoja ja aineistoja erityisesti Suomen näkökulmasta. Sen jälkeen tarkastellaan menetelmiä ja käyttökohteita. Lopuksi pohditaan haasteita ja mahdollisuuksia.

Taulukko 1. Tärkeitä massadataan liittyviä termejä.
Termi Selite
Massadata Englanniksi big data. Suuret data-aineistot, joiden tilastollinen analyysi ei tahdo onnistua tavanomaisin menetelmin.
Avoin data Englanniksi open data tai open linked data. Tietoa, joka on saatavissa koneluettavassa muodossa maksutta ja niin, että tekijänoikeudet eivät rajoita sen jatkokäyttöä.
Omadata Englanniksi MyData. Henkilöä itseään koskeva data, jonka käytöstä hän voi itse päättää. Tällä hetkellä ollaan rakentamassa käytäntöjä, joiden avulla henkilö voi antaa tai evätä tietojensa käyttöluvan haluamilleen tahoille omadataoperaattorinsa välityksellä riippumatta siitä, missä ja kenen järjestelmissä tieto sijaitsee. Henkilö voi myös lukea ja joissain tapauksissa korjata tai täydentää omadataansa.
Keinodata Avoin data, joka ulkomuodoltaan ja tilastollisilta ominaisuuksiltaan muistuttaa jotakin arkaluontoista dataa kuten potilasaineistoa ilman, että siitä voisi kuitenkaan päätellä kenenkään todellisen henkilön tietoja. Keinodataa voi käyttää tutkimuskysymysten ja tilastoanalyysien muotoilemiseen ja alustavaan testaamiseen, ennen kuin analyysi ajetaan vastaavalla todellisella datalla.
Tietokide eli avoin muuttuja Englanniksi open variable tai info crystal. Koneluettavassa muodossa oleva vastaus johonkin täsmälliseen tutkimuskysymykseen. Tietokide on joukkoistettu, netissä jatkuvasti päivittyvä ja kiteytyvä kuvaus kaikesta siihen asti kerätystä tiedosta. Tietokide sisältää myös ymmärrettävät ja uskottavat perustelut sille, miten havaintodata ja muu tieteellinen tieto on jalostettu vastaukseksi kysymykseen. Tyypillisesti avoimen muuttujan vastaus on ehdollinen todennäköisyysjakauma ja sisältää tietoa myös niistä kausaalisista ja muista tekijöistä, jotka voivat vaikuttaa vastaukseen.
Datan pitkä häntä (taustadata) Englanniksi long-tail data. Tarkoittaa laajaa joukkoa pieniä aineistoja, jotka kokonsa tai merkityksensä puolesta jäävät myös helposti julkaisematta. Näitä ovat esimerkiksi erilliset tietokannat, nollatulokset ja eläinkoepäiväkirjat. [9]
Bioinformatiikka Monitieteinen ala, jossa laskennallisin menetelmin tutkitaan biologisia tietoaineistoja ja jalostetaan niitä paremmin käytettäväksi.

Lääketieteeseen liittyviä massadata-aineistoja

Lääketieteen ja terveyden kannalta tärkeitä massadata-aineistoja on maailmalla lukuisia, ja tässä voidaan vain raapaista pintaa ja esittää joitakin esimerkkejä. Zou ym. on hyvä katsaus näihin tietokantoihin. [10] DNA- ja genomitietokannat sisältävät tietoa lukuisista lajeista ja toimivat esim. genomireferenssinä (NCBI RefSeq), yksilövaihtelun kuvaajina (dbSNP) tai mikrobiomikantana (IMG/HMP). RNA-tietokannat (GENCODE) sisältävät tietoa proteiinia koodaavista ja muista RNA-molekyyleistä. Proteiinitietokannat (PDB) sisältävät tietoa proteiinisekvensseistä ja myös kolmiulotteisesta rakenteesta. Ekspressiotietokannat kuvaavat eri geenien ekspressiotasoja eri kudoksissa normaalitilanteessa tai erilaisissa olosuhteissa (TiGER) ja saattavat perustua niin RNA- kuin proteiinimittauksiinkin. Reittitietokannat (pathway databases) sisältävät tietoa metabolia-, signaalivälitys- ja säätelyreiteistä elimistössä (KEGG PATHWAY). Sairaustietokannat kuvaavat erilaisia sairauksia ja niiden hoitoja, erityisesti syövän osalta (The Cancer Genome Atlas TCGA).

Nämä tietokannat eivät ole ainoastaan datavarastoja alan tutkijoille, vaan on kehittynyt lukuisia menetelmiä ja lähestymistapoja rakentaa kokonaiskuvauksia massadatan pohjalta. Näitä voidaan kutsua nimellä systeemibiologia, jossa pyritään rakentamaan molekyyli- ja solutason kuvauksia asioiden yhteyksistä. [11]

Massadataksi voidaan luokitella myös useita kliinisiä tietokantoja, ja ne ovatkin nopeasti yleistyneet. Tämä onkin toivottavaa, koska edustavuus, systeemivirheiden tunnistaminen ja tilastollinen voima paranevat. Haasteena kuitenkin datan oikea käyttö ja tulkinta uudessa käyttötarkoituksessa. [12]

Hallinnollisiin tietokantoihin kerätään terveydenhuollon seurantaan ja ohjaukseen liittyvää tietoa, ja sitä voidaan myös joskus käyttää kliiniseen laadunvarmistukseen. Tyypillisesti potilastiedot ovat näissä niukat, rajoittuen esimerkiksi sukupuoleen, ikäryhmään ja asuinkuntaan. Kliiniset tietokannat sisältävät tarkempaa tietoa potilaiden sairauksista ja toimenpiteistä; näitä on Suomessa paremmin ja kattavammin kuin useimmissa muissa maissa (esim. Hilmo ja AvoHILMO, katso taulukko 2). Sairauslähtöiset tietokannat (esim. syöpärekisteri) ovat myös Suomessa laadukkaita. Hoitolähtöisiä tietokantoja kerätään mm. monien laajojen kliinisten tutkimusten yhteydessä.

Verkossa toimivat pilvipalvelut ovat myös tuoneet uudenlaisen näkökulman massadataan. Tietoaineistot ja analyysimenetelmät voidaan irrottaa niiden vanhoista fyysistä puitteistaan ja siirtää palveluiksi pilvipalvelimille. Niinpä on alettu ajatella palveluina sellaisetkin asiat kuin data (Data as a Service DaaS: julkiset aineistot ja biologiset tietokannat, GenBank, Ensembl, 1000 Genomes, Model Organism Encyclopedia of DNA Elements, Unigene), ohjelmistot (Software as a Service SaaS: genomianalyysipalvelu CloudAligner, sekvenssikartoitus CloudBLAST, geeniekspressiotyökalu Myrna), verkkotyötilat (Platform as a Service PaaS: ohjelmointi- ja analyysiympäristöt, sekvenssianalyysityötila Eoulsan, laaja-alaisen data-analyysin verkkotyötila Galaxy Cloud) tai jopa infrastruktuuri (Infrastructure as a Service IaaS: bioinformaatiolaskentakone Cloud BioLinux, virtuaalinen sekvenssianalysaattori CloVR). [13]

Taulukko 2. Suomalaisia massadatan esimerkkejä.
Datalähde Kuvaus Ylläpito ja linkki
AvoHILMO Perusterveydenhuollon avohoidon hoitoilmoitusrekisteri AvoHILMO on osa valtakunnallista sosiaali- ja terveydenhuollon Hilmoa. Sinne kerätään tietoa avohoidon käyntien syistä ja hoitotapahtumista. THL

https://www.thl.fi/avohilmo

Hilmo Hoitoilmoitusrekisteri Hilmo on rekisteri sairaaloissa tehdyistä diagnooseista ja toimenpiteistä. Hilmo sisältää tietoa esimerkiksi erikoissairaanhoidon avo- ja laitoshoidosta, perusterveydenhuollon laitoshoidosta, sosiaalihuollon laitos- ja asumispalveluista sekä kotihoidosta. THL

https://www.thl.fi/hilmo

Kanta Kansallinen terveysarkisto on palvelu, jonka kautta voi käyttää sähköistä reseptiä, lääketietokantaa, potilastiedon arkistoa ja tiedonhallintopalvelua. Omakanta on kansalaisten palvelu, jonka avulla voi katsoa omia sähköisiä resepti- ja terveystietojaan internetistä. THL, STM, Kela, Valvira, VRK

http://www.kanta.fi

OIVA OIVA on ympäristö- ja paikkatietopalvelu, joka tarjoaa ympäristöhallinnon tietojärjestelmiin tallennettua tietoa vesivaroista, pintavesien tilasta, pohjavesistä, eliölajeista, ympäristön kuormituksesta ja alueiden käytöstä sekä ympäristöön liittyviä paikkatietoaineistoja. SYKE

https://wwwp2.ymparisto.fi/scripts/oiva.asp

Opasnet Verkkotyötila ja tietokanta tietokiteiden tuottamiseen yhteiskunnallisen päätöksenteon tueksi. Tämän hetken aineistoa eniten liittyen ympäristöterveyteen (esim. ilmansaasteet, kaivosten riskit, juomavesi). THL

http://en.opasnet.org

Rokotusrekisteri Terveyden ja hyvinvoinnin laitos on perustamassa Suomeen valtakunnallista rokotusrekisteriä. Rokotustiedot kerätään suoraan potilastietojärjestelmistä. Rokotusrekisterin avulla THL arvioi kansallisen rokotusohjelman kattavuutta, turvallisuutta ja vaikuttavuutta. THL

https://www.thl.fi/rokotusrekisteri

Syöpärekisteri Suomen Syöpärekisteri ylläpitää tietokantaa kaikista Suomessa vuodesta 1953 alkaen todetuista syöpätapauksista. Se on myös syöpätautien tilastollinen ja epidemiologinen tutkimuslaitos, joka tekee tiivistä kotimaista ja kansainvälistä yhteistyötä. Suomen Syöpäyhdistys, THL

http://www.cancer.fi/syoparekisteri/

YHTI ja KUTI Ympäristöterveydenhuollon kohdetietojärjestelmä YHTI on terveydensuojelun, kuluttajaturvallisuuden ja tupakkavalvonnan yhteinen tietojärjestelmähanke. KUTI on Eviran vastuulla olevan elintarvikevalvonnan tietojärjestelmähanke. Yhdessä YHTI ja KUTI muodostavat ympäristöterveydenhuollon tietojärjestelmähankkeen. Valvira

http://www.valvira.fi/ymparistoterveys/ymparistoterveydenhuollon_kohdetietojarjestelma_yhti

Massadatan käyttökohteita ja menetelmiä

Massadatalla on lukuisia käyttökohteita, ja on luultavaa, että vain pieni osa niistä on tähän mennessä keksitty. Massadata muuttanee ihmisten ajattelutapaa ja ajan kuluessa tuottaa arvaamattomia hyötyjä. Käsityksemme saattaa muuttua jopa siitä, miten havainnot, data ja julkaiseminen kytkeytyvät toisiinsa. Tässä nostetaan joitakin esimerkkejä siitä, millaisiin asioihin massadataa on tähän mennessä käytetty ja millaisia hyötyjä siitä on saatu.

Yksittäisten koeasetelmien hypoteesien testaamiseen saadaan lisää tilastollista voimaa hyödyntämällä massadataa. Hypoteeseja voidaan rakentaa populaatioiden vastekirjosta. Laajoja aineistoja voidaan käyttää hypoteesien luomiseen. [14] Populaation ominaisuuksia voidaan kuvata rikkaasti. Riskitekijöitä voidaan tunnistaa ja ennustavia ja diagnostisia malleja voidaan rakentaa datan perusteella. Voidaan tarkastella erilaisten interventioiden vaikutusta kokeellisissa ja luonnollisissa asetelmissa. Terveyspalveluiden tuottajien vaikuttavuutta voidaan vertailla. Massadataa voidaan käyttää myös lisämateriaalina tulkittaessa jonkin toisen tutkimuksen aineistoa. Massadatan suurimmat edut ovat sen kattava luonne, laajat potilasaineistot ja mahdollisuus vertailla palveluntuottajia. Suurimmat haasteet puolestaan ovat osoittaa datan laatu ja siitä pääteltyjen syy-seuraussuhteiden uskottavuus. [12]

Kuva 1. Massadataa hyödyntävä tutkimussykli, jossa tarkastellaan esimerkiksi geenien ilmenemiseroja sairailla ja terveillä. Kuva muokattu artikkelista [10].

Geenitutkimus on yksi varhaisista massadatan tuottajista biolääketieteen alueella. Siksi on hyödyllistä tarkastella esimerkkinä tutkimussykliä, jossa erilaiset lähestymistavat vuorottelevat ja tukevat toisiaan (Kuva 1.). Sykli alkaa tuottamalla suuri määrä primääridataa esimerkiksi geeneistä, niiden ilmentymisestä tai proteiinien määristä kudoksessa. Nämä "omics"-tekniikat ovat lisääntyneet ja kehittyneet valtavasti viime vuosien aikana. Tarkempaan tarkasteluun otetaan ilmiöt, jotka eroavat kiinnostavien ryhmien välillä kuten sairaiden ja terveiden tai altistuneiden ja altistumattomien. [15]

Tämän jälkeen löytyneitä eroja ja niihin liittyviä geenejä tutkitaan korrelaatioanalyysillä ja haetaan esimerkiksi osittaiskorrelaatioita. Näiden avulla voidaan edelleen rakentaa syy-seurausverkosto, joka kuvaa kiinnostavien ilmiöiden välisiä suhteita. Verkostoa voidaan käyttää tilanteen tarkasteluun ja hypoteesien luomiseen. Lopulta voidaan suunnitella uusia koeasetelmia hypoteesien testaamiseksi ja tuottaa uutta dataa. [10]

Uuden sukupolven sekvensointimenetelmät (next generation sequencing NGS, near-whole genome sequencing) ovat tehneet edellä kuvatut tutkimussyklit mahdollisiksi ja viime aikoina vieläpä lisänneet selvästi niiden tehoa. Tämä on muuttanut biologian tutkimuksen perustoimintatapoja. Nykyään on käytössä useita uusia menetelmiä lähes koko genomin tutkimiseen, mukaan lukien sen DNA-muunnokset, histonimuunnokset, transkriptiotekijöiden sitoutumisen, kromatiinin kolmiulotteiset vuorovaikutukset, RNA-transkription ja monia muita. Lisäksi nämä menetelmät paranevat jatkuvasti. [16]

Erittäin kiinnostavia ovat myös uudet menetelmät, joilla on opittu yhdistämään kattava genomikartoitus ja vertailemaan tietoa geenien alleelien esiintymisestä geeni-, RNA- ja proteiinitasolla. Näiden alleelien ja niiden proteiinituotteiden suhteita voidaan tutkia, ja lisäksi voidaan tarkastella, onko translaatiotasolla vaihtelua splicingissa eli introni-eksoniliitoksissa. On siis mahdollista saada hyvin kattava kuva solutason säätelystä eri vaiheissa ja lukuisten geenien ja proteiinien osalta samanaikaisesti. [17]

Datan tuotantomäärät ovat siis valtavat, joten tarvitaan myös menetelmiä datamäärien hallitsemiseen. Yksi tärkeistä, nopeasti yleistyvistä menetelmistä ovat Bayes-verkot. Ne kuvaavat ilmiöiden välisiä syysuhteita johdonmukaisesti käyttämällä todennäköisyyksiä. Syyverkostoja voidaan tehokkaasti ja havainnollisesti kuvata nuolikaavioina, joissa nuolet osoittavat syyseuraussuhteita ilmiöiden välillä, ja vastaavasti nuolen puuttuminen osoittaa riippumattomuuden. Kaavioiden avulla voidaan myös monimutkaiset suhteet pilkkoa ja päätellä syy-seuraussuhteita yhdistyvien, erkaantuvien ja sarjassa olevien nuolten suhteista ilmiöiden välillä. [18]

Bayes-verkkojen etuna on myös, että tiedon lisääntyessä niitä voidaan päivittää eli tuottaa posteriorijakaumia. Niitä voidaan myös ehdollistaa eli tarkastella tilanteita, joissa jokin tietty ilmiö saa vain tietynlaisia arvoja (esim. entä-jos-tarkastelut). Aiemmin laskentakapsiteetti rajoitti Bayes-verkkojen kokoa ja hyödynnettävyyttä, mutta tilanne on parantunut sekä menetelmien että tietotekniikan myötä. [18]

Datamäärien paisuminen on paitsi aktivoinut kehittämään parempia tilastoanalyysimenetelmiä myös parantamaan datanhallinnan ja -jakamisen käytäntöjä. Niinpä onkin luotu periaatteita, joiden noudattamisella pyritään massadatan parempaan hyödyntämiseen. Datan pitää olla löydettävissä eli mahdollisimman avoimesti netissä jaettua. Sen pitää olla käyttöönotettavissa vähällä vaivalla ja hyvin kuvattua, jotta käyttäjä voi ymmärtää datan sisällön ja käyttökelpoisuuden uusiin tarkoituksiin. Sen käytön pitää olla myös sallittua eli turhia käyttörajoituksia tulee välttää. [9] Näiden datan avoimuuteen liittyvien vaatimusten lisäksi on myös tiedon käyttämiselle lisäohjeistuksia: tiedon käyttötarkoituksen tulee olla tiedossa, jotta käytön onnistumista voidaan arvioida sen suhteen; tietorakenteiden tulee olla johdonmukaiset ja siten uusiokäyttöä tukevat; ja tiedon käyttöprosessin tulee tukea sisällön kritiikkiä, jotta virheet huomataan nopeasti. [19]

Kliinisessä tutkimuksessa tunnistettuja massadaan liittyviä haasteita ovat mm. otoskoko, valintaharha, dokumentointi- ja tulkintaongelmat, puuttuvat havainnot, riippuvuusongelmat ja datanhallintaongelmat. [20] Ehkä yllättäenkin voi olla vaikea saada uskottavia tilastollisia merkitsevyyksiä, kun havaintojen lisäksi myös mitattuja attribuutteja on valtavia määriä.

Massadatan käsittelyn ja jalostamisen avuksi on tullut myös menetelmiä, jotka on alunperin kehitetty tavallisten aineistojen ja niiden välisten suhteiden kuvaamiseen. Näitä ovat mm. semanttiset verkot, ontologiat, aineistokuvailun viitekehykset (resource description framework, RDF) ja avoimen linkatun datan menetelmät. Lähitulevaisuudessa voi syntyä isojakin edistysaskelia, kun eri tieteenalojen tietokäytännöt leviävät uusiin käyttötarkoituksiin. [21]

Datan jakamisen käytännöt ja kustannukset neuropuolella [22]

Lääketieteessä massadatan käyttöä selvästi rajoittavat tärkeimpien tietoaineistojen eli potilastietojen arkaluontoisuus ja yksilönsuojan vaatimukset. Tähän ongelmaan on esitetty kiinnostava innovaatio eli keinodata. Se on dataa, joka muodostetaan potilasaineistosta siten, että se tilastollisilta ominaisuuksiltaan muistuttaa alkuperäistä dataa mutta ei kuvasta todellisia henkilöitä. Tällainen keinodata voidaan vapaasti julkaista avoimena datana, jolloin kuka tahansa voi sitä tutkia ja kehittää tilastokoodeja datan analysoimiseksi. Kun koodit ovat teknisesti toimivia ja alustavissa analyyseissä kiinnostaviksi osoittautuneita, alkuperäisen datan hallitsija voi vähällä vaivalla ajaa saman koodin alkuperäisellä datalla ja saada nopeasti uusia tuloksia sekä kunniaa itselleen ja koodin kehittäjälle. [23]

Koodin kehittäjän ei tarvitse välttämättä nähdä alkuperäisdataa lainkaan. Vaikka tämä ei koodin kehittäjän kannalta olekaan ihannetilanne, se on kuitenkin selvä edistysaskel nykytilanteeseen. Nykyäänhän edes datan olemassaolosta on hankala saada tietoa, ja itse datan saaminen onnistuu yleensä vain tutkimusyhteistyön ja kuukausia kestävän lupaprosessin kautta.

Suomalaisia strategioita

Suomessa on parin viime vuoden aikana julkaistu massadataan liittyviä selvityksiä tai strategioita. Tieto parantaa päätöksentekoa, ja tämä on ymmärretty niin tieteen kuin politiikankin foorumeilla. Tässä tarkastellaan kansanterveydellisestä näkökulmasta kolmea raporttia, mutta aloitteita on muitakin, kuten avoimen tieteen ja tutkimuksen ATT-hanke ja avoimen tiedon ohjelma.

Sote-tieto hyötykäyttöön. Sosiaali- ja terveystietojen tehokas käyttö on tunnistettu tärkeäksi kansanterveyttä ja myös kansantaloutta edistäväksi tekijäksi. Myös soteuudistuksessa odotetaan datanhallinnan tehostuvan ja parantavan toiminnan laatua. Strategia kohdistaa huomion tiedon keräämisestä tiedon hyödyntämiseen henkilön omassa elämässä sekä potilas- ja asiakastyössä ja tutkimuksessa. Tiedon jalostaminen, saatavuus, läpinäkyvyys, vertailukelpoisuus, ajantasaisuus ja uusiokäyttö korostuvat. Lisäksi edistetään kansalaisen mahdollisuuksia tuottaa itse tietoa omaan, terveysammattilaisten ja palveluntarjoajien käyttöön. Omadataa edistetään. [24]

Kanta- ja muita järjestelmiä kehitetään tuottamaan kansallista vertailutietoa ja tietoa päätöksenteon tueksi. Tavoite on haastava jopa kansainvälisesti, kun tarkoitus on saada valtakunnallinen reaaliaikainen tietovarasto, josta voidaan tuottaa hyödyllistä ja konkreettista tietoa sosiaali- ja terveyssektorille ja myös sen ohjaamiseen. Sosiaali- ja terveydenhuollossa isona massadatan tuottamisen esteenä ovat olleet pirstoutunut tietojärjestelmä ja kuntakohtaiset ratkaisut sekä toimittajariippuvuus. Näitä asioita pyritään nyt sote-ratkaisulla ja mm. Kanta-hankkeella ratkomaan.

Big data -strategia. Suomen massadatastrategiassa tunnistetaan useita vahvuuksia: rekisterit ovat hyviä ja osaaminen ja infra kunnossa. Massadata korostaa yhteistyön, luottamuksen ja avoimuuden merkitystä, ja näissä asioissa Suomi on edellä useimpia muita maita, vaikka massadataprojektit toistaiseksi ovat edenneet nopeammin esimerkiksi Yhdysvalloissa ja Isossa-Britanniassa. Erityisen hyviä mahdollisuuksia tunnistetaan itsehoidon, ennaltaehkäisyn ja ikääntyvien ihmisten palveluille. Vahvuuksia on bioinformatiikan, molekyylilääketieteen ja itsemittausteknologioiden alalla (esimerkiksi Suunto, Firstbeat ja Polar ovat alan pioneereja). [25]

Itsemittaus ja itsehoito on aiempaa helpompaa, kun ihmiset voivat mitata kotona verenpainettaan tai esimerkiksi seurata unensa laatua. Tämä voi vähitellen muuttaa terveydenhuollon painopistettä ja lääkärien työtä kohti erikoistunutta sairauksien hoitoa ja ennaltaehkäisyä.

Massadatalla nähdään Suomessa monenlaisia hyötyjä useille toimijoille. Hallinnon prosessit tehostuvat ja palvelut paranevat, läpinäkyvyys lisääntyy ja resurssit kohdentuvat tarkemmin. Yritysten innovaatiokyky, tehokkuus ja asiakaskokemus paranevat ja voitot lisääntyvät. Kansalaisten valinnanmahdollisuudet, palvelut ja omien tietojen hallinta paranevat. Yhteiskunnallisen osallistumisen mahdollisuudet lisääntyvät. Tutkimuksessa mahdollisuudet laajoihin hankkeisiin, tietojen yhdistelyyn, laadun parantamiseen ja vaikuttavuuteen paranevat. Kaikki nämä muutokset kuitenkin edellyttävät tietokokonaisuuksien hahmottamista, asiakaslähtöisyyttä, yhteistyötä, yhteisiä käytäntöjä, järjestelmäriippumattomuutta ja muutoksen resursointia. Esimerkiksi tutkimusdata on arvokasta pääomaa ja sen jakaminen on raskas päätös tutkijalle, ellei järjestelmä sitä tue. [25]

Omadata ja henkilötietojen hyödyntäminen. Omadata tarkoittaa sellaista ihmistä koskevaa tietoa, jonka käytöstä hän voi itse päättää. Henkilötietoa syntyy ja kertyy esimerkiksi näistä aihepiireistä: terveys, liikenne, energia, hallinto, itse kerätty tieto, pankki ja vakuutus, kauppa, verkkopalvelut sekä viestintä ja media. Esimerkiksi Kanta-järjestelmään ollaan kehittämässä Omakanta-palvelua rajapinnaksi terveystietojen katsomiseen ja itsekerätyn terveystiedon tallentamiseen.

Omadatassa pyritään yhdistämään ihmiskeskeisyys, tietojen hyödynnettävyys, yhteentoimivyys ja hajautettavuus sekä liiketoimintamahdollisuudet. Ihmisellä on siis oikeus ja mahdollisuus hallita tietojaan, pitää ne saatavilla koneluettavasti ja hajauttaa tai siirtää tietonsa haluamlleen ylläpitäjille. Tämä avaa uusille toimijoille ja liiketoiminnalle mahdollisuuksia ja rikkoo sektorirajoja. [26]

Omadatasta voi tulla avointa dataa tietoja yhdistelemällä ja anonymisoimalla tai siten, että ihminen päättää avata omia tietojaan vapaasti käytettäväksi. Tällaista data-altruismia on nähty Suomessakin, kun tutkija Leena Palotie avasi sairastuttuaan omia tietojaan tutkimukselle.

Jos omadataa opitaan integroimaan yksityisyyttä loukkaamatta ja ilman toimittajariippuvuutta, voi tuloksena olla aivan uudenlaisia palveluja ja tutkimusta. Omadataa on siis syytä tarkastella tiivisti osana massadatan kehitystä. Samalla tulee tunnistaa ja ratkaista terveystietojen hyötykäytön yksityisyyteen sekä sosiaalisiin ja eettisiin näkökulmiin liittyviä ongelmia.

Omadatan ihmisnäkökulma ja massadatan yritysnäkökulma täydentävät toisiaan. Omadata tuo läpinäkyvyyttä ja sitä kautta hyväksyttävyyttä henkilöihin liittyvien datamassojen käsittelyyn ja antaa konkreettisia keinoja yksityisyydensuojan toteuttamiseen. Tämä edistää massadatan kehittymistä.

Itsensä mittaaminen on maailmanlaajuisesti nopeasti kasvava trendi, jossa ihmiset uusien laitteiden ja teknologian avulla keräävät, analysoivat ja hyödyntävät kaikkea mahdollista omaan kehoon, ympäristöön ja toimintaan liittyvää dataa. Osa tästä on terveyden edistämisen tai hoidon kannalta hyödyllistä. Askelmittareiden, verkkoyhteydellä varustettujen henkilövaakojen, aktiivisuusrannekkeiden ja näihin liittyvien palvelujen kehitys tuo arkeen aivan uudenlaisia mahdollisuuksia terveempien käytäntöjen luomiseen.

Massadatan haasteet ja kehityskohteet

Datan jakamisessa ei vielä ole vakiintuneita käytäntöjä, ja siksi siinä on omat haasteensa, joita on pohdittu paljon. [27] [28] [29] [8]

  • Tutkimuskulttuuri ei tue datan jakamista. Esimerkiksi tietoa ryhmien välillä ei jaeta muuten kuin kokousten ja artikkelien muodossa.
  • Tutkijat pelkäävät muiden varastavan datassa piilottelevat skuupit.
  • On epäselvää, miten jaetaan meriitti jos yksi suunnittelee tutkimuksen, toinen tuottaa massadataa ja kolmas analysoi ja julkaisee tulokset.
  • Tutkimuslupa annettu vain alkuperäiseen tarkoitukseen ja on epäselvää, mitä voiko datalla tehdä muuta.
  • Big dataa on runsaasti mutta se on hajanaista, tuotettu useilla menetelmillä ja eläinlajeilla ja vaikeasti standardoitavissa.
  • Datan laatu on epävarma, koska on luotettava vieraaseen datantuottajaan.
  • Kausaalisuuksien löytäminen on haastavaa, vaikka asioita on opittu peilaamaan vasteisiin paremmin ja mittaaminen on muuttunut helpommaksi.
  • Henkilösuoja voi anonymisoinnista huolimatta murtua, jos datasta voidaan yksilöidä henkilöitä heidän ominaisuuksiensa perusteella. Datan kasvaessa sen analysointi vaikeutuu ja tarvitaan uusia algoritmejä ja niidenkin jakamista. On myös opittava tuottamaan aineistoja, joista mielekkäiden yhteyksien löytäminen on mahdollista.
  • Nykyteoriat ovat usein kuvailevia pikemmin kuin ennustavia ja perustuvat pieniin aineistoihin. Teorioista pitäisi tehdä selkeämpiä ja ennustavia vaikka se edellyttäisi tinkimistä matemaattisesta monimutkaisuudesta.
  • Rahoittajien ja lehtien on ruvettava vaatimaan datan jakamista tai se ei yleisty.
  • Yleispäätelmä: tarvitaan kulttuurinmuutosta, matemaattisesti orientoituneita tutkijoita ja ennakkoluulottomia, kattavia ja testattavia teorioita ja parempia teoreettisia viitekehyksiä sekä teknologista kehitystä.

Jotkin tekniikat tai aiheet ovat kalliita datan tuottamiseen, eikä sellaisia pysty käyttämään ellei ole tiedossa lähitulevaisuuden selkeä hyöty, jonka takia datantuottoon löytyy rahoittaja. Hankaluutena on, että usein hyödyt eivät ole etukäteen arvioitavissa. Konnektomiikka eli hermoston synapsirakenteen tutkiminen on esimerkki tällaisesta. [30]

Tärkeä haaste on pystyä uuttamaan merkitystä ulos jatkuvasti lisääntyvästä datasta, ja tämä näkyy monilla aloilla kuten käyttäytymmistieteellisessä neurobiologiassa. Tässä auttavat tietojen standardointi, tiedon uusiokäyttö ja syvempi yhteistyö kollegojen kanssa ovat tulevaisuuden suuntia. [29]

Massadatan hyödyntäminen terveydenhuollossa tuo mahdollisuuksia sekä datan analysointiin perustuvalle tutkimukselle että diagnostiikalle. On tulossa mahdolliseksi jopa potilaskohtaiset tilastoanalyyit, jotka tuottavat henkilökohtaisia hoitosuosituksia tehokkaan laskennan, laajojen henkilöaineistojen ja tekoälyn avulla. Tässä kehityksessä tosin on monia käytännöllisiä, juridisia ja eettisiä kysymyksiä. [7]

Yksityisyyttä voi suojata myös erottamalla yksilödatan ja yhteenvedot erillisiin tietojärjestelmiin. [8]

Geenitekniikat mahdollistavat entistä tarkemman analyysin, ja esimerkiksi infektioiden leviäminen yksilötasolla voidaan joskus selvittää patogeenien muuntumista tutkimalla. [31] Bayes-malleja käytetään myös infektioepidemioiden tutkimisessa. Kun datankeruu ja analyysi paranevat, aletaan päästä reaaliaikaiseen seurantaan, ja tällöin esimerkiksi infektiotautien torjunnassa päästään aivan uudenlaiseen tilanteeseen. [31]

Lopuksi

Loppunousu, jossa ei pelkästään tiivistetä katsauksen viestiä vaan liitetään se laajempiin yhteyksiin tai pohditaan tulevaisuudennäkymiä.

Massadata mahdollistaa isot kulttuurimuutokset, mutta tiedolliset läpimurrot perustuvat pikemminkin näistä muutoksista johtuvaan ymmärryksen paranemiseen.

Tarve lisääntyy massadatasta jalostetuille kehittyneemmille tieto-olioille kuten tiedokeille (avoimille muuttujille).

Kahnemannin ja Tverskyn nopea ja hidas ajattelu nousee tärkeäksi osaksi massadataa, koska mahdollisuudet tuottaa verkossa yhteisöllisesti hidasta, rationaalista ajattelua paranevat eksponentiaalisesti avoimen datan ja massadatan ansiosta. Tällöin on mahdollista lisätä hitaan ajattelun merkitystä yhteiskunnallisten päätösten perustana.

Kliinikon näkökulmasta on tulossa ainakin kaksi muutosta: erilaiset henkilökohtaisen terveystiedon keräämisen välineet lisääntyvät ja potilas voi tarjota lääkärille esimerkiksi kännykän keräämää kuukausien liikuntadataa, jonka merkitystä hoidon kannalta pitäisi pystyä arvioimaan. Toisaalta potilaat pystyvät tekemään entistä perusteellisempia oma-arviointeja ja vertailuja netissä ja tarjota omia diagnoosi- ja hoitoehdotuksiaan lääkärille. Lääkärin rooli on muuttumassa asiantuntija-auktoriteetista valmentajaksi.

Ydinasiat

  • Katsauksiin tulee laatia 3–5 erillistä virkettä, jotka lyhyesti tiivistävät kirjoituksen keskeisen sanoman. Virkkeet sijoitetaan Ydinasiat-tekstilaatikkoon.

Avainsanat

  • 4-8 kpl

Viitteet

  1. Christopher G. Chute, MD, DrPH, Mollie Ullman-Cullere, MS, MSE, Grant M. Wood, BS, Simon M. Lin, MD, Min He, PhD, and Jyotishman Pathak, PhD; Some experiences and opportunities for big data in translational research. doi:10.1038/gim.2013.121.
  2. Focus on big data. Nature Neuroscience editorial, Volume 17, number 11, November 2014
  3. Casey S. Greene, Jie Tan, Matthew Ung, Jason H. Moore and Chao Cheng; Big Data Bioinformatics. J. Cell. Physiol. 229: 1896–1900, 2014. DOI: 10.1002/jcp.24662
  4. Ian Maze, Li Shen, Bin Zhang, Benjamin A Garcia, Ningyi Shao, Amanda Mitchell, HaoSheng Sun, Schahram Akbarian, C David Allis & Eric J Nestler; Analytical tools and current challenges in the modern era of neuroepigenomics. Nature Neuroscience, Volume 17, number 11, November 2014, doi:10.1038/nn.3829
  5. Ivan Merelli, Horacio Pérez-Sánchez, Sandra Gesing, and Daniele D’Agostino; Managing, Analysing, and Integrating Big Data in Medical Bioinformatics: Open Problems and Future Perspectives, BioMed Research International. Volume 2014, Article ID 134023
  6. Terrence J Sejnowski, Patricia S Churchland & J Anthony Movshon; Putting big data to good use in neuroscience. Nature Neuroscience, Volume 17, number 11, November 2014, doi:10.1038/nn.3829
  7. 7,0 7,1 Steven E. Dilsizian & Eliot L. Siegel; Artificial Intelligence in Medicine and Cardiac Imaging: Harnessing Big Data and Advanced Computing to Provide Personalized Medical Diagnosis and Treatment. DOI 10.1007/s11886-013-0441-8
  8. 8,0 8,1 8,2 Suparna Choudhury, Jennifer R. Fishman , Michelle L. McGowan and Eric T. Juengst; Big data, open science and the brain: lessons learned from genomics. doi: 10.3389/fnhum.2014.00239
  9. 9,0 9,1 Adam R Ferguson, Jessica L Nielson, Melissa H Cragin, Anita E Bandrowski & Maryann E Martone; Big data from small data: data-sharing in the ‘long tail’ of neuroscience. Nature Neuroscience, Volume 17, number 11, November 2014
  10. 10,0 10,1 10,2 Dong Zou, Lina Ma, Jun Yu, Zhang Zhang; Biological Databases for Human Research. Genomics Proteomics Bioinformatics 13 (2015) 55–63
  11. Md. Altaf-Ul-Amin, Farit Mochamad Afendi, Samuel Kuria Kiboi, and Shigehiko Kanaya; Systems Biology in the Context of Big Data and Networks
  12. 12,0 12,1 J. A. Cook and G. S. Collins; The rise of big clinical databases. DOI: 10.1002/bjs.9723
  13. Lin Dai, Xin Gao, Yan Guo, Jingfa Xiao and Zhang Zhang; Bioinformatics clouds for big data manipulation
  14. John P Cunningham & Byron M Yu; Dimensionality reduction for large-scale neural recordings. doi:10.1038/nn.3776
  15. Hamid Bolouri; Modeling genomic regulatory networks with big data
  16. Jaehoon Shin, Guo-li Ming & Hongjun Song; Decoding neural transcriptomes and epigenomes via high-throughput sequencing. Nature Neuroscience, Volume 17, number 11, November 2014, doi:10.1038/nn.3829
  17. Robert R Kitchen, Joel S Rozowsky, Mark B Gerstein & Angus C Nairn; Decoding neuroproteomics: integrating the genome, translatome and functional anatomy. Nature Neuroscience, Volume 17, number 11, November 2014, doi:10.1038/nn.3829
  18. 18,0 18,1 Changwon Yoo, Luis Ramirez, Juan Liuzzi; Big Data Analysis Using Modern Statistical and Machine Learning Methods in Medicine. http://dx.doi.org/10.5213/inj.2014.18.2.50
  19. Tuomisto, Jouni T.; Pohjola, Mikko; Pohjola, Pasi. Avoin päätöksentekokäytäntö voisi parantaa tiedon hyödyntämistä. Yhteiskuntapolitiikka 1/2014, 66-75. http://urn.fi/URN:NBN:fi-fe2014031821621
  20. Weiqi Wang, PhD, Eswar Krishnan, MD, MPH; Big Data and Clinicians: A Review on the State of the Science.
  21. Hongyan Wu, Atsuko Yamaguchi; Semantic Web technologies for the big data in life sciences. BioScience Trends. 2014; 8(4):192-201.
  22. Russell A Poldrack & Krzysztof J Gorgolewski; Making big data open: data sharing in neuroimaging. Nature Neuroscience, Volume 17, number 11, November 2014, doi:10.1038/nn.3829
  23. Karvanen J. 2014. ReplicaX - R code for data replica generation. http://www.tilastotiede.fi/ReplicaX/
  24. Tieto hyvinvoinnin ja uudistuvien palvelujen tukena. Sote-tieto hyötykäyttöön -strategia 2020. Sosiaali- ja terveysministeriön julkaisuja 2015. ISBN 978-952-00-3548-8 [1]
  25. 25,0 25,1 Taru Rastas, Emil Asp (toim.). Big datan hyödyntäminen. Liikenne- ja viestintäministeriön julkaisuja 20 / 2014. ISBN 978-952-243-407-4 [2]
  26. Antti Poikola, Kai Kuikkaniemi, Ossi Kuittinen. MyData - johdatus ihmiskeskeiseen henkilötiedon hyödyntämiseen. Liikenne- ja viestintäministeriö 2014. ISBN 978-952-243-418-0 [3]
  27. Terrence J Sejnowski, Patricia S Churchland, and J Anthony Movshon; Putting big data to good use in neuroscience. Published as: Nat Neurosci. 2014 November ; 17(11): 1440–1441.
  28. Viittausvirhe: Virheellinen <ref>-elementti; viitettä poldrak ei löytynyt
  29. 29,0 29,1 Alex Gomez-Marin, Joseph J Paton, Adam R Kampff, Rui M Costa & Zachary F Mainen; Big behavioral data: psychology, ethology and the foundations of neuroscience. Nature Neuroscience, Volume 17, number 11, November 2014, doi:10.1038/nn.3812
  30. Jeff W Lichtman, Hanspeter Pfister & Nir Shavit; The big data challenges of connectomics. Nature Neuroscience, Volume 17, number 11, November 2014, doi:10.1038/nn.3829
  31. 31,0 31,1 Rowland R. Kao, Daniel T. Haydon, Samantha J. Lycett, and Pablo R. Murcia; Omics: Fulfilling the Promise. Supersize me: how whole-genome sequencing and big data are transforming epidemiology
  • Kirjallisuusviitteiden esittämisessä noudatetaan Vancouver-järjestelmää (tekstiin numeroidut viitteet) ja kirjallisuusluettelo laaditaan lehden yleisten kirjoitusohjeiden mukaan, esim. Dagfinrud H, Kvien TK, Hagen KB. Physiotherapy interventions for ankylosing spondylitis. The Cochrane Database of Systematic Rewievs 2013, Issue 4. Art. No.:CD002822. DOI: 10.1002/14651858.CD2822.pub2. Teemanumeron katsausta ei tulisi kuormittaa viitteillä (max. 30).


Tämä sivu on tiedonmuru. Tämä sivu poikkeaa muusta Opasnetin sisällöstä sen suhteen ettei se ole vapaasti muokattavissa. Käyttäessäsi sivun sisältämää tietoa muualla ole hyvä ja viittaa tähän sivuun näin:

Jouni T. Tuomisto: Massadata kansanterveyden edistämisessä. Opasnet 2015. Viitattu 07.05.2024. (, Duodecim)