Massadata kansanterveyden edistämisessä

Kohteesta Opasnet Suomi
Versio hetkellä 31. toukokuuta 2015 kello 10.14 – tehnyt Jouni (keskustelu | muokkaukset) (Muita väliotsikoita)
Loikkaa: valikkoon, hakuun

Massadata kansanterveyden edistämisessä on katsausartikkeli Big Datasta. Se on kirjoitettu Duodecim-lehden teemanumeroon.

Kirjoitusohjeita (ks. myös N:\YMAL\Publications\In_progress\Tuomisto_Duodecim):

  • Valistuneelle kohdeyleisölle, joka ei kuitenkaan ole alan asiantuntija.
  • DL 15.5.2015 Eija Rautiaiselle ((at)duodecim.fi)
  • Teemanumeron katsauksen pituus saa olla enintään 1 800 sanaa + kuvat + taulukot.
  • Artikkelissa tulee olla otsikkosivu, jossa on tekijöiden nimet, oppiarvot ja virka-asemat sekä laitosten nimet. Yhteyskirjoittajan osalta mainitaan lisäksi postiosoite.
  • Katsausten väliotsikoinnissa käytetään kaksiportaista asteikkoa (väliotsikko ja rivinalkuinen kursivoitu alaotsikko).
  • Kuvat tulisi lähettää erillistiedostoina, mielellään giff- tai jpg -muodossa.
  • Katsausartikkelin tehtävä on kertoa lukijalle käsiteltävästä aiheesta moniulotteisesti, asiantuntevasti ja tasapainoisesti. Oppikirjamaisuutta tulee välttää ja katsauksen onkin oltava kriittinen ja tutkimushavaintoja kypsästi tulkitseva. Pelkkä tutkimusten referointi ei riitä, vaan kirjoittajan on jäsennettävä tutkimusten tuloksia mahdollisimman laajoihin yhteyksiin. Aiheen tulee kiinnostaa suurinta osaa lehden lukijoita, joten myös kirjoituksen tyylin pitää tukea yleistä ymmärrettävyyttä. Katsauksessa olisi kyettävä – aiheen mukaan – tarjoamaan tietoa ja tukea myös niihin valintoihin, joita käytännön lääkäri joutuu arkityössään tekemään, kuten hoidon porrastukseen.

Tiivistelmä

  • Tiivistelmä artikkelin sisällöstä suomeksi ja englanniksi. Maksimipituus 100 sanaa.

Johdanto

Muita väliotsikoita

Artikkelissa esitetään katsaus joihinkin massadatan keskeisiin ja ajankohtaisiin piirteisiin erityisesti kansanterveyden, lääketieteen ja yhteiskunnallisen päätöksenteon kannalta. Katsauksessa ei siis pyritä tämän laajan aihepiirin kattamiseen vaan kiinnostavien kysymysten esiinnostamiseen.

  • Mitä on big data eli massadata?
  • Haasteita ja mahdollisuuksia kansanterveyden tutkimuksessa.
  • Suomalaisten tietoaineistojen mahdollisuudet.
  • Henkilötietojen suojaamisen haasteet.
  • Omadata eli MyData
Tietolaatikko
Termi Selite
Massadata Englanniksi big data. Suuret data-aineistot, joiden tilastollinen analyysi ei tahdo onnistua tavanomaisin menetelmin.
Avoin data Englanniksi open data tai open linked data. Tietoa, joka on saatavissa koneluettavassa muodossa maksutta ja niin, että tekijänoikeudet eivät rajoita sen jatkokäyttöä.
Omadata Englanniksi MyData. Henkilöä itseään koskeva data, jonka käytöstä hän voi itse päättää. Tällä hetkellä ollaan rakentamassa käytäntöjä, joiden avulla henkilö voi antaa tai evätä tietojensa käyttöluvan haluamilleen tahoille omadataoperaattorinsa välityksellä riippumatta siitä, missä ja kenen järjestelmissä tieto sijaitsee. Henkilö voi myös lukea ja joissain tapauksissa korjata tai täydentää omadataansa.
Keinodata Avoin data, joka ulkomuodoltaan ja tilastollisilta ominaisuuksiltaan muistuttaa jotakin arkaluontoista dataa kuten potilasaineistoa ilman, että siitä voisi kuitenkaan päätellä kenenkään todellisen henkilön tietoja. Keinodataa voi käyttää tutkimuskysymysten ja tilastoanalyysien muotoilemiseen ja alustavaan testaamiseen, ennen kuin analyysi ajetaan vastaavalla todellisella datalla.
Tietokide eli avoin muuttuja Englanniksi open variable tai info crystal. Koneluettavassa muodossa oleva vastaus johonkin täsmälliseen tutkimuskysymykseen. Tietokide on netissä jatkuvasti päivittyvä ja kiteytyvä kuvaus kaikesta siitä tiedosta, joka kyseisestä kysymyksestä on ehditty kerätä, samaan tapaan kuin Wikipedia-artikkeli. Tietokide sisältää myös ymmärrettävät ja uskottavat perustelut sille, miten havaintodata ja muu tieteellinen tieto on jalostettu vastaukseksi kysymykseen. Tyypillisesti avoimen muuttujan vastaus on ehdollinen todennäköisyysjakauma ja sisältää tietoa myös niistä kausaalisista ja muista tekijöistä, jotka voivat vaikuttaa vastaukseen.
Datan pitkä häntä (taustadata) Englanniksi long-tail data. Tarkoittaa laajaa joukkoa pieniä aineistoja, jotka kokonsa tai merkityksensä puolesta jäävät myös helposti julkaisematta. Näitä ovat esimerkiksi erilliset tietokannat, nollatulokset ja eläinkoepäiväkirjat. Ferguson nn3838 LUE!

Datan jakamisen parhaat käytännöt Ferguson Box 2. Wang LUE!

Semantic web, ontologia, linked data Wu LUE! (Merelli; tekninen)

Bayes-verkot Yoo LUE!

Gene regulatory networks Bolouri; metodipaperi

Datan jakamisen käytännöt ja kustannukset neuropuolella Poldrak

Datan jakamisen haasteet. Arvostus Poldrak LUE!, Editorial. Sejnowski nn

Terveysdatan kannalta tärkeitä massadatan tietokantoja.

  • World map, KAMPO, JAMU, Tea Pot (Altaf-Ul-Amin et al)

Network analysis Omics data -> Find DEGs -> Calculate partial correlation between DEGs -> Network building -> Network interrogation -> Design new experiments to test hypotheses. (Dong et al)

←--#: . Tämä kuva pitäisi suomentaa ja hakea kaaviossa olevia kuvituskuvat suoraan artikkelista Dong et al mahdollisimman hyvällä resoluutiolla. Kuvia SAA KÄYTTÄÄ koska ne on julkaistu CC-BY-NC. Tämän voisi rakentaa Google driveen jotta nuolet ja tekstit saadaan vektorimuodossa ja kuvituskuvat rasterina samaan kuvaan. --Jouni Tuomisto (keskustelu) 30. toukokuuta 2015 kello 08.18 (UTC) (type: truth; paradigms: science: defence)

←--#: . Kaikki viitteet tiedostossa BigData.zip pitäisi kirjoittaa <ref>-muotoon. --Jouni Tuomisto (keskustelu) 31. toukokuuta 2015 kello 10.14 (UTC) (type: truth; paradigms: science: defence)

Sejnowski nn. Big datan tärkeät aiheet tai haasteet. 1) Big dataa on runsaasti mutta se on hajanaista, tuottu useille menetelmillä ja eläinlajeilla ja vaikeasti standardoitavissa. 2) Asioita pitää oppia peilaamaan (käyttäytymis)vasteisiin, mittaaminen onkin muuttunut helpommaksi ja vähemmän invasiiviseksi. Mutta kausaalisuuksien löytäminen on haastavaa. 3) Tieto laboratorioiden välillä liikkuu yleensä kokousten ja artikkelien muodossa muuta dataa harvemmin jaetaan. 4) Datan kasvaessa sen analysointi vaikeutuu ja tarvitaan uusia algoritmejä. On myös opittava tuottamaan aineistoja, joista mielekkäiden yhteyksien löytäminen on mahdollista. 5) Nykyteoriat ovat selittäviä pikemmin kuin ennustavia ja perustuvat pieniin aineistoihin. Teorioista pitäisi tehdä selkeämpiä ja ennustavia vaikka se edellyttäisi tinkimistä matemaattisesta monimutkaisuudesta. Yleispäätelmä: tarvitaan kulttuurinmuutosta, matemaattisesti orientoituneita tutkijoita ja ennakkoluulottomia, kattavia ja testattavia teorioita.

Jotkin tekniikat tai aiheet ovat kalliita datan tuottamiseen, eikä sellaisia pysty käyttämään ellei ole tiedossa lähitulevaisuuden selkeä hyöty, jonka takia datantuottoon löytyy rahoittaja. Hankaluutena on, että usein hyödyt eivät ole etukäteen arvioitavissa. Konnektomiikka eli hermoston synapsirakenteen tutkiminen on esimerkki tällaisesta. Lichtman et al

Teoreettisten viitekehysten, koeasetelmien ja teknologisen kehityksen pitäisi kaikkien edistyä yhdessä tulosten saavuttamiseksi Gomez-Marin.

Tärkeä haaste on pystyä uuttamaan merkitystä ulos jatkuvasti lisääntyvästä datasta, ja tämä näkyy monilla aloilla kuten käyttäytymmistieteellisessä neurobiologiassa. Gomez-Marin.

Tietojen standardointi, tiedon uusiokäyttö ja syvempi yhteistyö kollegojen kanssa ovat tulevaisuuden suuntia. Gomez-Marin.

Lopuksi

Loppunousu, jossa ei pelkästään tiivistetä katsauksen viestiä vaan liitetään se laajempiin yhteyksiin tai pohditaan tulevaisuudennäkymiä.

Massadata mahdollistaa isot kulttuurimuutokset, mutta tiedolliset läpimurrot perustuvat pikemminkin näistä muutoksista johtuvaan ymmärryksen paranemiseen.

Tarve lisääntyy massadatasta jalostetuille kehittyneemmille tieto-olioille kuten tiedokeille (avoimille muuttujille).

Kahnemannin ja Tverskyn nopea ja hidas ajattelu nousee tärkeäksi osaksi massadataa, koska mahdollisuudet tuottaa verkossa yhteisöllisesti hidasta, rationaalista ajattelua paranevat eksponentiaalisesti avoimen datan ja massadatan ansiosta. Tällöin on mahdollista lisätä hitaan ajattelun merkitystä yhteiskunnallisten päätösten perustana.

Kliinikon näkökulmasta on tulossa ainakin kaksi muutosta: erilaiset henkilökohtaisen terveystiedon keräämisen välineet lisääntyvät ja potilas voi tarjota lääkärille esimerkiksi kännykän keräämää kuukausien liikuntadataa, jonka merkitystä hoidon kannalta pitäisi pystyä arvioimaan. Toisaalta potilaat pystyvät tekemään entistä perusteellisempia oma-arviointeja ja vertailuja netissä ja tarjota omia diagnoosi- ja hoitoehdotuksiaan lääkärille. Lääkärin rooli on muuttumassa asiantuntija-auktoriteetista valmentajaksi.

Ydinasiat

  • Katsauksiin tulee laatia 3–5 erillistä virkettä, jotka lyhyesti tiivistävät kirjoituksen keskeisen sanoman. Virkkeet sijoitetaan Ydinasiat-tekstilaatikkoon.

Avainsanat

  • 4-8 kpl

Viitteet

  • Kirjallisuusviitteiden esittämisessä noudatetaan Vancouver-järjestelmää (tekstiin numeroidut viitteet) ja kirjallisuusluettelo laaditaan lehden yleisten kirjoitusohjeiden mukaan, esim. Dagfinrud H, Kvien TK, Hagen KB. Physiotherapy interventions for ankylosing spondylitis. The Cochrane Database of Systematic Rewievs 2013, Issue 4. Art. No.:CD002822. DOI: 10.1002/14651858.CD2822.pub2. Teemanumeron katsausta ei tulisi kuormittaa viitteillä (max. 30).


Tämä sivu on tiedonmuru. Tämä sivu poikkeaa muusta Opasnetin sisällöstä sen suhteen ettei se ole vapaasti muokattavissa. Käyttäessäsi sivun sisältämää tietoa muualla ole hyvä ja viittaa tähän sivuun näin:

Jouni T. Tuomisto, Antti Poikola: Massadata kansanterveyden edistämisessä. Opasnet 2015. Viitattu 07.05.2024. (, Duodecim)