Keskustelu:Massadata kansanterveyden edistämisessä

Lausunto käsikirjoitusversiosta 3.8.2015

Kappaleessa Kliinistä ja kansanterveydellistä massadataa on mainittu ensimmäisenä Hilmo ja Avohilmo. Kannattaisi mainita ensimmäisenä syöpärekisteri. Avohilmon tietojen nykyiset tallennusratkaisut potilastietojärjestelmissä ovat niin huonosti toteutettuja ja data niin huonolaatuista, että Avohilmoa ei kannata mainita tässä kohdassa. Se voitaisiin mainita artikkelissa myöhemmin tyyliin ”jos Avohilmon tietosisällöt pystyttäisiin keräämään automaattisesti potilaskertomuksista ja tietojen kirjaaminen saataisiin helpoksi ja luotettavaksi, käytettävissä olisi arvokas massadata-aineisto”.

←--#: . Hilmoa ja Avohilmoa painettu tekstissä vähäisempään rooliin. --Jouni Tuomisto (keskustelu) 15. syyskuuta 2015 kello 14.35 (UTC) (type: truth; paradigms: science: defence)

Merkittäviä suomalaisia laatuanalytiikka-aineistoja lienevät PERFECT sairaanhoitopiirien vertailussa ja Intensiumin tehohoidon raportointijärjestelmä. Nämä ovat enemmän esimerkkejä datan hyödyntämisestä kuin varsinaisesta massadatasta

Ruotsin sairaus- ja toimenpidekohtaiset rekisterit voisi mainita [1] esimerkkinä onnistuneesta tiedonkeruusta. Artikkelissa jää melko maininnalle potilaskertomuksiin tallennetun tiedon analysointi. Ulkomaisia hankkeita, joissa potilaskertomusdataa käytetään, voisi mainita esimerkkeinä (esim. QResearch [2]). Potilaskertomusdatan laatua ja datan validointia kannattaisi kommentoida. KanTa-arkiston potilaan tiedonhallintapalvelu, joka tulee sisältämään koosteen rakenteisista potilastiedoista, tulee olemaan Suomen arvokkain massadata-aineisto, edellyttäen että datan laatu riittävän hyvä. Tiedonhallintapalvelun rakenteisten tietojen, omadatan ja näihin liitettyjen, kohdistettuja tietoja sisältävien (ja niitä aktiivisesti kysyvien) sairausrekistereiden yhdistelmä voisi olla ihanteellinen tapa kerätä rakenteista massadataa.

←--#: . Lisätty maininta. --Jouni Tuomisto (keskustelu) 15. syyskuuta 2015 kello 14.35 (UTC) (type: truth; paradigms: science: defence)

Maailmalla keskustellaan aloitteista ja EU-direktiivistä datan saatavuuden parantamiseksi, ks. BMJ: [3], Alltrials: [4]. Ks. myös Cochrane Collaborationin Linked data –projekti: [5] Tulisiko/voitaisiinko Suomeen perustaa avoimen terveysdatan portaali USA:n tyyliin [6]? IBM:n Watson lienee maailman resursoiduin hanke, jossa analysoidaan julkaistua terveystietoa. Se ansaitsisi artikkelissa maininnan tai ainakin viitteen.

Käsitettä tietokide voitaisiin ehkä havainnollistaa kuvaamalla se kliinisen kysymyksen PICO-rakenteella (määritellään potilasryhmä, interventio, vertailukohde ja hoidon tulos tai toivottu vaikutus – patient, intervention, comparator, outcome). Kysymyksessä olisi reaaliaikainen meta-analyysi niiden tutkimusten tuloksista, jotka käsittelevät kysymyksen aihetta. Tulevaisuudessa vastaus voitaisiin tuottaa sekä keräämällä tulokset julkaistuista tutkimuksista että analysoimalla suoraan avointa alkuperäisdataa.

⇤--#: . PICO on viitekehyksenä hyödyllinen, mutta tuskin lukijoille entuudestaan tuttu. Myös sen selittäminen veisi tilaa, vaikka tavoitteena on lyhentäminen. en:PICO process [7]. Lisäksi on muitakin hakurakenteita kuin PICO [8], eikä tähän keskusteluun ole tilaa. --Jouni Tuomisto (keskustelu) 15. syyskuuta 2015 kello 14.35 (UTC) (type: truth; paradigms: science: attack)

Yksi esimerkki tavasta, jolla massadataa voitaisiin käyttää kliinisessä päätöksenteossa, on esitetty artikkelissa Starren et al. Siinä potilaskertomukseen liitetty päätöksentuki tekisi kohdennettuja kyselyjä pilvipalveluna toimivaan big data –sovellukseen (omic ancillary system). Tämäntyyppinen järjestelmä voisi toimia yleisemminkin big datan kliinisenä hyödyntämistapana (tehtäisiin kysely kaikkien aikaisempien potilaiden tietokantaan ja tehtäisiin ennuste yksittäiselle potilaalle vertaamalla häntä aikaisempiin potilaisiin). Päätöksentukijärjestelmä "päättäisi", milloin massadatatietokantaan tehdään kysely.

←--#: . Idea mainittu lyhyesti. --Jouni Tuomisto (keskustelu) 15. syyskuuta 2015 kello 14.35 (UTC) (type: truth; paradigms: science: defence)

Kappaleessa pilvipalveluista luetellaan joukko lyhenteitä. Jos nämä halutaan mainita, parempi esitysmuoto voisi olla taulukko. Tämä lisäisi tekstin luettavuutta. Taulukosta puuttuu käsite Analytics as a Service (AaaS), joka on artikkelin aihepiirin kannalta ehkä tärkein käsite. Lukijaa voisi kiinnostaa, millaisia ohjelmistopalveluja ja palvelimia massadatan analysointi edellyttää. Millaisia palveluita on Suomessa tai muualla maailmassa? CSC [9] kannattaisi mainita. Onko muita vastaavia palveluja? Ovatko uudet massadatatekniikat tuomassa jotakin uutta olemassas olevien tietoaineistojen analysointiin?

←--#: . Tekstiä tiivistetty ja CSC mainittu. --Jouni Tuomisto (keskustelu) 15. syyskuuta 2015 kello 14.35 (UTC) (type: truth; paradigms: science: defence)

Taulukko 1: Keinodatan englanninkielinen vastine tulisi esittää

←--#: . Lisätty. --Jouni Tuomisto (keskustelu) 15. syyskuuta 2015 kello 14.35 (UTC) (type: truth; paradigms: science: defence)

Taulukko 2: Taulukosta puuttuu useita rekistereitä (mm. kuolinsyyrekisteri, Kelan aineistot). Mitkä ovat arvokkaimmat suomalaiset rekisterit. Biopankit voitaisiin mainita uusina massadatan lähteinä.

←--#: . Lisätty. --Jouni Tuomisto (keskustelu) 15. syyskuuta 2015 kello 14.35 (UTC) (type: truth; paradigms: science: defence)

Bayes-verkot mainitaan. Lukijoille saattavat olla tuttuja Olli-Pekka Ryynäsen ryhmän työt [10]

←--#: . Viite lisätty. --Jouni Tuomisto (keskustelu) 15. syyskuuta 2015 kello 14.35 (UTC) (type: truth; paradigms: science: defence)

Artikkelin kuva

Missään ei selitetä, mikä on geeniverkko, eikä myöskään selitetä, mitä tarkoitetaan geeniverkon tutkimisella. Kuva ei kerro, mikä on geeniverkon tutkimisen tulos. Kuvassa yläosassa mainitaan massadataa tuottavat kokeet ja niiden alapuolella biokemiallinen data, jota nämä kokeet tuottavat. Vaiheessa B etsitään eriävästi ilmentyviä geenejä ja kuvan perusteella vertaillaan normaaleja ja tautia ilmentäviä genotyyppejä keskenään. Vaiheessa C lasketaan geenien välistä korrelaatiota. Intuitiivisesti lukija ajattelisi tässä vaiheessa, että lasketaan geenien ja taudin ilmentymien välisiä korrelaatioita. Vaihe "korrelaatiokertoimen laskeminen" tarkoittaa samaa asiaa kuin korrelaatioiden laskeminen, joten se on kuvassa tarpeeton.

←--#: . Geeniverkko selitetty. --Jouni Tuomisto (keskustelu) 15. syyskuuta 2015 kello 14.35 (UTC) (type: truth; paradigms: science: defence)

Painovirheitä englanninkielisessä tiivistelmässä: production info crystals -> production of info crystals. clinicial -> clinicians

←--#: . Korjattu. --Jouni Tuomisto (keskustelu) 15. syyskuuta 2015 kello 14.35 (UTC) (type: truth; paradigms: science: defence)

Keskustelu:Massadata kansanterveyden edistämisessä

Lausunto käsikirjoitusversiosta 3.8.2015

Navigointivalikko