Tiedosto:Avoimen datan mahdollisuudet tutkimuksessa
Tämä sivu on luento.
Sivutunniste: Op_fi2810 |
---|
Moderaattori:Jouni (katso kaikki)
Sivun edistymistä ei ole arvioitu. Arvostuksen määrää ei ole arvioitu (ks. peer review). |
Lisää dataa
|
Kysymys
Mitä mahdollisuuksia avoin data avaa tutkimuksessa? Erityisesti kiinnostuksen kohteena on ympäristö- ja terveystutkimus, mutta myös tutkimus yleensä.
Vastaus
Tähän ideoita...
Mitä on tiede?
- Kaikki esittävät ideoita (hypoteeseja) siitä miten asiat ovat.
- Kaikki yrittävät kumota näitä hypoteeseja osoittamalla, etteivät ne ole sopusoinnussa havaintojen kanssa.
- Kaikki yrittävät kehittää hyvinä pitämiään ideoita eteenpäin.
- Jos kaikki kehittelevät ideoitaan salassa, miten tämä voi onnistua? Hitaasti.
Jos et julkaise, kukaan ei voi auttaa sinua.
- Jos käytät eri työkaluja kuin muut, auttaminen on vaikeampaa.
- Kannattaa siis käyttää yleiskäyttöisiä työkaluja, joilla on paljon osaajia.
- Yleiskäyttöisyydessä ei ratkaisevaa ole se, mitkä asiat ovat yleisiä nyt, vaan se että niiden käyttö on suoraviivaista ja että niillä on potentiaalia levitä laajaan käyttöön. Suljetut ja kalliit järjestelmät ovat tämän takia huonoja.
- R on parempi kuin SAS.
- R:n GIS-paketit ovat parempia kuin ArcGIS.
- Avoin ja joustava Opasnet-kanta on parempi kuin joka asiaan erikseen räätälöidyt tietokannat.
Tarvitaan jälkikäteen tapahtuvaa peer reviewta auttamaan lukijoita.
- Tarvitaan sisällön arviointisysteemi tieteellisen laadun suhteen (työlästä).
- Tarvitaan sisällön arvointisysteemi hyödyllisyyden suhteen (onnistuu osittain automaattisesti perustuen siihen, paljonko asioita luetaan ja linkataan).
- Laatua arvioidaan ensin hyödyllisistä asioista, jolloin säästyy aikaa ja vaivaa.
- Laadunarviointi myös houkuttelee osallistujia, koska on mielekkäämpää osallistua tärkeän kuin hyödyttömän asian työstämiseen.
- Tämä on tärkeämpää kuin saada yksilöllistä kunniaa työstään. On yhtä hienoa voittaa viestijuoksu kuin tavallinen juoksu.
Valtioneuvoston periaatepäätös julkisen sektorin digitaalisten tietoaineistojen saatavuuden parantamisesta ja uudelleenkäytön edistämisestä
- 1.1.1 Velvoitetaan ja ohjeistetaan eri hallinnonaloja tehostamaan tiedonsaantia ja helpottamaan tuottamiensa ja hallussaan olevien julkisten tietoaineistojen käyttöä Valtiovarainministeriön (VM) ohjaamana ja viranomaisten viestintävelvoitteita koskevien säännösten mukaisesti.
- 1.2.2 Tietoaineistoa tulee voida käyttää mahdollisimman laajasti ilman erillisiä neuvotteluja ja lupamenettelyjä. Jos käytölle on syytä asettaa ehtoja, ehtojen tulee olla perustellut, selkeät, joustavat ja käyttöön kannustavat.
- Tietoluovutuksissa tarjotaan tietoaineistot tiedon luovuttajan kannalta kustannustehokkaasti, kansantalouden kokonaisedun mukaisesti ja käyttäjälle pääsääntöisesti maksutta.
- Maksujen perimisestä luovutaan valtionhallinnon sisällä sekä kuntien ja valtionhallinnon välillä tapahtuvien tietoluovutusten osalta. Toimintamallin merkittävät vaikutukset valtionhallinnon yksiköiden rahoitukseen ja kuntien valtionosuuksiin otetaan huomioon valtion tulo- ja menoarvion valmistelussa.
- 2.5.1 Avoimen tietoinfrastruktuurin palvelujen syntyminen turvataan rahoitusjärjestelmällä, jolla tähdätään nopeaan ja kustannustehokkaaseen toteutukseen. Arvioidaan tietoinfrastruktuurin (ml. rajapintapalvelut) pystyttämisen ja ylläpidon vaihtoehdot ja rahoitus (esimerkiksi budjettitalouden kautta määrärahasiirrot tai erillinen ohjelma kansallisen innovaatiojärjestelmän puitteissa) sekä toiminnallisten järjestelyjen resurssitarpeet (esimerkiksi tukipalvelut).
- 3.3.2 Edistetään julkisten tietoaineistojen saatavuutta ja hyödyntämistä tieteen ja tutkimuksen tarpeisiin sekä sähköisten oppimisympäristöjen kehittämisessä kaikilla koulutustasoilla. Järjestetään avoimiin tietoaineistoihin liittyvää koulutusta monella osaamistasolla.
Avoimen tiedon käyttöön kannustavia asiakirjoja
- Tieto käyttöön Tiekartta tutkimuksen sähköisten tietoaineistojen hyödyntämiseksi (OKM:n julkaisuja, 2011:4)
- Mari Kiviniemen hallituksen ohjelma. Julkishallinnon tietojärjestelmät sovitetaan yhteen mahdollisimman pikaisesti. Julkisen sektorin IT- konserniohjausta keskitetään ja sitä vahvistetaan. Hallitus tekee periaateratkaisut, jotka mahdollistavat julkisen sektorin hallussa olevan tiedon avaamisen ja saatavuuden tietosuojaa vaarantamatta.
- Tuottava ja uudistuva Suomi - Digitaalinen agenda vuosille 2011-2020 (LVM:n muut julkaisut sarja, 2010). Tieto tuottavassa käytössä - osa esittää strategiset tavoitteet ja toimenpiteitä tavoitteiden saavuttamiseksi, jotta julkisten sektorin tieto saadaan tehokkaaseen käyttöön.
- Kestävän talouskasvun ja työllisyyden ohjelma (VNK:n julkaisusarja 16/2010). 48. Julkiset perustietovarannot tulee saada vapaasti kaikkien julkisen sektorin toimijoiden käyttöön aina kun sen on tietosuoja- ja muun lainsäädännön mukaan mahdollista. Julkisen sektorin sisällä tietovarantojen olemassa olevien tietojen veloitukseton hakeminen ja käyttö mahdollistetaan määrärahasiirroin ja muin budjettiteknisin keinoin. Erikseen tehtävästä tietojen jalostamisesta aiheutuvat kustannukset veloitetaan. Edistetään julkisin varoin tuotettujen julkisten tietovarantojen saamista kustannustehokkaasti yleiseen käyttöön kansantalouden kasvumahdollisuuksien parantamiseksi.
- EU:n digitaalistrategia (EU, 2010). Digitaalisten sisämarkkinoiden kehittämisen toimenpiteissä esitetään vuoteen 2012 mennessä uudelleentarkastelua julkisen sektorin hallussa olevien tietojen uudelleenkäytöstä annetusta direktiivistä, etenkin sen soveltamisalaa ja käyttö- ja hyödyntämismaksujen perimistä koskevia periaatteita. Samoin tarkastellaan vuoteen 2011 mennessä uudelleen ympäristötiedon julkisesta saatavuudesta annettua direktiiviä.
- EU:n Komission tiedonanto (EU, 2009): Julkisen sektorin hallussa olevien tietojen uudelleenkäyttö - direktiivin 2003/98/EY uudelleentarkastelusta.
- Mepsir (2006): Measuring European Public Sector Information Resources. Final Report of Study on Exploitation of public sector information – benchmarking of EU framework conditions.
- EU Ministerial Declaration on eGovernment (hyväksytty Malmössa, 18.11.2009). 11. Increase availability of public sector information for reuse. We will increase availability of public sector information for reuse, in accordance with the spirit of and the conditions established by Public Sector Information Directive 2003/98/EC. We will encourage the reuse of public data by third parties to develop enriched services that maximise the value for the public. New demand-led information products and services enabled by the reuse of public sector information will support the transition of Europe to a knowledge-based economy.
- Julkisen tiedon saatavuus ja lainsäädäntö -taustaselvitys. (LVM/Henri Tanskanen, 2010)
- Poikola, Kola, Hintikka (2010): Julkinen data - johdatus tietovarantojen avaamiseen (LVM:n muut julkaisut sarja, 2010).
Mitä hyötyä tai kilpailuetua on ollut datan avaamisesta?
- iPhone menestyi osaksi siksi, että se avasi sovelluskehityksen kaikille.
- Facebook teki saman omassa palvelussaan.
- Google antaa ilmaiseksi paljon palveluja sähköpostista dokumentinhallintaan ja saa näin paljon käyttäjiä.
- Pubmed jakaa ilmaiseksi kirjallisuustietoa ja terveystiedon osalta maailmasta tulee tasa-arvoisempi.
- Tämä on USAn National Library of Medicinen lahja ihmiskunnalle.
- YMTOn pitää antaa oma lahjansa. Mikä se on?
Ympäristöterveydellinen esimerkki asiasta, jossa tilaisuuteen ei ole tartuttu: pienhiukkasten annosvaste.
- Sen avulla lasketaan pienhiukkasten aiheuttamat ylimääräiset kuolemat, elinajanodotteen lyhenemä tai pienhiukkasten aiheuttama sairastuvuus eri tauteihin.
- Näitä tietoja käytetään suhteuttamaan asioidan vaarallisuutta, arvioimaan toimenpiteiden järkevyyttä tai valistamaan ihmisiä aiheesta.
Mitä tietoa loppukäyttäjä tarvitsee annosvasteesta?
- Annosvastekäyrän muoto.
- Käyrän kulmekerroin tai muu jyrkkyyttä kuvaava mitta.
- Missä yksiköissä asiaa mitataan.
- Mitkä seikat vaikuttavat annosvasteen jyrkkyyteen:
- Altistuvan väestön ikä tai sukupuoli.
- Altistuvan väestön perussairauden ja taustariski.
- Altisteen kemiallinen koostumus ja hiukkasten koko.
- Altisteen ikä ja ilmakemia (eli muutunta ilmakehässä).
Kuinka monta eri kuvausta annosvasteesta tarvitaan?
- Yksi.
Kuinka monta eri kuvausta annosvasteesta on olemassa?
- 10000.
- Tästä datamassasta tehtyjä katsauksiakin on yli tuhat (Review (1120))
- Miksi käyttäjän pitäisi tietää tästä mitään? Eihän kännykän käyttäjältäkään edellytetä kvanttifysiikan alkeitakaan, vaikka laitteen toiminta olennaisesti perustuu siihen.
- 4 Add Search #2 AND #3 9872 00:12:45
- 3 Add Search mortality OR morbidity OR epidemiology OR health effect 1956027 00:12:12
- 2 Add Search fine particles OR PM2.5 OR airborne particulate matter OR fine particulate matter 44603 00:10:46
YMTOn nettisivuilla oleva tieto ei ole vapaasti käytettävissä.
Miksi ei?
- Perinne vaatii, että kirjoittaja pitää kiinni käyttöoikeudesta materiaaliin.
- THL:n ohje on, että näin toimitaan.
- Kukaan ei yritä arvioida tämän perinteen haittaa THL:n tavoitteelle toimia vaikuttavasti ja terveyttä parantaen.
Mitä tämä on käytännössä?
- THL:n kiireiset asiantuntijat kirjoittavat kovassa paineessa jostain ympäristöterveysasiasta thl.fi:hin.
- Kaupalliset sivustot kuten terve.fi, tohtori.fi, mywellnesstrainer.fi,... napsivat asiasisällön omille sivuilleen muuttaen tekstiä sen verran, ettei tekijänoikeusrikkomusta synny.
- Epäkaupalliset sivustot kuten wikipedia.org ehkä käyttävät tietoa, jos aihe on jonkun vapaaehtoisen mielestä riittävän tärkeä.
- Jos thl.fi olisi vapaasti käytettävissä, kaikki nuo tahot saisivat kopioida THL:n sisältöä vapaasti, kunhan a) lähde mainitaan asianmukaisesti ja b) sama käyttöoikeus annetaan uusien sivustojen käyttäjille.
Mikä muuttuisi?
- Kaupallisella puolella kovin vähän.
- Epäkaupallisella puolella materiaalin käyttö lisääntyisi helposti, koska suora kopioiminen ja lainaaminen olisi sallittua.
- Wikipedian ympäristöterveysartikkelit paranisivat vapaaehtoisten voimin.
- Suuri yleisö löytäisi ympäristöterveystiedon paremmin.
- Epäkaupallisen tiedon kilpailukyky kaupallisia terveystietomarkkinoijia vastaan paranisi, jolloin tiedon kytkentä terveysrahastukseen heikkenisi.
Minkä pitää muuttua, jotta tieto avautuisi?
Ajattelun.
Avoimuuden ideaalimalli:
- Heti mulle kaikki tieto tänne.
Toimintaperiaatteena on suoraviivainen, mutta menee vastoin vahvoja nykykäytäntöjä.
Tarvitseeko avoimuuden heti edetä noin pitkälle?
- Löytyykö jokin polku, joka lisää avoimuutta pikku hiljaa?
- Avattaisiinko helpot datat ja tiedot ensin ja edettäisiin vähitellen kohti vaikeita?
- Olisivatko YMTOn nettisivut se helppo aloitus?
Tiedon avaamisen esteitä.
- Tiedon avaamista ei mietitä eikä ole paineita sen miettimiseen.
- YMTOn pääasiallinen tuote on tieteellinen julkaisu.
- Mielikuvat muusta kuin tieteellisestä julkaisusta liittyvät hitaaseen, kankeaan ja epämotivoivaan thl.fi-muokkaukseen.
- Ymtolaiset eivät saa palautetta käyttäjiltä tiedon avaamisen hyödyistä.
- THLn määräykset tukevat tiedon sulkemista.
- Avoin tiedonlevitys on pois tutkimus- ja julkaisutyöstä.
- Ei ole totuttu.
- Ei ole opeteltu käyttämään avoimia työkaluja kuten Opasnetiä.
- Kun työtavat ovat lähtökohtaisesti salaavat, tiedon avaaminen on erityinen vaiva.
- Tiedon avaaminen haittaa saman tiedon julkaisemista tieteellisissä lehdissä.
Psykologisia esteitä.
- Pelätään, että avointa tietoa käytetään väärin (ainakin enemmän väärin).
- Pelätään, ettei tiedosta saakaan kunniaa jos sen avaa.
- Ei haluta näyttää keskeneräistä työtä.
Se mitä nyt aion esittää on uskomatonta, siis sellaista mitä te ette luultavasti usko. Usein harhaudun keskusteluihin, jossa yritän sinnikkäästi mutta huonolla menestyksellä todistella, että näihin asioihin kannattaisi uskoa. Nyt yritän välttää tuota todistelua ja jankutusta. Uskokaa tai älkää, miten haluatte. Monille koko aihepiiri on niin uusi, ettei tiedä mitä siitä uskoisi. Ei tarvitsekaan tietää, vaan pitää alkaa ajatella.
Esitykseni tavoitteena on saada teidät ajattelemaan, millaista tieteenteko olisi, JOS se mitä kerron olisi totta. Koettakaa siis keskittyä tämän kuvitteluun murehtimatta voisiko kaikki kuulemanne muka olla oikeasti totta.
Itse asetan omalle työlleni kolme tavoitetta (koskee tietotyötä):
- Työni tulosten pitää olla joillekuille toisille ihmisille hyödyllisiä.
- Työmenetelmieni pitää olla sellaisia, että nekin ovat toisille hyödyllisiä eli muut pystyvät niiden avulla helposti toistamaan työni tai tekemään uuden, samantapaisen työn.
- Työni tulosten ja työmenetelmieni pitää olla muiden käytettävissä työpäivän lopussa.
Sanonta: Uskomattomia asioita voi saavuttaa henkilö, joka ei piittaa siitä, kuka saa tuloksista kunnian.
There are several possible approaches to openness:
- Open data: how to open up data alongside with scientific publications?
- Open data: how to open up data before publication? This would lead to a different logic of publishing, as the original researcher partly loses control over the data. Why and how should this be done?
- Open data: how to open up data that is partly secret (e.g. patient information) in a way that would enable open analysis?
- Open publishing: what is the role of traditional pre-publishing peer review? What are the possibilities and threats of publish-first-review-later approach?
- Open science: if data is opened immediately, the information production, analysis and interpretation can be distributed to different people and institutes. What does this mean for the scientific practices? How is merit distributed among data producer, analyst, and interpreter?
- Open science: the current practices of making science are based on small, rather isolated expert groups publishing in printed journals that control publishing. There are strong forces towards large self-organised groups that take a piece of data, make something out of it, publish it in the Internet, and take actions based on the output. This data processing and use is controlled neither by experts nor journals. Scientists fighting against this trend will fail. What should scientific societies do?
- Open decision-making: with more data available, more decision-making can be based on that. What is the role of researchers in this development? Do researchers want to participate in the practical societal use of their data? If they don’t want, who does it?
Perustelut
Tästä aiheesta on tulossa esitelmä: Jouni Tuomisto: Avoimen datan mahdollisuudet YMTOssa. 15.2.2012 klo 14-15.30, THL, kokoushuone Apila, Tutkimuskeskus Neulanen, Kuopio.