Ero sivun ”Big Data -strategia” versioiden välillä
Rivi 93: | Rivi 93: | ||
Samalla täytyy huomioida myös big datan käyttöön liittyvät mahdolliset riskit, esimerkiksi yksityisyydensuojaan liittyen. Kehityksessä ja erilaisissa toimenpiteissä täytyy pohtia myös mahdollisesti seuraavia ongelmia. | Samalla täytyy huomioida myös big datan käyttöön liittyvät mahdolliset riskit, esimerkiksi yksityisyydensuojaan liittyen. Kehityksessä ja erilaisissa toimenpiteissä täytyy pohtia myös mahdollisesti seuraavia ongelmia. | ||
==== Kokeilut/t& | ==== Kokeilut/t&k rahoituksen suuntaaminen ==== | ||
Erilaisten big data-ratkaisujen kehittämisessä oleellisessa osassa ovat kokeilut. Toimivat ratkaisut löytyvät usein varsin pienimuotoistenkin kokeilujen jälkeen. | |||
Yritysten ja julkisen hallinnon omilla toimilla voidaan mahdollistaa ketterämpi, kokeileva kulttuuri. Hallinto voi mahdollistaa tätä yhteistyössä yritysten kanssa, esimerkiksi tarjoamalla erilaisia resursseja. (mm.FORGE Service Lab) Kyse on myös siitä, että organisaatioiden ilmapiiriä muutetaan start-up-henkisempään suuntaan. Suuri osa kokeiluista myös epäonnistuu eikä niistä välttämättä synny uutta liiketoimintaa. Tämä tulisi kuitenkin usein käsittää tärkeänä osana oppimisprosessia. Samalla internettalouden aikana yhdestä onnistuneesta kokeilusta voi seurata jopa globaali hitti. | |||
Big data-kokeiluille tulisi saada riittäviä resursseja ja rahoitusta. Erilaiset mallit, sovellukset. yms. ovat useimmiten äärimmäisen nopeasti skaalattavissa ylöspäin. Niinpä yksittäisestä toimivasta kokeilusta syntyvä palvelu/teknologia/tuote voi olla nopeastikin täysosuma. T&K-rahaa tulisi kohdentaa big dataan liittyville kokeiluille ja tutkimukselle. Lisäksi muun muassa EU:n Horisontti 2020-ohjelman mahdollisuudet tulee käyttää täysimääräisesti hyväksi. | |||
Haastetta ketterien kokeilujen toteuttamiselle asettaa se, että suurten tietovarantojen haltijat ja niitä kerryttävät tahot ovat usein suuria eivätkä aina niin ketteriä organisaatioita. Toisaalta data-analytiikan alueelle on syntynyt ja syntymässä uusia pieniä yrityksiä, jotka voisivat tarjota tehokkaampia menetelmiä big datan hyödyntämiseen ja uuden liiketoiminnan synnyttämiseen. Myös T&K&I -rahoitusta suuntaamalla olisi mahdollista saattaa erilaisia big-data -toimijoita yhteisiin projekteihin ja hakemaan yhdessä ratkaisuja todellisiin asiakastarpeisiin. Eri kokoisten yritysten yhteistyölle ja yhteisille projekteille tulisi olla saatavilla t&k- tukea. | |||
Yhteistyö voi olla myös kansainvälistä. Suomalaisten yritysten, esimerkiksi pk-sektorilta, sekä kansainvälisten veturiyritysten yhteistyötä tulisi aktiivisesti edistää. Esimerkiksi Saksa on avainasemassa teollisen internetin tulevissa ratkaisuissa. Suomalaisilla yrityksillä ja niiden osaamisella on paljon erilaisia mahdollisuuksia näiden globaalisti johtavien yritysten big data-kehityksessä. | |||
Ylipäänsä big dataan liittyviä ja kohdentuvia tutkimusinvestointeja täytyy tehdä, mikäli Suomi pyrkii pysymäään kehityksessä mukana. Big data-kehitykselle ollaan muissa maissa osoitettu huomattavia investointeja valtion taholta. | |||
Big data-keskus, joka toisi yrityksiä yhteen? | Big data-keskus, joka toisi yrityksiä yhteen? | ||
Datan markkinat, uudet mahdollisuudet sitä kautta? | Datan markkinat, uudet mahdollisuudet sitä kautta? | ||
Isommille kannuste antaa dataa käyttöön,jakamisesta liiketoimintamalli samalla. (bitcoin-malli) | Isommille kannuste antaa dataa käyttöön,jakamisesta liiketoimintamalli samalla. (bitcoin-malli) |
Versio 19. toukokuuta 2014 kello 05.05
Kysymys
----#: . Lopullisemman strategia-dokumentin/rakenteen aluksi hyvä sisällyttää johtava visio-yhteenveto, joka lyhyesti tiivistää _suomalaisen_ yhteiskunnan arvoja, nykytilaa ja haasteita (vaikkapa osin hallituslähteistä siteeraten), mutta ennen kaikkea pohjustaa (esim. parilla tiiviillä tekstikappaleella ja/tai sopivin visualisoinnein) tavoitetilaa tulevalle, (big) data-lähtöisemmälle Suomelle. Tätä korkean tason visiota vasten muita alueita (edellytykset, alueet, toimenpiteet ja vaikuttavuus jne.) on sitten taas yhtä askelta helpompi kohdistaa ja jäsentää. Jounin ym. kaltainen lista yksi tapa hakea tätä visiota. Visiota voi tarvittassa myös tarkentaa eri kohderyhmien (esim. poliittiset päättäjät, kansalaiset, yritykset, rahoituslaitokset, koulutusinstituutiot jne.) näkökulmasta, joskin oleellisinta on ehkä opastaa poliittiset päättäjät riittävän helposti löydettävissä oleviin toimenpidesuosituksiin. --Pekka Lehti (keskustelu) 14. toukokuuta 2014 kello 04.34 (UTC) (type: truth; paradigms: science: comment)
- Tämä on big data- strategian kirjoituswikisivusto. Tämä ei ole strategian lopullinen rakenne, vaan pyrkii keräämään ideat, tekijät ja toimenpiteet tunnistettuihin aihealueisiin. Jos aihealueita puuttuu, voi myös niitä lisätä muokkaus-toiminnolla.
- Ohjeistusta edellytys- ja sovellusalueista kirjoittamiseen
- kuvausta kyseisestä asiasta, taustatekijästä, sekä sen nykytilasta, esimerkkejä ja perusteluja miksi edellytys tai sovellusalue on meille tärkeä, millaisia vahvuuksia tai heikkouksia Suomella on tässä jne.
- "Ohjeistusta toimenpideosion kirjoittamiseen
- ideoita toimenpiteiksi, joita otsikkoasian kehittämiseksi tarvitaan (strategian toimenpideosio kootaan myöhemmin näistä)
- "Ohjeistusta toimijat ja hankkeet osion kirjoittamiseen
- listausta keskeisistä toimijoista ja hankkeista, jotka strategiassa esitettyjen asioiden eteenpäin viemiseksi ovat olennaisia
- "Ohjeistusta vaikuttavuus osion kirjoittamiseen
- ideoita, linkkejä ja tutkimuksia siitä miten big data toimien vaikuttavuutta ja erityisesti tässä strategiassa esitettyjen toimien vaikuttavuutta voisi arvioida määrällisesti ja laadullisesti
----#: . Toivon teidän täydentävän sivulla Luettelo Opasnetissa toteutettavista hankkeista olevan taulukon omalta osaltanne ja laittavan samat tiedot myös tälle sivulle. Kiitos. --Jouni Tuomisto (keskustelu) 16. huhtikuuta 2014 kello 07.09 (EEST) (type: truth; paradigms: science: comment)
Vastaus
- Tähän kirjoitetaan strategiaan sisällytettävät toimenpiteet sitä mukaa kun ne jäsentyvät.
Johdanto
Big Data
Datan määrä, monimuotoisuus ja nopeus ovat kasvaneet nopeasti (esimerkkejä). Datan varastointi, analyysi ja käsittely vaativat uusia menetelmiä. Monimuotoista dataa hyödynnetään liiketoiminnassa ja päätöksenteossa, joten siitä on tulossa yhä keskeisempi osa yritysten ja organisaatioiden perustoimintaa. Puhutaan big datasta. Datan merkityksen kasvua erityisesti liiketoiminnassa ja kilpailussa kuvastaa hyvin suomalaisen yritysjohtajan toteamus: big data ei ole mahdollisuus, se on pakko.
Kuvausta big datan määritelmästä datalähteiden tarkasteluna? Esim. jaottelu senosriseen dataan ja digitaaliseen dataan sekä organisaatioiden rakenteissa ("BI") että ulkoa haettavaan dataan (esim. sosiaalinen media) tai strukturoituun ja ei-sturkturoituun dataan jne.
Yhteisesti jaettua ja täysin yksiselittäistä määrittelyä ei termille ole. Useimmiten käytetään kolmen V:n määritelmää, jolla viitataan sekä datan määrään (volume),syntyvauhtiin (velocity) sekä erilaiseen, struktoroimattomaan dataan (variety). Eri näkökulmista, muun muassa eri palveluntarjoajien määritelmissä, painotetaan ilmiön eri puolia. Esimerkikisi Intel määrittelee big datan puhtaasti koon (mediaaniarvona 300tb dataa viikottain), Microsoft lähestyy asiaa analyysin vaadittavien monimutkaisten menetelmien kautta. Lisäksi termiä voitaisiin lähestyä myös analyysiin käytettävien työkalujen kautta . (Mm. Hadoop)
Big dataan liittyy suuria odotuksia ja toisaalta myös dystooppisia pelkoja. Viime vuoden aikana saavutettiinkin Gartnerin hypekuvaajan mukaan tulevina vuosina saavutetaankin ylimitoitettujen odotusten huippu . Tästä huolimatta ilmiötä ei tule tuomita teknoutopiaksi, vaan big data todella muuttaa toimintapoja lähes joka sektorilla. Myös Gartner ja muut tutkimusyhtiöt ovat hyvin yksimielisiä big datan disruptiivisesta vaikutuksesta.
Maailmassa syntyvän ja kerättävän datan määrä kasvaa huimaa vauhtia, samalla oleelliseksi muodostuu kertyvän tiedon hyötykäyttö. Tulevat menestysyritykset ja jopa valtiot ovat muokanneet toimintaansa eri lähteistä saatavan datan avulla. Esimerkiksi päätökset perustuvat entistä enemmän saatuun tietoon. Tämä tarkoittaa myös sitä, että tiedon yhä tehokkaammasta hyödyntämisestä tulee globaalissa kilpailussa täysin välttämätöntä.
Tiedon varastoinnista on tullut selkeästi halvempaa ja helpompaa (mm. pilvi), lisäksi prosessointitehon kasvaessa analyysimenetelmät ovat kehittyneet, nykyään voidaan analysoida valtavia tietoaineistoja sekä yhdistellä eri muodoissa olevaa dataa (tuoda järjestys epäjärjestykseen). Samalla sensoriteknologia on kehittynyt ja halventunut merkittävästi. Nämä ovat big data-ilmiön mahdollistajia.
Big Datan voi käsittää myös tietynlaisena tiedon paradigmanmuutoksena. Siirrytään yrityksissä ja hallinnossa tekemään päätöksiä suoraan ”mitattuun” tietoon perustuen. Tutkimuksessa ei välttämättä tarvitse samalla tavalla muodostaa teoriaa, kun voidaan käydä valtavia tietomassoja läpi ilman ennakko-oletuksia ja ns. ”löytää” malleja, yhteyksiä
Tässä strategiassa big dataa lähestytään määritelmän neljännen V:n, eli arvon sekä toiminnan kautta. Toiminta tarkoittaa tässä datan analysointia, käsittelyä ja hyödyntämistä erilaisiin käyttötarkoituksiin. Strategia ei siten keskitytä pelkästään massiivisten, esimerkiksi supertietokoneita analyysiin vaativiin reaaliaikaisiin tietomassoihin. Strategia kohdistuu myös käsittelymenetelmällisesti yksinkertaisempaan dataan ja erityisesti erilaisten tietoaineistojen yhdistelyyn. Ajatuksena on ollut tunnistaa ja löytää Suomen kannalta oleellisia alueita, joilla kerättävä tieto, uudet tiedonkäsittelymenetelmät ja laajempi tiedon hyödyntäminen voivat tuoda arvoa. Strategian tavoitteet ja toimet kohdistuvat niin yksityiseen kuin julkiseen sektoriin.
Lähtökohtana big datasta saatavien yhteiskunnallisten ja taloudellisten hyötyjen kannalta nähdään tarve laajalle yhteistyölle. Data-aineistot sijaitsevat erilaisten organisaatioiden ja instituutioiden huomassa, joiden yhdistelystä ja soveltamisesta syntyy arvoa. Laajan yhteistyön tarve kohdistuu siten niin hallinnon, yritysten kuin esimerkiksi järjestöjen ja kansalaisten kesken.
----#: . Selvyyden vuoksi termi "Big Data" ehkä hyvä määritellä myös tämän dokumentin sisällä, oletettavasti tarkoittamaan kaikkia sen alaisia osa-alueita ja määritelmiä (V-määritelmät, data-analytiikka, datalähtöiset palvelut ja liiketoiminta...), tasapuolisesti, ellei sitten tapauskohtaisesti tarvita tiukempia määritelmiä. --Pekka Lehti (keskustelu) 13. toukokuuta 2014 kello 19.26 (UTC) (type: truth; paradigms: science: comment)
Big Data-strategioita maailmalla
Euroopan ja Suomen kehityksen katsotaan tulevan muutaman vuoden jäljessä kansainvälisesti suuria big datan hyödyntäjämaita, erityisesti USA:ta.
Strategioiden tarkastelussa huomaa, että eri maissa alan kehitykseen sekä muun muassa säästöjen ja kilpailukyvyn kannalta big data nähdään yhtenä oleellisimmista kehityskuluista. Niinpä monissa maissa alalle laitetut panostukset ovat mittavia. Big data-kehityksen kärjessä kulkeminen nähty äärimmäisen tärkeänä. Big data-maailmassa kilpailu on todella kovaa ja investoinnit alalle suuria.
USA kuvausta uuden raportin pohjalta! --> politiikkakysymykset
Esimerkiksi Saksassa ja Ranskassa big data nähdään tiiviisti teollisuuden kilpailukyvyn avaintekijänä. Maat ovat huomioneet laajasti big datan teollisuuspolitiikassaan. Ranskassa big data kuuluu seitsemän tärkeimmän tulevaisuuden teknologian joukkoon. Strategioissa nähdään big datan tuovan hallinnolle pidemmällä tähtäimellä merkittäviä kehitys- ja säästömahdollisuuksia. Esimerkiksi alan kärkimaassa Yhdysvalloissa on taas panostettu pelkästään hallinnossa big data-kehitykselle satoja miljoonia dollareita. Big data-alalla toimivien yritysten suhteen maalla taas on selkeä etumatka esimerkiksi Eurooppaan verrattuna.
Suomen rooli big data kilpailussa?
Suomella on paljon vahvuuksia menestyä datan hyödyntämisessä. Yhtenä strategian tehtävänä on nostaa esille sovellusalueita, joissa Suomella on selvästi potentiaalia löydettävissä datan hyödyntämisessä. Perinteisesti meillä on osaamista mm. lääketieteellisesssä tutkimuksessa, mobiiliteknologioissa, peliteollisuudessa ja ympäristömonitoroinnissa, jotka kaikki ovat hyvin dataintensiivisiä ja sen monimuotoiseen analyysiin perustuvia aloja. Toisaalta strategian avulla on kohdistettava toimia myös niihin yhteiskunnallisesti ja taloudellisesti merkittäviin alueisiin, missä olemme selkeästi kehityksessä jäljessä ja joista saatavat hyödyt ovat .
Suomella on myös vahvaa menetelmä- ja it-osaamista, jota muuntamalla ja hyödyntämällä koulutuksen, tutkimuksen ja asiantuntemuksen jakamisen kautta saataisiin big data kehitystyöhön. Kuvausta esim. tutkimuslaitoksien HIIT, EIT ICT Labs, yliopistojen huippuyksikköjen saavutuksista. POST-IT-era, tiedostopohjaisuudeta olio-ohjelmointiin, optimointi, tehokkuus jne tekniset mahdollisuudet?
Big datan hyödyntäminen julkisella sektorilla on vasta alkutekijöissään, mutta tarjoaa suuria mahdollisuuksia niin palvelujen kuin prosessienkin parantamiseen ja tehostamiseen sekä uusiin toimintatapoihin. Suomi on ollut edelläkävijämaita avoimessa datassa ja julkinen sektori avaa tietoaineistojaan vaihtelevaan tahtiin. Tätä avoimuuden ja hyvälaatuisten julkisten tietovarantojen saatavuuden kulttuuria tulisi hyödyntää myös big data kehitystyössä. Avoimen ja big datan, julkisten ja ykistyisten data-aineistojen yhdistelyssä piille Suomelle suuri potentaali.
Big datassa on huomioitava erityisesti erilaisten datojen vaatimukset datan käytön ja hallinnan suhteen. Esimerkiksi henkilötietona terveysdatan käsittely tarjoaa erilaisia käyttömahdollisuuksia kuin esimerkiksi laitteista saatava senoridata (iOT). Suomen vahvuus kroekan tietosuojan maana tässä huomioitavissa? Toisaalta korkealaatuinen viestinäinfrastruktuuri mahdollistaa iOT kehitystä? Tiedon käsitttelymenetelmien osaamista Suomen vahvuus (huom. luottamus, etiikka, teknologiat)?
Edellytykset:
Tähän kohtaan kuvataan niitä vaikuttavia tekijöitä, asioita ja ehtoja, joita tarvitaan siihen, että big datan käyttö voisi edistyä Suomessa. Edellytysten taso kuvastaa siten vahvuuksiamme että heikkouksiamme big datan alueella. Edellytykset kohdistuvat kaikkiin yhteiskunnan osiin; yrityksiin, hallintoon ja yksittäisiin datan hyödyntäjiin. Edellytyksistä ja potentiaalisten sovellusalueiden kuvauksista johdetaan tarvittavat toimenpiteet myöhemmässä strategian osassa.
Datatietoisuus
Datatietoisuudessa on kyse pitkälti datan potentiaalisen arvon ymmärtämisestä. Erilaisten organisaatioiden tuottama ja tallentama data tulee käsiteö tuHyöty ei aina näy heti ja ole saatavissa suoraviivaisesti, mutta tulevaisuudessa ja esimerkiksi muiden, esimerkiksi reaaliaikaisten datalähteiden kanssa yhdistelemällä saatetaan saavuttaa huomattavia etuja. Kyse on siis datan itsensä arvon ymmärtämisestä. Erilaisesta datasta saadaan oleellista informaatiota ulos, usein kyse on siitä, että osataan vain kysyä oikeita kysymyksiä ja hakea oikeita asioita.
(TÄHÄN ESIMERKKI SÄILYTTÄMISESTÄ)
Nykyaikaisen analytiikan ja big datan omaksuminen osaksi jokapäiväistä työtä on keskeinen askel kohti tiedolla johtamisen yrityskulttuuria. Uuden teknologian ja prosessointikapasiteetin kustannusrakenteiden jatkuva kehitys vaatii omien kyvykkyyksien säännöllistä uudelleentarkastelua. Se mikä datan tarkastelussa vuosi sitten oli mahdotonta tai kannattamatonta, voi tänään olla varsin perusteltua ja liiketoiminnallisesti kannattavaksi todistettavaa. Samalla budjetilla voidaan ensi vuonna jälleen tarkastella laajempaa datamassaa, etsien tarkempia signaaleja, uusia toimintamahdollisuuksia ja aiemmin tunnistamattomia optimointikohteita. Tämä sykli toistuu yhä uudelleen ja organisaatioiden onkin opittava kyseenalaistamaan vanhat datan tarkastelun rajat ja kiinnittämään tarkemmin huomiota uusien lähteiden syntyyn. On tultava datatietoiseksi. Maailmalla on tietopohjaisesta päätöksenteosta esimerkkinä mm. amerikkalainen autonvalmistaja Ford, joka selvisi autoteollisuuden kriisistä siirtymällä data-driven päätöksentekoon.
Perinteisesti organisaatiot ovat tottuneet tarkastelemaan oman liiketoimintansa tuottamaa dataa. Ja siitäkin erityisesti esivalittua osajoukkoa, liiketoiminnan ydintietoa. Tämä tieto on kerättynä erilaisissa perusjärjestelmissä (ERP, CRM, CMS) ja sekä datan tuntemus että sen analysointiin käytettyjen välineiden osaaminen on vahvaa. Big datan huomiointi tässä kontekstissa tarkoittaa datan keräämisen laajuuden tarkastelua. Jos perusjärjestelmien lokitasot, tapahtumien kirjaaminen tai tapahtumien sisällön laajuus on aiemmin rajoitettu tallennus- ja prosessointikapasiteetin kustannusten perusteella, voidaan näitä arvioida uudelleen nykyisen kustannusrakenteen ja kapasiteetin myötä. Ydinliiketoimintaa on myös syytä tarkastella säännöllisesti uudelleen tiedonkeräämisen potentiaalin näkökulmasta. Onko aiempi analytiikka tai toiminnan tarkastelu nostanut esiin asioita, joissa datan kerääminen ei ole riittävällä tasolla? Voitaisiinko tuota tunnistettua, kiinnostavaa dataa kerätä tuomalla järjestelmiin uusia ominaisuuksia tai toimintaympäristöön esimerkiksi erilaisia sensoreita? Näihin mahdollisuuksiin tarttuminen kartuttaa oman liiketoiminnan tuottamaa datavarantoa entisestään ja saattaa nostaa big datan teknologioiden omaksumisen varsin ajankohtaiseksi.
Datatietoinen organisaatio ei kuitenkaan rajoita tiedonjanoaan ainoastaan omien järjestelmien keräämään dataan, vaan katsoo ympäröivää ekosysteemiä laajemmin. Datan mahdollisuuksia on syytä arvioida kumppaniverkoston kanssa, tunnistaen synergioita, datan vaihdon mahdollisuuksia tai jopa uuden liiketoiminnan perustamisen potentiaalia datavarantojen yhdistämisen myötä.
Data rinnastetaan useissa puheissa nykyisin luonnonvaroihin, joten sille syntyy luonnollisesti myös arvo kauppatavarana. Tämän ilmiön myötä datan kerääminen ja koostaminen on synnyttänyt ja synnyttää edelleen uusia toimijoita markkinoille. Näiden datakauppiaiden toiminta puolestaan esiintyy joko yksittäisinä palveluina tai koostettuna datan markkinapaikoille. Kysyntä ja tarjonta määrittävät ennen pitkää erilaisen datan arvon, aivan kuten muillakin luonnonvaroilla. Nykyaikainen, datatietoinen organisaatio huomioi myös nämä kaupalliset datavarannot arvioidessaan liiketoimintansa datavetoista kehitystä.
Kolmas näkökulma saatavilla olevaan dataan on avoin data. Sekä EU-tason että kansallinen lainsäädäntö ohjaa erityisesti julkishallinnon dataa voimakkaasti kohti avoimuutta. Tulevaisuudessa kansallisin varoin kerättyä, varsin arvokasta dataa on paljon saatavilla ja hyödynnettävissä edelleen liiketoiminnan kehityksessä. Avoimen datan kulttuurin kehitys vetää mukanaan myös yksityisiä ja kaupallisia toimijoita, joiden intresseissä on avata dataansa julkisuus- ja goodwill-tarkoituksissa sekä vauhdittaakseen oman erityisosaamisalueensa kehitystä. Organisaatioiden onkin syytä ottaa mukaan kokonaisvaltaiseen data-strategiaansa myös avoin data ja sen erilaiset mahdollisuudet. Hyötyjä on tunnistettavissa sekä avoimen datan kuluttajana että tuottajana.
Kansallisessa big data -strategiassa avoimen datan kehitys on yksi keskeisistä teemoista. Nykyaikainen suhtautuminen datan avaamiseen, lainsäädännön kehitykseen reagointinopeus ja tiedon jakamisen kulttuurin kehitys luovat myös kansallista pääomaa ja auttavat Suomea toimimaan esimerkkimaana. Kokemukset avoimen datan päätöksistä, käytännön toteutuksista ja vaikutuksista liiketoimintakenttään ovat lähitulevaisuudessa haluttua pääomaa. Parhaiden käytäntöjen tuotteistaminen voi luoda myös hyvää tukea suomalaisen osaamisen vientiin ja vauhdittaa osaltaan talouskasvua. Tietoon perustuva päätöksenteko vaatii tuekseen toimivan tiedonkeruun ja analysoinnin. Sama tiedonkeruu ja -analysointi palvelee myös open data -aloitteita.
Samalla täytyy huomioida myös big datan käyttöön liittyvät mahdolliset riskit, esimerkiksi yksityisyydensuojaan liittyen. Kehityksessä ja erilaisissa toimenpiteissä täytyy pohtia myös mahdollisesti seuraavia ongelmia.
Kokeilut/t&k rahoituksen suuntaaminen
Erilaisten big data-ratkaisujen kehittämisessä oleellisessa osassa ovat kokeilut. Toimivat ratkaisut löytyvät usein varsin pienimuotoistenkin kokeilujen jälkeen. Yritysten ja julkisen hallinnon omilla toimilla voidaan mahdollistaa ketterämpi, kokeileva kulttuuri. Hallinto voi mahdollistaa tätä yhteistyössä yritysten kanssa, esimerkiksi tarjoamalla erilaisia resursseja. (mm.FORGE Service Lab) Kyse on myös siitä, että organisaatioiden ilmapiiriä muutetaan start-up-henkisempään suuntaan. Suuri osa kokeiluista myös epäonnistuu eikä niistä välttämättä synny uutta liiketoimintaa. Tämä tulisi kuitenkin usein käsittää tärkeänä osana oppimisprosessia. Samalla internettalouden aikana yhdestä onnistuneesta kokeilusta voi seurata jopa globaali hitti.
Big data-kokeiluille tulisi saada riittäviä resursseja ja rahoitusta. Erilaiset mallit, sovellukset. yms. ovat useimmiten äärimmäisen nopeasti skaalattavissa ylöspäin. Niinpä yksittäisestä toimivasta kokeilusta syntyvä palvelu/teknologia/tuote voi olla nopeastikin täysosuma. T&K-rahaa tulisi kohdentaa big dataan liittyville kokeiluille ja tutkimukselle. Lisäksi muun muassa EU:n Horisontti 2020-ohjelman mahdollisuudet tulee käyttää täysimääräisesti hyväksi.
Haastetta ketterien kokeilujen toteuttamiselle asettaa se, että suurten tietovarantojen haltijat ja niitä kerryttävät tahot ovat usein suuria eivätkä aina niin ketteriä organisaatioita. Toisaalta data-analytiikan alueelle on syntynyt ja syntymässä uusia pieniä yrityksiä, jotka voisivat tarjota tehokkaampia menetelmiä big datan hyödyntämiseen ja uuden liiketoiminnan synnyttämiseen. Myös T&K&I -rahoitusta suuntaamalla olisi mahdollista saattaa erilaisia big-data -toimijoita yhteisiin projekteihin ja hakemaan yhdessä ratkaisuja todellisiin asiakastarpeisiin. Eri kokoisten yritysten yhteistyölle ja yhteisille projekteille tulisi olla saatavilla t&k- tukea.
Yhteistyö voi olla myös kansainvälistä. Suomalaisten yritysten, esimerkiksi pk-sektorilta, sekä kansainvälisten veturiyritysten yhteistyötä tulisi aktiivisesti edistää. Esimerkiksi Saksa on avainasemassa teollisen internetin tulevissa ratkaisuissa. Suomalaisilla yrityksillä ja niiden osaamisella on paljon erilaisia mahdollisuuksia näiden globaalisti johtavien yritysten big data-kehityksessä.
Ylipäänsä big dataan liittyviä ja kohdentuvia tutkimusinvestointeja täytyy tehdä, mikäli Suomi pyrkii pysymäään kehityksessä mukana. Big data-kehitykselle ollaan muissa maissa osoitettu huomattavia investointeja valtion taholta.
Big data-keskus, joka toisi yrityksiä yhteen?
Datan markkinat, uudet mahdollisuudet sitä kautta?
Isommille kannuste antaa dataa käyttöön,jakamisesta liiketoimintamalli samalla. (bitcoin-malli)
Yritysten yhteistyö ja datan vaihto
Mietitään vielä sopivaa rajausta/yhdistämistä tämän ja toimialayhteistyö-kappaleen välillä. Tässä voitaisiin tuoda esille mm.
- Lyhyesti yritysten normaali matka kypsyysasteikolla raportoinnin ja prediktiivisen analytiikan kautta liiketoiminnan optimointiin ja "datatuotteiden" myymiseen
- Esimerkkejä eri toimialoilla toimivien yritysten välisestä datakaupasta ja siihen liittyvistä mahd. kokonaisista toimialavaihdoksista
- Ehdotuksia suoraviivaisempaan win-win-yhteistyöhön nimenomaan pienten innovatiivisten yritysten ja paljon dataa keränneiden yritysten välillä (isompi yritys avaa datan ja platformin kehitykselle)
- Tutkitaan onko standardeja tulossa siihen, että yritykset voisivat avata standardoituja "hiekkalaatikoita" vaativimmille muiden yritysten tekemille analyyseille emsim am. tilanne huomioiden:
Big datan prosessointi on erityisen haasteellista. Dataa saattaa olla niin paljon ja sitä voi syntyä niin suurella nopeudella, että sitä ei voi siirtää fyysisesti toisen organisaation käsiteltäväksi. Tällaisissa tilanteissa tiedon analysointia varten täytyy siirtää prosessoivaa koodia toisen organisaation sisälle. Tämä on ongelma, joka vaatii sekä teknistä että tietoturvallista ratkaisua. Samalla täytyy varmistua siitä, kuinka toinen osapuoli voi luottaa ulkopuoliseen ohjelmakoodiin. Yksi ratkaisu tähän voisi olla yhteiskunnan luoma luotettu dataoperaattori, joka huolehtii datan analysointikoodista ja resurssoinnista yhteistyössä osapuolten kanssa.
Laajemmaksi otsikoksi datamarkkinat etc.
yhdistää datan saatavuuteen ja avoimuuteen
Venture capital- tyhjiöön suuria yrityksiä + osin julkiset toimijat, Tekes? Tekes pääomasijoitus oy.
Start up-kenttä big data kehityksessä. AaltoES yms.
Avoimen datan case studyt? Osoittamaan mahdollisuuksia/hyötyä.
Yritysten mukaan houkutteleminen, motivointi yms.?
Koulutus
Big datan hyödyntämisen kannalta koulutus on avainasemassa. Tällä hetkellä muun muassa erilaisten analyysimenetelmien osaajista on pulaa. Samoin tarvitaan yritysjohtajia, jotka ymmärtävät data-analyysin mahdollisuudet päätöksenteon tukena ja yritysten kilpailukyvyn turvaajina. Tulevaisuudessa osaajilta vaaditaan yhä enemmän, jolloin koulutuspuutteet voivat muodostua merkittäväksi esteeksi big datan laajemmassa hyödyntämisessä.
Koulutuspuutteisiin tulee vastata jokaisella koulutustasolla peruskoulusta lähtien sekä myös yritysten taholla esimerkiksi täydennyskoulutuksien muodossa. Perustana olevia matemaattisia, tilastotieteellisiä sekä ohjelmointitaitoja tulisi painottaa opetussuunnitelmissa jo hyvin varhain, jotta tulevat osaamistarpeet tulisivat paremmin katettua pitkällä tähtäimellä.
Tämä ei kuitenkaan vastaa välittömiin tarpeisiin. Suomessa on käynnistymässä sekä ammattikorkeakouluissa että yliopistoissa useita big dataan ja data-analytiikkaan liittyviä koulutusohjelmia. Ammattikorkeakoulutasolla esimerkiksi Haaga-Helia tarjoaa big dataan liittyviä kursseja xxx-koulutusohjelmassaan. Yliopistotasolla esimerkiksi Aalto-yliopiston kaikkien kuuden koulun maisteriopiskeljoiden on syksystä 2014 lähtien mahdollista suorittaa sivuaineen laajuinen "Analytics and Data Science" -kokonaisuus. Tämä kokonaisuus täydentää mm. jo olemassaolevia Koneoppimisen ja tiedonlouhinnan sekä Tieto- ja palvelujohtamisen maisteriohjelmia, jotka tarjoavat valmiuksia data-analyysiin. Kaikkien suomalaisten korkeakoulujen, jotka eivät vielä ole havahtuneet big datan vaikutuksiin, tulisi huomioida kehitys ja pikaisesti saada datalähtöisyys ja data-analyysi näkymään eri alojen koulutuksessa. Näissä koulutusohjelmissa voitaisiin tehdä yritysten kanssa tiivistä yhteistyötä, jotta tulevat varsin akuutit tarpeet saadaan edes osittain katettua myös suoraan käytännön taidoilla varustetuilla valmistuneilla. Erilaisilla harjoittelu- ja tutustumismahdollisuuksilla on oma tärkeä osansa. Data-analytiikkaan koulutettaville tulisi tarjota mahdollisuuksia opiskelun aikana erilaisiin harjoitteluihin. Näitä voisi yritysten lisäksi tarjota myös julkishallinnossa, mikä osaltaan auttaisi siirtymistä datalähtöisempään toimintatapaan.
Lisäksi alueella tulisi lisätä monialaista koulutusta. Datalta täytyy osata kysyä oikeita kysymyksiä, joten erilaisten taitojen ja erilaisen osaamisen yhdistäminen on välttämätöntä. Niinpä data-analytiikkaa ja datan "ymmärtämistä" tulisi näkyä melkein alan kuin alan koulutuksessa, aina kauppatieteellisestä yhteiskunta- ja sosiaalitieteisiin. Pelkkä tekninen osaaminen ei riitä, vaan tarvitaan ymmärrystä substanssialoista sekä kykyä yhdistellä asioita ja aloja luovasti. Monella alalla käytettävissä olevan tiedon hyödyntäminen toisi huomattavaa lisäarvoa. On tärkeää kouluttaa osaajia myös yksityisyyden ja tietosuojan alueilla, sillä EU:ssa valmisteilla oleva lainsäädäntö saattaa tuoda yrityksille merkittäviä sanktioita (mahdollisesti 5% liikevaihdosta) henkilötietojen virheellisestä käytöstä. Nykyinen lainsäädäntö antaa yrityksille mahdollisuuden käyttää dataa vain siihen tarkoitukseen kun se on alunperin kerätty, mikä luonnollisesti rajoittaa datan käyttöä huomattavasti.
Koulutuksen kokonaistilanne korkeakoulutuksesta, nykytilanne vs. tuleva tarve. Reaaliaikainen tieto koulutusmääristä yms.
Keskiasteelle jo tiettyjen työkalujen perusopetusta
Miten tämän hetken osaajat (matematiikka, tietokannat) voidaan tunnistaa ja nostaa alan huippuosaajiksi. Täydennyskoulutuksia yms.
Yritys/oppilaitosyhteistyö. Erilaiset mallit, harjoittelut, opinnäytetyöt, yms.
Data scientist Kuvauksen tyypillisistä taidoista/rooleista/tehtävistä, kts. komission + e-skills UK-selvitykset yms. Miten saada innostumaan tarvittavista taidoista, kynnyksen laskeminen. Eri sektorit, palaset huomioon. Lisäksi poikkitieteellisyys, tiimit etc. Kotimaiset + kv. ammattinimikkeet, miten suhtautuvat toisiinsa, missä ryhmissä suurin tarve. Erilaiset roolit tiimeissä, ei aina absoluuttinen yksittäinen huippuosaaja.
AMK-koulutus"putki", koodareita yms. käytännön osaajia. Onko riittävästi tarjolla?
Opetushenkilöstö, tarvittava opetuksen taso + määrä ei tällä hetkellä suoraan mahdollinen(osaratkaisuna esim. verkkomateriaalit).
Jatkuvan koulutuksen/tietotaidon ylläpitäminen. (Mooc yms)
Ulkomaisten huippupuhujien/kouluttajien tuominen Suomeen (inspirointi) Systematisoitu jatkokoulutusohjelma. Huippujen saaminen myös Suomeen, ei aina toisinpäin.
"kummitoiminta", big data näkökulmasta
soveltava osaaminen yrityksissä
- käsitelty jo edellä ,
- eli käytännönläheisesti ja tarvelähtöisesti, että pysytään esim USA:n tahdissa
- näkemys kokonaistarpeesta - viittaukset ulkomaisiin selvityksiin
- suhteutetaan bkt:een
tutkimus
- soveltava tärkeintä
- yrityksillä ei aina tut toimintaa jossa riski
- teollisuusyhteistyötä ei arvosteta,
Soveltava osaaminen yrityksissä
Tutkimus
Big dataan liittyy paljon yhteiskunnallisia kysymyksiä, joiden ymmärtämiseen tarvitaan monialaista tutkimusta. Digitaalisten aineistojen hyödyntäminen vaatii tuekseen viisasta sääntelyä. Tarvitaan yhteiskunnallista ja juridista ymmärrystä siitä, miten aineistoihin liittyvää lainsäädäntöä voidaan kehittää tavalla, joka vie eteenpäin toivottuja tapahtumainkulkuja. Digitaalisesta jäljittämisestä pitää käydä avointa keskustelua, ja sen hyödyistä ja haitoista on oltava tutkimuksellisesti perusteltua näyttöä.
Tutkimusnäkökulmasta huomattavaa on se, että suuria aineistoja analysoitaessa yksilökohtaista aineistoa voidaan yhdistää lukuisista eri lähteistä ja toisaalta aineistot saattavat olla varsin epäyhtenäisiä. Ne voivat koostua eri paikkoihin jääneistä digitaalisista jäljistä tai olla kirjoitettuja viestejä, terveystietoja tai arkistoituja kuvia. Tällainen aineistojen moninaisuus haastaa käsitystä tiedon ja tutkimuksen luonteesta. Suurten aineistojen analyysia voi ajatella sarjana kokeiluja, jolloin onnistuneilla kokeiluilla voi kyseenalaistaa aiempaa osaamista ja kehitellä yhteistoiminnan muotoja, käytäntöjä ja sovelluksia. Näin kompetenssi rakentaa uutta tiedontuotannon maailmaa kasvaa merkittävästi.
Tutkimusnäkökulmasta big dataa voi ajatella myös yhteistoiminnan areenana. Tätä edellyttää monialaisia tutkimusryhmiä. Tietoa louhitaan yhteistyössä muiden kanssa ja aineistolle esitetään yhä uusia kysymyksiä. Kyse on jatkumosta, jossa kuljetaan pikkuhiljaa kohti mielenkiintoisia vastauksia tai aineiston esittämisen tapoja. Vahvat toimijat, kuten Google, Amazon, tai NSA, hyödyntävät digitaalista aineistoa, jotta ne oppisivat tunnistamaan ihmisten aikeita, tarpeita ja liikkeitä. Yksittäisille ihmisille hyöty on huomattavasti rajallisempi kuin silloin, kun aineistoanalyysi aidosti tukee ihmisiä esimerkiksi heidän hyvinvointipyrkimyksissään tai arvoprojekteissaan. Tästä näkökulmasta olisi tärkeää, että aineistojen analyysimenetelmät kehittyisivät tavoilla, joilla ne myös hyödyntäisivät digitaalisia jälkiä jättäviä ihmisiä ja yhteiskuntaa laajemmassakin mielessä. Big data haastaa tutkijoita sekä käyttämään mielikuvitustaan että tekemään eettisesti kestäviä valintoja tutkimustyössään.
Tutkimusrahoitusta on ohjattava tavalla, joka suosii teknologiaosaajien ja yhteiskuntatieteilijöiden yhteistyötä big dataan liittyvissä asioissa. Eettisiä kysymyksiä ei voi ajatella teknologian käytöistä irrallisena alueena vaan ne on pidettävä mukana tutkimuksen kaikissa vaiheissa.
Infrastruktuuri
Verkkoon kytkeytyneiden laitteiden ja niiden lähettämän sekä vastaanottaman datan määrä kasvaa huimaa vauhtia. Ciscon ennusteiden mukaan vuoteen 2017 mennessä yhteensä noin 19 miljardia laitetta on kytkettynä internetiin. Suurin osa dataliikenteestä tulee tällöin muodostumaan koneiden keskinäisestä (machine-to-machine) viestinnästä.
Kaiken internetissä myös tulevaisuuden verkoilta, niin kiinteiltä kuin langattomilta, vaaditaan yhä enemmän. Pienilläkin viiveillä voi olla ratkaisevan suuri merkitys erilaisten big dataan perustuvien ratkaisujen kannalta. WEF:in mukaan big datan hyödyntämisen kannalta olennaista on, että verkot toimivat hyvin yhteen niin kotimaassa kuin kv. datavirtojen kohdalla, ne ovat turvallisia, tehokkaita ja toimintavarmoja. (WEF: The Global Information Technology Report 2014) Oleellisessa osassa ovat myös erilaiset yhteentoimivuutta varmistavat toimet ja standardit. Voisiko Suomella olla erilaisten standardien kehittämisen ja kehitystyön suhteen mahdollisuuksia? (vrt. GSM yms)
Langattomien verkkojen osalta tulee ennakoivasti allokoida riittävästi ennakkoon mobillidatakäyttöön soveltuvia taajuuksia. Verkkojen tulee kehittyä älykkäämmäksi, jotta valtaisien datamassojen siirtyminen on mahdollista.
Datan käytettävyys ja avoimuus
Lainsäädäntö ja sääntely
Yksityiselämän suoja on turvattu Suomessa perusoikeutena (PL 10 §). Myös Euroopan ihmisoikeussopimus ja EU:n perusoikeuskirja edellyttävät, että jokaisen oikeutta yksityiselämään on kunnioitettava. Yksityisyyden suojaa joudutaan usein punnitsemaan suhteessa muihin perus- ja ihmisoikeuksiin, kuten sananvapauteen ja julkisuusperiaatteeseen. Viime aikoina kansainvälisessä keskustelussa on myös yhä useammin noussut esiin digitaalisten perusoikeuksien turvaaminen. Suomen perustuslain mukaan henkilötietojen suojasta on säädettävä tarkemmin lailla. Henkilötietolaki (523/1999) on henkilötietojen käsittelyä koskeva yleislaki. Lain tarkoituksena on muun muassa toteuttaa yksityiselämän suojaa ja edistää hyvän tietojenkäsittelytavan kehittämistä ja noudattamista. Henkilötietolain velvoitteet pitää huomioida aina, kun käsitellään henkilötietoja, eli tietoja, jotka ovat yhdistettävissä tiettyyn henkilöön. Lakia ei kuitenkaan sovelleta tilanteisiin, joissa luonnollinen henkilö käsittelee henkilötietoja yksinomaan henkilökohtaisiin tai niihin verrattaviin tavanomaisiin yksityisiin tarkoituksiinsa.
Big Datan käsittelyn yhteensovittaminen henkilötietolain kanssa ei ole täysin ongelmatonta. Erityisesti henkilötietolaissa kuvattu käyttötarkoitussidonnaisuus, informointivelvollisuus ja rekisteröidyn suostumus ovat Big Datan näkökulmasta haasteellisia. Tästä syystä tietojen käsittelijän on syytä varmistaa, että käsittely on henkilötietolain mukaista, jos osana Big Dataa käsitellään henkilötietoja, joita ei ole täydellisesti anonymisoitu. Esimerkiksi pelkästään nimien ja muiden yksilöintitietojen poistaminen ei vielä välttämättä tarkoita, että tiedot muuttuvat anonyymeiksi, jos henkilöt ovat edelleen välillisesti tunnistettavissa. Euroopan unionissa valmisteilla olevan tietosuoja-asetuksen on tarkoitus uudistaa ja harmonisoida unionin tietosuojalainsäädäntöä. Jos asetus tulee voimaan, se muuttaa monella tavoin jäsenmaiden kansallista henkilötietojen käsittelyä koskevaa sääntelyä. Big Datan näkökulmasta merkityksellisiä ovat muun muassa profilointia, tietojen käsittelyn läpinäkyvyyttä, rekisteröidyn informointia tai rekisteröidyn oikeutta tulla unohdetuksi koskevat artiklaehdotukset. Tietosuoja-asetus vaikuttaisi voimaan tullessaan kaiken sellaisen datan käsittelyyn, jota ei ole täysin anonymisoitu.
Viranomaisen hallussa olevien asiakirjojen julkisuuteen sovelletaan julkisuuslakia (621/1999). Julkisuuslaki soveltuu myös silloin, kun luovutetaan henkilötietoja viranomaisen henkilörekisteristä. Henkilötietojen luovutuksen edellytyksenä on tällöinkin, että luovutuksen saajalla on henkilötietolain mukainen oikeus käsitellä kyseisiä henkilötietoja. Näin ollen julkistakaan henkilötietoa ei voida automaattisesti saattaa vapaasti uudelleen käytettäväksi, vaan luovutuksen reunaehdot määräytyvät julkisuuslain, henkilötietolain ja mahdollisen erityislainsäädännön mukaisesti. Tämä tulee huomioida myös Big Datan käsittelyssä jos käsitellään viranomaislähtöistä tietoa.
Henkilötietojen suojaa ja julkisuutta koskevan sääntelyn lisäksi Big Datan käsittelyyn voi vaikuttaa immateriaalioikeudellinen sääntely. Erilaiset tietokannat ja niihin liittyvät ohjelmistot saattavat esimerkiksi nauttia tekijänoikeudellista suojaa. Lisäksi tietoihin ja niiden käyttöön saattaa liittyä sopimusoikeudellisia ja muita kaupallisia velvoitteita, jotka tietojen käsittelijän tulee huomioida.
Tulevaisuudessa Big Datan hyödyntäminen saattaa johtaa siihen, että sen aiheuttamia ongelmia joudutaan ratkaisemaan uuden sääntelyn kautta. Esimerkiksi syrjivät hinnoittelukäytännöt saattaisivat johtaa lainsäädännöllisiin uudistuksiin. Yritysten ja muiden organisaatioiden kannalta hyvä perusneuvo tietosuojan toteuttamiseen on, että tietojenkäsittely ensin suunnitellaan huolellisesti ja sen jälkeen pysytään tässä suunnitelmassa. Läpinäkyvyys tietojenkäsittelyssä korostuu tulevaisuudessa, mikä vaikuttaa suoraan myös Big Dataan. Kaiken kaikkiaan sekä kansallista että kansainvälistä sääntelyä tulisi kehittää siihen suuntaan, että se mahdollistaa Big Datan hyödyntämisen tarkoituksenmukaisella tavalla.
Turvallisuus ja tietosuoja
Oman tiedon hallinta
Kansalaisten tulee voida vaikuttaa siihen, mihin ja miten heidän tietojaan käytetään. Kerättyä tietoa tulisi halutessaan voida hyödyntää myös eteenpäin. Tiettyjä tietoja luovuttamalla voisi saada esimerkiksi parempaa ja yksillöllisempää tai halvempia palveluita. Samalla tämä saattaisi mahdollistaa uudenlaisten palveluiden kehittämisen. Useimmiten jo nyt pyydettäessä luovutettavien tietojen laajempi hyödynnettävyys olisi myös tietoja keräävien yritysten intresseissä. Niin sanottu Mydata-kehitys voisi tarjota yhden mahdollisen tavan omien tietojen hyödyntämiseen ja hallitsemiseen. Ratkaistaviin kysymyksiin kuuluu muun muassa, missä tietoa säilytetään (aggregaattipalvelut, joihin haluamiaan tietoja voi kerätä ml. QS-tiedot?) sekä missä muodossa tietoa tulisi luovuttaa. Samalla yksittäisen kansalaisen (asiakkaan) kannalta omien tietojen hallinta ja hyödyntäminen mahdollistaa mm. säästöjä, juuri itsensä kannalta sopivien palveluiden "räätälöinnin" sekä luottamuksen lisäämisen tietoja kerääviä yrityksiä kohtaan.
Osallistaminen
Demokraattista osallitumisen mahdollisuuksia sekä kansalaisten äänen kuulumista esimerkiksi päätöksentekoon voidaan lisätä big datan avulla.Teknologia ja uudet tiedon analysointimenetelmät tulisi valjastaa tukemaan myös demokratian ja kansalaislähtöisyyden kehitystä. Tietoa, mielipiteitä ja Tämä olisi esimerkillistä ja rohkeaa, kokemukset voisivat olla myös vientikelpoisia.
Case: Poliittisen ym. päätöksenteon tueksi saataisiin kansalaisten mielipidedataa eri lähteitä yhdistelemällä. +Kuumia aiheita voitaisiin nostaa nopeammin käsiteltäväksi +Ei voimakkaasti vastustettuja päätöksiä prosessista ulos, tai vähintään hyvin perustein varusteltuna +Päätöksenteko vaikuttaisi ajankohtaisemmalta, paremmin kansan kysymyksiin vastaavalta Hyödynnettävyys ja esteet: +Dataa on jo paljon, sosiaalinen media, erilaiset kyselyt -Datan luotettavuus ja eri lähteiden painottaminen olisi haastavaa ja altista muutokselle. Mikä olisi oleellista ja tärkeää?
Samalla osallistaminen voi olla toimiva menetelmä myös uusien datalähtöisten palveluiden kehittämisessä. Käyttäjien havaintoja tai heiltä saatua tietoa voi hyödyntää toiminnan parantamisessa ja osittain erilaisten mallien synnyttämisessä. Esimerkkinä tästä voisi olla vaikka reittisuosituksia yms. antava liikennesovellus, joka yhdistelisi sekä käyttäjien dataa että esimerkiksi reaaliaikaista liikennedataa saavuttaakseen mahdollisimman tarkat ennusteet sekä paremman palvelun.
Osallistamista sekä käyttäjien havaintojen keräämistä ja hyödyntämistä tulisi soveltaa myös hallinnon palautteen keräämisessä ja toiminnan suunnittelemisessa yhä enemmän.
Tekniset käytännöt ja standardit
Eri organisaatioihin kertyvä data täytyy pystyä ottamaan tehokkaasti käyttöön siellä missä sitä tarvitaan; tätä tarkoitusta varten tarvitaan yhteisiä sopimuksia tai standardeja, kuinka dataa tallennetaan, jaellaan ja prosessoidaan.
Yhteisen teknisen alustan kehittäminen avoimen lähdekoodin hengessä on tehokas tapa viedä asiaa eteenpäin. Näin vältetään useiden suljettujen kaupallisten järjestelmien pirstaloiva vaikutus eri datalähteiden tehokkaaseen hyödyntämiseen. Sopivalla lisensointipolitiikalla yritysten liiketoiminta yhteisen alustan päälle on mahdollista ja samalla rakennetaan uutta ekosysteemiä Suomeen big datan ympärille. Tällainen alusta luo potentiaalisesti uuden vientivaltin.
Sovellusalueet ja niiden potentiaali Suomessa
Terveys
Terveydenhuollon kenttä liittyy big dataan lukuisilla eri tavoilla, ja Suomessa on jo alan osaamista esimerkiksi bioinformatiikan ja molekkyylilääketieteen alalla. Toinen tärkeä linkitys tulee itsenmittausteknologioiden kehityksestä, jossa suomalaisyrityksissä on osaamista kymmenien vuosien ajalta. Terveysdatan laajemman saatavuuden ennustetaan muuttavan ihmisten käsitystä itsestään ja omasta terveydestään. Elämäntavoista ja geenitiedon avulla kertyvän big datan avulla voi ehkä tulevaisuudessa ehkäistä sairastumista. Nykyään terveystietoja voi kerätä esimerkiksi Taltioniin, josta voi tulla tulevaisuudessa tärkeä alusta henkilökohtaiselle big datalle.
Big data mahdollistaa terveydenhuoltoon uudenlaisen oppimisen, kun kerrytetty ja analysoitu data tukee lääkärien ja muun hoitohenkilökunnan työtä. IBM:n kehittämä Watson on yksi esimerkki siitä millaisia käyttöjä big datalle on kehitelty. Kun potilas kertoo oireistaan lääkärille, lääkäri voi samalla kysellä Watsonilta taustatietoja potilaan oireiden perusteella. Watson käy muutamassa sekunnussa tietokannastaan läpi hakusanojen avulla tuhansia oppikirjoja ja satoja tuhansia tieteellisiä artikkeleita. Big datalta odotetaan terveydenhuollon laadun parantumista ja säästöjä. Data-analyysin odotetaan kehittyvän tavalla, joka auttaa yksittäisen kansalaisen terveysriskien ennustamisessa erilaisten datavirtojen avulla sekä sairauksien ehkäisyssä. On tärkeää, että suomalaiset tuntevat kansainvälisen kentän ja ovat mukana ohjaamassa ajankohtaisia kehityskulkuja.
Terveystietojen hyötykäyttöön liittyy yksityisyyteen, sosiaalisiin ja eettisiin näkökulmiin liittyviä kysymyksiä, jotka on otettava vakavasti. Ilman niitä suotuisat kehityskulut tuskin ovat mahdollisia. Yksi tapa on määritellä vastuullisen aineiston käytön puitteita yhteistyössä eri alojen osaajien kanssa.
Use case: Epid research oy:n diabetestutkimus.IBM, project Artemis. 23andme. OECD:n big data for health. DARPA, data mining for Cancer Research. Taltioni.
Julkishallinto
Suomea viime vuosina koetelleet finanssi- ja pankkikriisit, työn ulkomaille siirtymiseen vaikuttavat globaalin kilpailutilanteen muutokset sekä nopean teknologiakehityksen myötä kiihtyvät liiketoiminnan murrokset perinteisesti työllistäneillä toimialoilla ovat kaikki aikamme globaalitalouden ilmiöitä, jotka asettavat suuria haasteita ja uudistusmisvaatimuksia Suomen jo ennestään ylivelkaantuneelle julkiselle sektorille. Em. globaalien ilmiöiden seuraukset Suomelle ilmenevät mm. vientiteollisuuden paikoittaisena kilpailukyvyn romahtamisena, rakenteellisen työttömyyden kasvamisena ja julkisen talouden kestävyysvajeen syvenemisenä. Edessä oleva suurten suomalaisten ikäluokkien eläköityminen tulee tulevaisuudessa rasittamaan julkisen talouden kustannusrakenteita entisestään.
Suomen virkaa tekevä hallitus on pyrkinyt torjumaan kestävyysvajetta ja tasapainottamaan julkista taloutta mm. rakennepoliittisilla uudistustoimenpiteillä, jotka kohdistuvat moniin eri yhteiskunnan osa-alueisiin kuten esim. terveydenhuoltoon, kuntauudistukseen, työurien pidennykseen, rakenteelliseen ja nuorisotyöttömyyden torjuntaan sekä työ- ja kouluttautumismahdollisuuksien lisäämiseen. Rakenteellisten muutosten mahdollistamien kustannussäästöjen lisäksi tuottavuuden lisääminen niin kustannus- kuin palvelutehokkuutta parantamalla on keskeisiä julkisen sektorin tavoitteita.
Big Data ajattelutapana (kts. Datatietoisuus) ja teknologiana antaa omalta osaltaan uudenlaisia näkökulmia hallinnolle edistää tuottavamman yhteiskunnan ja kestävyysvajeen torjumisen strategisia päätavoiteita, lisäten samalla kansalaisten tyytyväisyyttä julkisiin palveluihin. Big Datan avulla on mahdollista realisoida tuottavuushyötyjä useimmilla hallinnon alueilla. Datalähtöisempää julkishallintoa voidaan yleisesti tarkastella esim. kolmessa seuraavassa osa-alueessa: Datalähtöisen päätöksenteon ja jatkuvan organisaatiokehityksen tuominen osaksi julkishallinnon kulttuuria, kansalaisten henkilökohtaisemmat palvelut sekä yritysten ja kansalaisten parempi osallistaminen mm. julkisten palveluiden kehitykseen (kts. Osallistaminen) Lisäksi Big Datan hyödyntämistä tulee tarkastella eri hallinnonaloille kohdistettavissa olevien yksittäisten Big Data-käyttötapausten kautta.
Big Datan tuottavuusparannuksista julkishallintoon on haastavaa esittää tarkkoja arvioita ilman täsmällisempää analyysiä, mutta McKinsey arvioi vuoden 2011 raportissaan Euroopan julkishallintojen kykenevän Big Dataa hyödyntämällä vähentämään hallinnollisia kulujaan n. 15-20 prosenttia ja lisäämään 0,5 prosentin vuotuisen parannuksen tuottavuuteen. (McKinsey Global Institute, 2011, Big data: The next frontier for innovation, competition, and productivity)
Tavoitteena data- ja asiakaslähtöisempi organisaatiokulttuuri
Datalähtöinen organisaatiokulttuuri edellyttää, että julkishallinto pyrkii tietoisesti ja jatkuvasti omaksumaan maailmalla parhaiten toimiviksi todettuja käytäntöjä tiedolla johtamisessa, organisaatioiden kehittämisprosesseissa (esim. lean-prosessit), organisaation tavoitteisiin sidotussa suorituskykymittauksessa sekä dataan perustuvan päätöksenteossa. Datalähtöisessä julkishallinnossa organisaatiot, niin pienet kuin suuremmat yksiköt, määrittelevät omaa missiotaan ja tavoitteitaan tukevat, selkeästi ymmärrettävät ja läpinäkyvät datalähtöiset suorituskykymittarit. Kansainvälisestikin vertailukelpoisesti valitut mittarit ohjaavat organisaatioita tekemään ohjattuja päätöksiä, jotka palvelevat mahdollisimman tehokkaasti organisaation oman mission ja kansalaisten palvelutulosten toteutumista. Datalähtöistä päätöksentekoa tukevat Big Data-järjestelmät mahdollistavat päätöksenteon tavalla, jossa tekeillä olevien päätösten hyötyjä, kustannuksia ja pitkän tähtäimen vaikutuksia on mahdollista ymmärtää ja simuloida ennen päätösten varsinaista toimeenpanemista. Big Datalla on tärkeä merkitys entistä edistyneempien ja ennakoivempien mittareiden mahdollistamisessa, samoin kuin laadukkaiden mittarien edellyttämän hienojakoisten signaalien löytämisessä organisaatioiden suurista tietomassoista. Muutos datalähtöiseksi organisaatioksi on kokonaisvaltainen, joskin eri kypsyysvaiheessa olevat organisaatiot toki ottavat askeleita tavoitteisiin vaiheittain. Datan avaamisesta, laadun varmistamisesta, tiedonhallinnan roolien, prosessien ja vähimmäisarkkitehtuurikyvyyksien luomisesta edetään tietoisesti kohti omaa toimintaansa mittaavaa ja optimoivaa organisaatiota. Lopulta oleellista on valita organisaation suorituskykyä kuvaavat korkean tason suoriutuskykymittarit siten, että ne voidaan ymmärrettävästi ja läpinäkyvästi linkittää organisaation mission ja tavoitteiden toteutumiseen ja näitä edistäviin käytännön toimenpiteisiin. Mittareiden pohjana olevien oletusten, käsittelysääntöjen ja lopulta itse datan läpinäkyvyys kansalaisille toimii omalta omaltaan takeena valittavien mittareiden luotettavuudelle ja ”peukaloimattomuudelle”. Julkisten toimijoiden tärkeimmät korkean tason suorituskykymittarit kohdistuvatkin yleensä lopulta toimijoiden palvelemiin ”ulkoisiin asiakkaisiin” – eli kansalaisiin ja heidän palvelukokemukseensa, mikä tilivelvoittaa hallintoa jatkuvasti parantamaan kansalaisille tarjoamaansa palvelua. Yleisiä, koko Suomea koskevia taloudellisia ja yhteiskunnallisia korkean tason mittareita ylläpitää esim. Findikaattori (www.findikaattori.fi).
Esimerkkinä julkishallinnon mission asiakaslähtöistämisestä voidaan pitää Ranskan massiivista finanssikriisin jälkeistä hallintoreformia, jonka säästötavoite vuoden 2009-2013 aikana oli 15 miljardia euroa ja leikkaustarve yli 150 000 julkisen sektorin tehtävää. Kustannusäästöjen lisäksi tavoitteena oli palvelun laadun radikaali parantaminen. Reformia valmistellessa kansalaisilta ja yrityksiltä pyydettiin yksinkertaista pisteytysarviota koskien yhteensä 50 erilaista kansalaisten ja julkishallinnon välistä ”elämänaikaista tapahtumaa” sekä vastaavasti 30 erilaista yritysten ja julkishallinnon välistä ”yritysten elinkaarenaikaista tapahtumaa”. Esimerkkeinä kansalaisia koskevista tapahtumista olivat esim. ”avioliiton solmiminen” ja ja yrityksiä koskevista interaktioista esim. ”uuden yrityksen perustaminen”. Reformin alussa kansalaiset ja yritykset arvioivat kunkin julkishallintoon suuntautuvan interaktionsa koettua monimutkaisuutta arvoilla ”yksinkertainen”, ”OK”, ”monimutkainen ”, ”erittäin monimutkainen”. Varustettuna näillä alustavilla kansalais- ja yritysnäkökulmilla julkisen asioinnin havaitusta monimutkaisuudesta, tuli kyseisiä asiointiprosesseja hallinnoivien yksiköiden uudeksi ja ainoaksi asiakaslähtöiseksi missioksi uudistaa koko toimintansa siten, että kansalaisten ja yritysten monimutkaiseksi kokemat ”elämän tapahtumat” saadaan mahdollisimman nopeasti muutettua mahdollisimman yksinkertaiseksi. Reformin valmistuttua kyselyn tulokset osoittivat julkisen asioinnin havaitun monimutkaisuuden pudonneen (eli koetun palvelun laadun lisääntyneen) 20 prosenttia kansalaisten tapauksessa ja 25 prosenttia yritysten tapauksessa. (McKinsey Interview 2013, Francois-Daniel Migeon, Transforming Goverment in France)
Suorituskykykyä vertailemalla parhaita käytäntöjä
Julkishallinnon yksiköiden oman päätöksenteon tehostamisen lisäksi datalähtöisellä mittaamisella on erittäin tärkeä merkitys julkisten yksiköiden keskinäisessä suorituskykyvertailussa (benchmarking), joka tarjoaa julkisen toimijan ulospäin läpinäkyvän suorituskykyinformaation lisäksi yksikölle itselleen vahvan sisäisen insentiivin ja lähtökohdan kehittää omaa suorituskykyään edelleen. Suorituskykyvertailun keskeisenä oivalluksena on se, että näennäisesti erilliset julkiset toimijat voivat olla missioltaan, perusprosseiltaan tai esim. rakenteeltaan hyvinkin samankaltaisia. Nämä keskinäiseen vertailuun soveltuvat yksiköt voivat olla esim. eri henkilökunnan tai tahon toimesta johdettuja sisaryksiköitä samassa julkisessa emo-organisaatiossa tai hallinnonalassa mutta aivan yhtä hyvin verrokkiorganisaatiot voivat olla kokonaan erillisiä julkisia toimijoita tai yksityisiä yrityksiä Suomesta tai muualta maailmasta. Kun julkiset toimijat ja yritykset eri puolilla Suomea ja maailmaa mittaavat omaa suorituskykyään lisääntyvässä määrin keskenään vertailukelpoisella standardimittaristolla, voivat tietyllä osa-alueella muihin nähden alisuorittavat julkishallinnon yksiköt oppia, omaksua tai parhaassa tapauksessa suoraan kopioida parhaita suorituskyvyn tehostamiskäytäntöjä niiltä verrokkiyksiköiltä, jotka ovat kyseisellä osa-alueella kansainvälistä huippua.
Esimerkkinä suorituskykyvertailusta on tutkimus, jossa yhteensä 13 maan verohallintoa verrattiin toisiinsa erilaisilla verohallinnollisilla osa-alueilla (esim. verotietoja koskevat rutiinitoimenpiteet, ei-ilmoitettuihin tietoihin liittyvät auditoinnit, tehostettu proaktiivinen veronkeruu, monikanavainen asiakaspalvelu). Tiivistäen, tutkimus osoitti että yksikään verohallinnoista ei ollut paras kaikilla osa-alueilla eli kaikilla oli opittavaa toisiltaan suorituskyvyn parantamisessa. Lisäksi tutkimus osoitti, että 13 verohallintoa yhdessä voisivat kerätä 86 miljardia euroa lisää suorina veroina ja säästää 6 miljardia kuluissa, mikäli kaikki verohallinnot toteuttaisivat veronkeruun yhtä hyvin kuin paras kolmasosa. (Thomas Dohrmann and Gary Pinshaw, ”The road to improved compliance: A McKinsey benchmarking study of tax administrations 2008-2009)
Edellä esitetyt datalähtöisemmän organisaatio- ja päätöksentekokulttuurin luominen sekä suorituskyvyn jatkuva parantaminen ovat tärkeitä askeleita kohti huomispäivän tuottavampaa ja sitä kautta kestävämpää julkishallintoa. Datalähtöisen kulttuurin voivat saada toimimaan ainoastaan julkishallinnossa työskentelevät ja työnsä merkityksellisyydestä motivoituneet ihmiset, jotka sekä ymmärtävät oman työnsä perimmäisen palvelutarkoituksen ja jotka ovat valmiita datalähtöisyyden edellyttämään asennemuutokseen. Ihmisten kouluttaminen, motivoiminen ja vastuuttaminen tähän uuteen organisaatiokulttuuriin on suuri haaste ja muutos, jota on lähestyttävä kokonaisvaltaisesti pelkkien inkrementaalisten organisaatiomuutosten sijaan. Datalähtöisen muutoksen käynnistäjiksi ja suunnannäyttäjiksi tarvitaankin kokeneita ja vastuutettuja tiedolla johtamisen pioneereja, joilla on vahvan datalähtöisen näkemyksen lisäksi kyky motivoida ihmisiä ja organisaatioita pitkäjänteisesti.
Kansalaisille yksilöllisempää julkista palvelua
Eräs julkishallinnon kestotavoitteista on tarjota kustannus- ja palvelutehokkaampia palveluita kansalaisilleen eli säästää nykyisten palveluiden kustannuksissa ja/tai parantaa palveluiden vaikuttavuutta kustannusrakenne säilyttäen. Keskeinen keino parantaa palvelun vaikuttavuutta ja kansalaistyytyväisyyttä on segmentoida kansalaiset Big Datan tarjoamin menetelmin ja siten tarjota heille henkilökohtaisempaa palvelua. Datalähtöisemmät palvelut vievät myös kansalaisten kokeman loppukäyttäjäkokemuksen seuraavalle tasolle. Sen perusteella millainen kansalainen on, missä kansalainen on, mitä kommunikointivälinettä hän käyttää ja mitä hän on parhaillaan tekemässä, voi älykäs palvelu ehdottaa kansalaiselle ”päätöksiä” siitä, mitä hänen mahdollisesti tai luultavasti kannattaisi tehdä seuraavaksi. Kansalaisen tehtäväksi jää sitten tyypillisesti ja minimissään annettujen datalähtöisten ehdotusten hyväksyminen, tarvittaessa myös käyttäjälle päätöksen yhteydessä annettujen tarkempien perustelujen tai toimintasuositusten pohjalta. Henkilökohtaisemmat ja päätöksentekoa helpottavat käytettävät palvelut parantavat automaattisesti kansalaisten tyytyväisyyttä ja luottamusta julkishallintoon.
Esimerkkinä suuren mittakaavan kansalaisten analyyttisestä segmentoinnista ja julkishallinnon personoidusta asiakaspalvelusta on Saksan valtiollinen työllisyysvirasto Bundesagentur fur Arbeit (BA), jonka päätehtävänä on integroida työnhakijat mahdollisimman nopeasti takaisin työvoimaan ja omalta osaltaan tehostaa yritysten rekrytointiprosesseja. Segmentoimalla tarkasti tarjolla olevat työtehtävät ja työntekijät sekä räätälöimällä yksilöllisesti mm. työnhaun edistämiseen tarkoitetut neuvontapalvelut, BA on saanut aikaan merkittäviä tuloksia. Vuodesta 2006 vuoteen 2011 BA:n asiakkaan keskimääräinen työttämänäoloaika putosi 162 päivästä 136 päivään, työttömien määrä putosi 4,5 miljoonasta 2,9 miljoonaan ja BA:n kautta työllistyneiden määrä (per vuosi) kasvoi 240 000 ihmisestä 510 000 ihmiseen. Myös BA:n asiakastyytyväisyys niin työntekijöiden kuin työnantajien puolella parantui huomattavasti kyseisenä aikana. (McKinsey Interview 2013, Frank Jurgen Weise, Behind the German jobs miracle)
Laadukkaiden palveluiden tulee lisäksi kaikin tavoin säästää kansalaisten aikaa, esim. kaikki kansalaisille näkyvät hakemus- ja tiedonsyöttöprosessit tulisi automatisoida byrokratian ja käsittelyvirheiden vähentämiseksi. Kansalaisille on oltava mahdollisuus itse päivittää esim. kaikkia julkiseen asiointiinsa liittyviä, valmiiksi esitäytettyjä henkilö- ja hakemustietojaan. Riippumatta mikä taho julkiset digitaaliset palvelut varsinaisesti teknisesti rakentaa, tulee kaikkien palveluiden tukea helposti saatavissa olevaa reaaliaikaista palautetta niiden käytöstä, niin kansalaisten antaman eksplisiittisen yhteisöllisen palautteen kautta kuin palvelun varsinaiseen käyttöön perustuvaan analytiikan muodossa. Käytöstä kerättyä palautetta voidaan jälkeen päin analysoida niin palvelun käytettävyyden kuin varsinaisen julkisen asioinnin kehittämisen kannalta.
Julkishallinnon mahdollisia Big Data-käyttötapauksia ja alustavia vaikuttavuussarvioita
Julkishallinnolla on suuria määriä dataa, tyypillisesti rakenteisessa teksti- ja numeromuodossa. Julkishallinnon tuottavuutta voidaan parantaa yksittäisillä ja kustannussäästöjä teknisillä Big Data-ratkaisuilla, jotka on kohdistettavissa julkishallinnon eri hallinnonalojen ja yksiköiden täsmällisiin tietojenkäsittelyllisiin ongelmiin. Hyödynnettäessä Big Dataa julkishallinnossa, on teknisiä IT-ratkaisuja huomattavasti tärkeämpää saada aikaan datalähtöisyyden edellyttämä asennemuutos julkishallinnon ihmisissä ja työskentelytavoissa ja sitä kautta luoda jatkuvaan mittaamiseen ja hallinnon parantamiseen liittyvä datalähtöinen organisaatiokulttuuri. Alla on lueteltu mahdollisia sovelluskohteita Big Data –ratkaisuille, joiden vaikuttavuutta säästöjen ja tuottavuudenparannuksen kannalta tulisi tutkia lisää tapauskohtaisesti:
Työvoima ja kouluttautuminen (TEM, OKM)
- Koulutustarjonta-, työtarjonta- ja työvoimatarjontatietovarantojen yhdistäminen ja analyyttinen segmentointi työttömän työvoiman mahdollisimman nopeaksi ja tarkaksi kohdistamiseksi tarjolla oleviin ja työttömille hakijoille yksilöllisesti soveltuviin työ- ja jatkokouluttautumistilaisuuksiin. Tällä voidaan omalta osaltaan tukea hallituksen tavoitteita nuorisotyöttömyyden torjumisessa, työurien pidentämisessä, ammatillisen koulutuksen tarjoamisessa, välityömarkkinoissa sekä työtarjousten lisäämisessä (ja niiden tiukennetusta vastaanottovelvollisuudesta).
- Sosiaalietuuksien ja –tukien väärinkäytön data-analyyttinen ennakoiminen ja tukihakemusten/päätösten käsittelyn nopeuttaminen
- Tarjotun työn ja sen vastaanottamisen tarpeen perusteleminen data-analyyttisesti tarjotusta työstä kieltäytymisen vähentämiseksi
- Education to Employment (E2E) parhaiden käytäntöjen soveltaminen yhdessä yritysten kanssa, mm. kasvan teknologiatyöttömyyden suunnan ennakoimiseksi
- Yleisesti työllisyyteen liittyvien koulutus- ja osaamistarpeiden seuranta ja työvoimapoliittisten strategioiden paremmaksi ennakoimiseksi
- Vaikuttavuus: Mallina Saksan BA-esimerkki
Harmaan talouden ja kansainvälisen veronkierron torjunta (Verohallinto)
- Tehostettu petosten ja virheiden havainnointi Big Data-ratkaisuilla osaksi harmaan talouden torjuntaohjelmaa
- Kovaan dataan perustuvien veroanalyysien täydentäminen esim. sosiaalisen median pehmeämmällä datalla
Hallituksen kestävän kehityksen mittarit (Ympäristöministeriö, Sisäministeriö)
- Yhteiskunnalliseen kestävyyteen liittyvät Big Data-mittarit ja niiden kansalaisystävällinen seuranta
- Ympäristön kestävyyteen liittyvät Big Data-mittarit ja niiden kansalaisystävällinen seuranta
Älykkäämpi liikenne (LVM)
- Kts. Liikenne
- Crowdsourcing-periaatteella toimiva viranomaistahoihin yhdistetty reaaliaikinen kaupunkivalvontapalvelu, johon kansalaiset voivat raportoida sijiantikuvin havaitsemiaan tapahtumia (esim. onnettomuudet) tai turvallisuusriskejä kaupunki-infrassa
Koulutuksen kehittäminen ja koulutustarjonnan lisääminen (OKM)
- Kts. Koulutus
Kyberstrategia (PM)
- Hallinnon tietoverkkojen Big Data-analyysi turvallisuusuhkien mahdollisimman tehokkaaksi määrittelemiseksi
Julkiset hankinnat
- Julkishallinnon toimittajien data-lähtöisempi suorituskyky- ja kustannustehokkuusvertailu hankintapolitiikan ketteröittämiseksi ja paremmaksi kohdistamiseksi osana hankintalain uudistamista
Älykäs matkustuspolitiikan valvonta
- Data-analyyttinen palvelu rajoittamaan tarpeetonta julkisen henkilökunnan matkustelua perustelemalla datalähtöisesti optimaalisen matkustajamäärän, matkustusmuodon ja -tarpeen
Kansalaisille avoimempi ja ymmärrettävämpi kuva valtiontalouden tilasta (VM)
- Kansantalouden data-analyyttinen "simulaattori” palvelemaan yksityisten, julkisten tahojen ja yksittäisten kansalaisten tekemiä tutkimuksia koskien valtiontalouden tilaa (VM)
- Valtion rahoitusvirtojen ihmisystävällisemmät visualisoinnit avoimen datan pohjalta, esim. oman äänestyspäätöksen helpottamiseksi
- Muut taloudelliseen kestävyyteen liittyvät Big Data-mittarit ja niiden kansalaisystävällinen ja -motivoiva seuranta
Julkinen palvelualusta
- Platform ajattelu
- Kts. Osallistaminen
Reaaliaikainen kansalaisäänen ja -vaikuttamisen seuranta
- Sosiaalisen median, blogien ja verkkosivujen reaaliaikainen keskitetty seuranta kansalaiskohderyhmittäin ja hallintoa kiinnostavien aihepiirien perusteella, tavoitteena seurata esim. hallinnon viestien vaikuttavuutta kiinnostavissa tai esim. hankalammin tavoitettavissa kansalaiskohderyhmissä
Älykkäät verkot
”Infomediary”
Erilaisille tietotulvaa helpottaville työkaluille ja mm. etsintämentelmille on vielä kysyntää esimerkiksi tutkimuksen parissa. Suomessa tehdään alaan liittyvää tutkimusta. Tietotyö sinällään lisääntyy jatkuvasti.
Hyötyjä ja potentiaalia, jota ala voisi oikeilla panostuksilla tarjota, ovat muun muassa:
- tietotulvan parempi hallinta
- löydetään relevantimpaa tietoa vuorovaikutteisen (oppivan) ja visuaalisen järjestelmän avulla
- Käyttäjälle näytetään perusteet miksi juuri tietyt tiedot näytetään, ja annetaan myös mahdollisuus vaikuttaa näihin perusteisiin; näin käyttäjä voi aidosti ohjata tiedon hakemista ja jalostamista
- tietotyön laatu ja tehokkuus paranevat
- menetelmässä yhdistetään ihmisen luovuus ja ja tietokoneen kyky käsitellä massiivisia ja monimuotoisia tietoaineistoja kontrollin säilyessä ihmisellä.
- tiedonhaun tehostuessa tietotyöntekijöiden aikaa vapautuu päättelyyn, luovaan ajatteluun ja yhteistyöhön.
- testeissä uudenlaisetn tiedonhakujärjestelmän prototyyppi on todettu Googlen scholar.google.comia tehokkaammaksi - tällä hetkellä tiedonhakujärjestelmän prototyyppiin on indeksoitu vain tieteellisiä artikkeleita (valikoiduista tietokannoista, yli 60 milj.); tavoitteena on kuitenkin laajentaa konseptia muunkinlaisen tiedon hakuun
Suomessa on erittäin korkealaatuista ja monitieteellistä tutkimusta alueella (HIIT:istä 7 tutkimusryhmää ja Työterveyslaitoksen Aivot työssä -tutkimusryhmä, www.reknow.fi / Tietotyön vallankumous). Panostuksia alalle olisi saatavissa: Tietotyön vallankumous on TEKESin toinen strateginen tutkimusavaus syksyllä 2013.
Tutkimus
- Mahdollistajat: Uudet tutkimusmenetelmien kehitys. Esim. tekstuaalisten dokumenttien käsittelymenetelmät, mobiilidatan ja sosiaalisen median sekä trendidatan tuomat uudet tutkimusmahdollisuudet.
- Haasteet: Monitieteisyys, tietoaineistojen saatavuus. Eri alojen osaajista koostuvat tutkimustiimit?
- Hyöty: Uudet löydöt historian tutkimuksessa uusilla analyysitavoilla.
Liikenne
- Mahdollistajat: Liikenteen ohjaus , reaaliaikaisen datan lisääntyminen. Reittien ennustaminen. Logistiikan optimointi tavarakuljetuksissa.
- Haasteet: esim. julkiset aikatauluaineistot pirstaloituneina eri puolilla, yhteen saattaminen.
- Hyöty: Turvallisuuden parantaminen, ruuhkien vähentäminen, päästöjen vähentäminen. Matkustamisen helpottuminen. Toimitusaikojen lyhentyminen.
- Use case: Tukholman kaupunki + KHT institute of technology + IBM. US Xpress
Big datan avulla voidaan tavoitella ja saavuttaa monia hyötyjä liikenteen alalla.
- Liikenneturvallisuus
- Liikenteen ja liikkumisen tehostuminen
- Ekologisempi liikenne
- Joukkoliikenteen ja kevyen liikenteen tehostamiseen liittyville ekologisille ratkaisuille on erityistä tarvetta.
- Liikenteen ongelmat ovat globaaleja ja siinä on mahdollista kehittää vientituotteita, esim. liikennekuvan parantaminen, liikenteen analysointi, lyhyen aikavälin liikenne-ennusteiden parantaminen, liikennesuunnittelu ja siihen liittyvät analyysit
Big data on hyödynnettävyys liikennealalla on varsin suuri, Suomella olisi mahdollisuus profiloitua liikenteen kokeiluympäristönä. Tätä jo osin LVM:n liikennepuolella tehdäänkin. Suomessa on myös tehty tutkimusta uudenlaisista liikennejärjestelmistä, esimerkiksi Yhdistelmäliikenne, Ytrips Oy ja Shosta Sulosen tutkimukset Aalto-yliopistossa.
- - Suomen liikenne on pienimuotoista esim. Kiinaan verrattuna
- + Samalla tosin Suomea on helpompi hyödyntää laboratoriotyyppisenä ympäristönä
- + Suomessa ollaan edelläkävijöiden joukossa (ei ainoita) avoimen liikennedatan käytössä
- + Nykyisiä ratkaisuita voidaan parantaa nimenomaan "big data" -tyyppisin ratkaisuin
Suomella on paljon alaan liittyviä mahdollisuuksia ja potentiialia Suomessa ollaan viime aikoina oltu aktiivisia ja alalla on tutkimusryhmiä, joilla on sekä kansallisia että kansainvälisiä yhteyksiä. Toimintapotentiaali on näin ollen hyvä. Liikennealalla liikkuu raha, joten mahdollisuus kansainvälisenkin tason toimintaan on olemassa, jos toimeen tartutaan ennakkoluulottomasti.
Case: Tieliikennepalveluiden markkinapaikka, liikenne palveluna. Aikataulut, yhteydet, tilausautot, taksit, vuokraus yms. Kaikki liikennepalvelut saataisiin yhdestä paikasta. Osittain tähän suuntaan ollaan menossa. Tämä voisi olla virtuaalisesti yksi paikka. Taustalla raksuttaisi varmasti on useampia lähteitä ja palveluja.
Olisi hyödynnettävissä, kunhan yhteistä tahtoa olisi riittävästi Saavutettaisiin kustannussäästöjä ja julkisen liikenteen tehokkaampaa käyttöä Esteenä muun muassa toimijoiden välinen kilpailutilanne.
Voisi kuvitella, että jos jossain niin Suomessa tällainen olisi saavutettavissa Hyödyt esim. 15% enemmän julkisten liikennepalvelujen käytöllä olisi merkittävä etu koko maalle.
Huolto ja muut ennakoivat etäpalvelut (TI)
Huolto ja ennakoivat etäpalvelut ovat yksi osa-alue laajemmassa kokonaisuudessa, josta usein käytetään termiä Teollinen Internet (TI). Tällä tarkoitetaan sulautettujen ja älykkäiden laitteiden ja järjestelmien, niistä jatkuvasti kertyvän datan ja siihen pohjautuvan data-analytiikan sekä ihmisten työn tehokasta yhdistämistä liiketoimintaprosesseissa. Tämä mahdollistaa sen, että tuotanto- ja muut resurssit, tieto, esineet ja ihmiset muodostavat reaaliaikaisesti verkottuneen kokonaisuuden. Sovellusalueita ovat mm. valmistavan teollisuuden prosessit ja niiden optimointi, ennakoiva huolto, energian käytön hallinta, käyttöomaisuuden hallinta ja ennakoiva huolto. Vähintään yhtä suuret hyödyntämismahdollisuudet ovat myös varsinaisen teollisuuden ulkopuolisessa elinkeinolämässä, kuten esim. terveydenhuollossa, kaupan ja logistiikan alueella, rakentamisessa ja kiinteistöjen hoidossa sekä kunnnallisten ja muiden julkisten palvelujen tuottamisessa (energia, vesi, jätevesi...). Yhteistä kaikille sovellusalueille on se, että tavalla tai toisella on olemassa automatisoitu linkki fyysisen maailman ja digitaalisen maailman välillä. Usein tuo linkki syntyy joukosta antureita tai tägejä, joilla voidaan saada tietoa esineiden tai ihmisten tilasta, olinpaikasta ja muista tekijöistä. Kun tätä tietoa yhdistetään ja analysoidaan yhdessä kertyneen historiatiedon sekä muiden tietovarantojen kanssa, voidaan tehostaa merkittävästi nykyisiä toimintatapoja ja -prosesseja sekä luoda myös aivan uusia palveluja ja liiketoimintaa.
- Mahdollistajat: etähuolto, huollon automatisointi, laitteiden itseanalyysi, vikojen ennustaminen (Konecranes) Optimointi yhteistä koko alalle.
- Haasteet: Laajamittaista hyödyntämistä tai esimerkkejä siitä ei vielä olemassa.
- Hyöty: sopii hyvin erilaisille aloille, säästöt, halpatyökorjauksen sijaan korkeamman vaatimustason työtä, Kustannushyödyt, mahdolliset alaan liittyvät (vienti) innovaatiot.
- Use case: Ennakoiva huolto, Kone, GE. Outokumpu.
Suomella olisi mahdollisuuksia muun muassa palveluliiketoiminnan synnyttämisessä teollisen internetin avustuksella ja -ympärille. Palvelu ja huolto yhdistettynä etähuoltoon, automatisointiin, ennakoivaan huoltoon. Merkittävä osa ongelmanratkaisuista ja korjauksista voidaan automatisoida. Tämä toiminta sopii eri teollisuusalueille: Metalliteollisuus, konepajat (esim. Konecranes), tietoliikenne. Kaikki vähänkin arvokkaammat laitteet tai toiminnallisuudet pystyvät itse analysointiin ja ne voidaan testata/analysoida/korjata etäältä. Usein vikaantuminen voidaan jo ennakoida. Tällä saadaan merkittäviä säästöjä ja kompetenssi siirretään halpatyösuunnasta korkeamman kompetenssin vaatimuksiin.
Eri toimialoilla samoja tai samantapaisia tarpeita. Vaatii osaamista ja kombinaatiota erilaisista asioista: Kompetenssi, Anturit, Etäyhteys, Big Data käsittely.
Suomessa on alaa silmällä pitäen hyvä koulutustaso ja kompetenssi, myös toimintaa ja intressi on jo osittain olemassa. Etäinen sijainti markkinoilta ja päämyyntialueilta luonnollista Suomesta. Sopivia teollisuusaloja, joihin big data-lähtöinen palveluliiketoiminta sovellettaviss muun muassa metalli, koneteollisuus sekä tietoliikenne.
Cleantech
Digitalisaatio esim. Cleantech-osaamiseemme liitettynä mahdollistaa uusia innovointi- ja vientimahdollisuuksia mm. jättimäisille ja kasvaville Aasian markkinoille. Cleantechin yleinen merkitys on vahvassa kasvussa resurssiniukassa maailmassa, ei välttämättä aina omana ympäristötekniikan alanaan vaan kaikkeen muuhun liiketoimintaan sulautettuna.
Myös Cleantech-kehitystä silmälläpitäen tarvitaan uusi platform-ajattelua hyödyntävä yhteistyön malli, jolla pienet yritykset voisivat suoraviivaisemmin toimia toimia isojen teollisuusyritysten innovaatiopartnereina ja sitä kauttaa tuottaa runsaasti ja tehokkaasti yksinkertaisia konsepteja/palveluita suuryritysten teknologian (alustat, laitteet) tai datan ympärille
Nopean kansainvälistymisen (ja toki rahoituksen) haasteet käännettävä vahvuuksiksi uusilla vientikelpoisilla innovaatioilla ja palveluilla - Em. cleantechin innovoinnista ja vahvuuksista huolimatta Suomella ei välttämättä juurikaan ole alueelta omia kotimaisia käyttöreferenssejä. Ratkaisuja täytyisi kokeilla rohkeasti ensin myös kotimaassa. Osittain haasteena ovat myös teollisen internetin standardien (ja osin teknologioiden) kypsymättömyys, vaikka tulevaisuuden potentiaalia on paljon.
Markkinointi ja mainonta
Gartnerin mukaan 50% Big Dataan käytettävistä investoinneista menee markkinointiin. Markkinointi on muuttumassa teknologiavetoiseksi. Gartnerin mukaan Chief Marketing Officerit käyttävät vuonna 2017 enemmän rahaa IT:hen kuin Chief Information Officerit.
Big Datan tyypillisimmät käyttötapaukset markkinoinnin ja mainonnan alueella liittyvät kuluttajakokemuksen parantamiseen, sisällön personointiin ja viestinnän kohdentamiseen.
Avaa tähän eri aiheita liittyen Big Dataan ja seuraaviin aiheisiin:
- Consumer Experience Management
- Real-time Bidding
- native advertising
- mobile & video advertising
- location-based advertising
- micro-targeting
- real-time personalization
Läpileikkaavia teemoja
Mydata
My Data viittaa toimintakulttuuriin, jossa organisaatio palauttaa keräämäänsä yksilökohtaista tietoa ihmiselle itselleen. Sen jälkeen ihminen voi hyödyntää sitä suoraan tai jakaa sen edelleen haluamallaan tavalla. Edelleen jaettu tieto voi olla analysoimatonta raakadataa tai se voidaan jalostaa esimerkiksi visualisoimalla muotoon, jossa muut voivat sitä hyödyntää.
My Data -näkökulmat ovat tärkeitä big dataan liittyvissä keskusteluissa, koska niiden avulla voi purkaa big dataan ja yksityisyyteen liittyviä uhkia. My Data -aloitteiden päämääränä on ollut henkilöitä koskevan tiedon ympärille syntyvien sovellusten, palveluiden ja toimintarakenteiden kehitys tavalla, jossa ihmisillä on keskeinen päätösvalta tiedon keräämisen, jalostamisen ja hyödyntämisen suhteen. My Data -aloittesiin liittyvä keskustelu yksityisyydestä korostaa ihmisten valtaa päättää siitä, kuka heidän tietojaan saa käyttää ja uusiokäyttää sen sijaan, että ihmiset antavat kerralla suostumuksen aineistojen käyttöön. Digitaalisuuteen liittyy nimenomaan mahdollisuus monistaa ja käyttää tietoa yhä uudelleen, jolloin ihminen ei suostumustaan antaessaan voi tietää tai hallita tulevaisuuden käyttötarkoituksia.
Onnistunut My Data -työskentely edellyttää, että yhteisistä henkilökohtaisiin aineistoihin liittyvistä periaatteista pystytään sopimaan. Tarvitaan viisasta sääntelyä, jonka avulla aineistojen jakaminen on mahdollista. Tarvitaan koneluettavia rajapintoja aineistojen jakamisen tueksi, standardeja ja palveluita tiedon hallittuun siirtämiseen, varastointiin, käsittelyyn ja analysointiin. Nämä pyrkimykset tukevat myös big datan hyötykäyttöä tulevaisuudessa.
Quantified self
Quantified Self –liikkeen juuret ovat Kaliforniassa ja erityisesti Wired-lehden ympärillä. Liikkeen keskeisenä ajatuksena on yksilöllisen mittaustiedon hyötykäyttö terveyden ja hyvinvoinnin edistämisessä. Viime vuosien aikana liike on levinnyt eri puolille maailmaa, ja saanut uusia muotoja. Kyse ei ole enää yksinomaan superterveydestä haaveilevien teknointoilijoiden liike vaan mittaamista istutetaan yhä uusille elämänalueille. Big data ja QS –näkökulmilla on paljon yhteistä, koska QS on yksi mahdollinen big datan tuottaja. Digitaalisten itsenmittausaineistojen arkistointiin tarvitaan uusia ratkaisuja. Tiedon hallinta on turvattu, kun yksilö omistaa tietonsa ja antaa sille käyttöoikeuden halutessaan. Kun itsenmittaajat haluavat jakaa aineistoja myös muille, tiedon käyttö on turvattava tavalla, joka hyödyttää sekä tiedon jakajaa että hyödyntäjää. Itsenmittauksen ympärillä on paljon uusia aloitteita, joita motivoi myös terveydenhuollon toimialamuutos. Suomessa itsemittausteknologioita kehittäneitä, kansainvälisillä markkinoilla toimivia yrityksiä on useita, muun muassa Firstbeat, Suunto ja Polar. Lisäksi alalla on lukuisia lupaavia start up -yrityksiä. Mittalaitteiden avulla ihmiset saavat uudenlaista tietoa itsestään. Itsehoito on aiempaa helpompaa, kun ihmiset voivat mitata kotona verenpainettaan tai seurata unen laatuaan. Tämä voi muuttaa vähitellen terveydenhuollon painopistettä ja lääkärien työtä. Lääkärit voivat keskittyä tiukemmin nimenomaan erikoistuneeseen sairauksien hoitoon, kun sairauksien ennaltaehkäisyyn on uudenlaisia vaihtoehtoja. Toisaalta QS haastaa myös käsityksiä terveydenhallinnasta ylittämällä olemassa olevan terveystoimialan. Itsenmittaajat ovat osoittaneet, että esimerkiksi ajankäyttödata voi olla terveysdataa. Esimerkiksi riippuvuuksia voi tarkastella ajankäytön avulla. Kiinnostavaa on myös terveydentila suhteessa ympäristöntilaan. Voiko ilmanlaatusta ennakoida tulevaisuudessa keuhkoahtaumapotilaan kohtauksen? QS-näkökulma on alkanut levitä myös muille toimialoille, esimerkiksi oman talouden hallintaan tai koulutukseen. Mittatietoa voi käyttää esimerkiksi omaehtoisen oppimisen seurantaan tai tekemään näkyväksi opettajien pärjäämistä eri luokkien kanssa.
Joukkoistaminen ja osallistaminen
Tiedon etsintä
Tietomäärien valtava lisääntyminen luo päivittäisiin työtehtäviin lisähaasteita myös kaikille tietotyöntekijöille. Esimerkiksi tiedonetsintä on alue, jota paremmin tukemalla voidaan saavuttaa merkittäviä kustannussäästöjä. Tutkimusten mukaan loppukäyttäjät etsivät tietoa varsin yksinkertaisilla hakusanoilla ja menetelmillä, eivätkä he useinkaan tarkastele tuloksista kuin 10-20 ylintä listan tulosta (Markey 2007, Twenty-five years of end-user searching, Part 1: Research findings, JASIST, 58(8, 1123-1130). Lisäksi yleisin hakukone Google perustaa hakutuloksensa algoritmiin, joka painottaa suosittuja/linkitettyjä sivuja, joka saattaa joissain tapauksissa vain voimistaa näiden suositummuutta ja vahvistaa vanhoja käsityksiä. Yksinkertaisissa hauissa tämä toimii, mutta tilanteisiin, joissa etsijä haluaa hankkia ymmärrystä uudesta alueesta (eksploratiivisella haulla), Suomessa/HIIT-instituutissa on kehitetty uudenlainen visuaalinen etsintäliittymä SciNet, jossa käyttäjä voi interaktiivisesti ohjata hakutuloksia niihin suuntaan jotka kiinnostavat häntä eniten. Tehtyjen tutkimusten mukaan käyttäjien suorituskyky tiedonhauissa on jopa kaksinkertaistunut tällä uudella käyttöliittymällä. HIITin tutkijaprofessori Kasken mukaan hakukoneen taustalla olevat algoritmit ja perusohjelmistot on tarkoitus julkaista avoimena lähdekoodina vapaasti esimerkiksi startupien hyödynnettäväksi. Kehitetty koneoppimiseen perustuva menetelmä soveltuu tiedekirjallisuuden etsinnän lisäksi mille tahansa alueelle, esimerkiksi sosiaalisen median aineistoille. (Mutanen, A. 2014. Hyvän & pahan tiedon puu. Suomalainen SciNet näyttää senkin, minkä Google salaa, Tiede, Maaliskuu, 50-55)
Ympäristö/lokaatiotieto (sensorit, sensoritieto)
Asioiden ja esineiden Internet (Internet of Things, Industrial Internet) on tekemässä läpimurtoaan parin seuraavan vuoden kuluessa. Jokainen verkkoon kytketty laite tai sensori tuottaa jatkuvasti mittaustietoa edelleen jalostettavaksi. Tällä tavalla syntyvän tiedon määrä on valtava ja hyödyntämismahdollisuudet lähes rajattomat. Yksi keskeinen ongelma tämän tiedon käyttöönotossa liittyy tiedon julkaisemiseen ja omistamiseen; kuinka sensoritiedon omistajat voivat julkaista tietoa niin, etteivät paljasta liikaa itsestään. Esimerkiksi talon huoneiden lämpötilatiedot ja energiankulutus yhdistettynä muihin tietokantoihin, kuten säätilaan, voisi antaa arvokasta tietoa energiayhtiöille ja kuluttajille. Toisaalta sama tieto voi mahdollistaa asunnon käyttöön liittyviä tietoja, jotka taas eivät ole julkisia ja saattavat loukata yksityisyyttä.
Esineiden internet on yksi näkökulma Teolliseen Internetiin, yksi sen keskeinen mahdollistava tekijä. Tämä kappale kannattaa yhdistää TI-osion yhdeksi osaksi.
Toimenpiteet
Yhteistyö eri alojen välillä
Yleisesti jaetaan näkemys tarpeesta hakea datan avulla synergioita eri aloilta. Pilvipalvelujen hyödyntäminen on tässä olennaista, sillä se mahdollistaa uudenlaisen datan yhdistelyn ja jakamisen. Löydettävä siten toimia, joilla erityisesti yritysten horisontaalista ja vertikaalista verkottumista voidaan edesauttaa siten, että (big ja avointa) dataa jaettaisiin sopivalla alustalla/rajapinnoilla yhteiseen käyttöön ja yhdisteltäväksi uudella tavalla.
Yrityksillä (erityisesti suurilla) on hyödyntämätöntä dataa, mutta ei osaamista/resursseja/ideaa käyttää tätä. Vaatii toimien suuntaaminen: 1. kannustetaan/tuetaan yrityksiä avaamaan rajapintoja dataansa 2. yhteiset kehitysalustat datan jakamiseksi, joista jalostuu uusia lisäarvopalveluja
Haasteena nähdään se, ettei yrityksillä ole välttämättä kannusteita tai liiketoiminnan intressien kannalta järkevää tapaa jakaa dataansa. Kuitenkin ”varallisuus”-ajattelun riskinä voi olla, että käyttämättömästä datasta ei saada mitään arvoa ja kilpailijat menevät ohi. Yhteistyön kehittäminen vaatii uutta ymmärrystä jakamistalouteen ja siten hyödyn- ja tulonjakomallien kehittämistä. Datan markkinapaikkoja tulee myös kehittää.
Big datan potentiaalista kertoo jo se, että perusteilla on big data labseja ja tutkimuskeskuksia ympäri Eurooppaa. Suomen on mentävä mukaan tähän toimintaan, jotta yhteistyö, kokeilut, tutkimus, yritysten sovellusosaaminen ja siten yleinen alan kehitys vauhdittuisi. Osaavien ihmisten välisten yhteyksien rakentaminen katsotaan nyt olennaiseksi, samoin kuin hyvien käytäntöjen jakaminen eri toimijoiden välillä. Verkostotoiminnan tavoitteiden on oltava kuitenkin selkeitä: toiminnan on tuettava yritysten ja ihmisten suorituskykyä tuloksia seurattavissa olevalla tavalla.
Selvitetään tarvetta Big data-hubille, erityisesti isojen ja pk-yritysten yhteisille datahankkeille ja datan vaihdolle liiketoiminnassa
Caselaatikko: esimerkkinä Saksassa yritysten tuotantodatan ja alan osaajien saattaminen yhteen. (smart data innovation lab, erityisalueina labissa industry 4.0, energy, smart cities ja personlised medicine). Esimerkkinä Singapore: social analytics-konsortio kehittää tämän alan työkaluja yhdessä + yritysten yhteistyökonsortio. Esimerkinä GE tarjoaa fasiliteetit pk-yrityksille.
Edistetään erityisesti pk-yritysten ja start-uppien big data resursseja (välineitä ja pääsyä aineistoihin) ja osaamista. Aktivoidaan näitä yrityksiä myös mukaan kansallisiin hankkeisiin ja yritysten aloitteisiin (vrt. GE:n tarjoamat fasiliteetit)
Luodaan kansallinen data-analytiikan toimijoiden verkosto (tutkimuslaitos/yliopistoyhteistyö), jossa edistetään myös teknologiasiirtoa yrityksiin (menetelmät, työkalut, osaaminen)
Osallistutaan ja jaetaan kansallisesti näkemyksiä EU:n Big/NESSI data foorumin toimiin
caselaatikko: EU Big data PPP ekosysteemin ajatus: olemassa olevaan infrastruktuuriin perustuva ekosysteemi, jossa luodaan myös yhteistyön malleja, fasilitoidaan datan siirtoa (data exchange) ja tarkastellaan samalla miten liiketoiminta/(asiakas) johtaminen muuttuu, kokeiluja big data aineistoilla, jonka avulla kehitetään osaamista, tutkimuksen hyödyntäminen ja työkalujen siirto (research transfer community)
Verkottuneet käyttäjät (connected users) ovat nyt big data kehityksen keskiössä, sillä se tarkoittaa useilla sektoreilla tiedon hyödyntämisen nopeutumista. Esim. liikenteessä käyttäjiltä kerättyä tietoa yhdistetään liikenteen hallintaan.
Kehitetään joukkoistamiseen perustuvia big data- malleja, joista parhaillaan syntyy uudentyyppisiä laajoja ekosysteemejä.
Koulutus
Osaamisen kehittäminen on olennaisin big dataa edistävä ja samalla kehitystä rajoittava tekijä. Tarvitaan sekä teknistä että toimialaspesifistä osaamisen kehittämistä. Osaamisessa tärkeää erilaisten datamuotojen käsittely ja jalostaminen (“blended human and algoritmic data processing). Datatieteilijältä odotettavat taidot (kuvailua edellytyksissä) ovat poikkitieteellisiä, joten tiimien (osaajapoolit) rakentaminen voisi olla yhtenä ratkaisuna osaajapulaan.
Tutkintoperusteisen ja käytännönläheisen opiskelun kehittäminen esimerkiksi harjoitteluna yrityksissä, osallistumisena tutkimusohjelmiin tai vapaaehtoisina kursseina tai verkkomoduleina ovat molemmat tarpeen.
Data-analytiikkaosaamista on saatava kaikille oppitasoille peruskoulusta lähtien. Yliopistotutkinnon yleisiin/yleissivistäviin opintoihin tulisi saada datan hallinnan ja käsittelyn painotusta oppiaineesta riippumatta.
Alan koulutusorganisaatiot, yritykset ja asiantuntijat muodostavat opetushallituksen johdolla näkemyksen tarjolla olevasta koulutuksesta ja tarvittavista vähimmäistaidoista eri rooleissa, jotka tulevat mukaan tutkintoihin (ammattikorkea, yliopisto, täydennyskoulutus). Oppilaitokset ja yliopistot voivat täten myös paremmin erikoistua ja tehdä yhteistyötä esimerkiksi verkkomuotoisen opiskelun kehittämiseksi.
Caselaatikko: EU näkemys osaamisen kehittämisestä : 1. tutkintojen kehittäminen (Curriculum, Bolognan prosessi, Grand Coalition of skills), 2. täydennyskoulutus, 3. kokeilut ja kurssit (training centers). Tavoitteena on luoda Euroopassa yliopistojen verkosto datataitojen osalta.
Vaikutetaan siihen, että peruskoulun opetussuunnitelmiin sisältyy dataan käyttöön liittyvää opetusta vuonna 2016 ja tuetaan open source teknologioiden leviämistä.Opettajankoulutuksen kehittäminen (big data opetustaidot)
Kartoitetaan opetushallituksen johdolla tarvittavia osaamisprofiileja ja olemassa olevaa koulutustarjontaa.
'Koordinoidaan kansallisesti käynnisteillä ja sunnitteilla olevia big data koulutusohjelmia.
Osallistutaan EU-laajuisen big dataan erikoistuvien yliopistojen verkoston luomiseen
Soveltava koulutus yrityksissä
Soveltavan ja täydennyskoulutuksen malleja on kehitettävä big data asiantuntijaksi kasvamiseksi. Yrityksissä osaamista kehittäisivät erilaiset harjoittelujaksot ja projektit yms. alan opiskelijoille, tutkijoille ja työmarkkinoilla vapaana oleville osaajille.
Ohjelmointi/tietojenkäsittely/bisnesprosessien opiskelijoita kannustetaan yrityksiin big data harjoitteluun, projekteihin ja opinnäytetöihin (hyvänä esimerkkinä Aallossa diplomityöparit)
Toteutetaan reaaliaikaista tarvekartoitusta siitä, kuinka paljon ja millaista osaamista yritykset tarvitsevat (big data yritysklusteri/foorumi)'''
Täydennys- ja muuntokoulutusta uudistetaan vastaamaan big data osaamistarpeita
'Tuetaan yritysten big data osaamista kehittävien sisäisten hautomojen toimintaa, osaamisvaihtoa ja työnkiertoa'
Tutkimus
Kokeilut ja rahoitus
Kokeilevaa toimintaa big datan hyödyntämiseksi ja analyysimenetelmien soveltamiseksi käytännön tilanteisiin ja yhteiskunnallisiin haasteisiin sekä uuteen liiketoimintaan tulee tukea ja edistää. Big datan kokeilut tulisi saada siten vahvemmin mukaan erilaisten ohjelmien ja kehityshankkeiden osaksi.
Esimerkiksi Tekes on käynnistänyt ohjelmavalmistelun Teollisen Internetin alueelle. Saman valmistelun yhteydessä tarkastellaan tarpeet myös 5G-mobiiliverkkojen alueella, joka on yksi tekijä teollisen internetin toteuttamisessa. Valmistelun tuloksena voi olla yksi tai useampi ohjelma tai jokin muu kokonaisuus. Big data ja data-analytiikka ovat myös keskeisessä roolissa teollisen internetin sovelluksissa. Valmistelun tuloksena mahdollisesti käynnistyvä(t) ohjelma(t) tai muut toimenpiteet voisivat käynnistyä syksyllä 2014 (Q4/2014). Valmistelun verkkosivut http://www.tekes.fi/teollinen-internet-ja-5G.
Kansallista tukea ja verkostoa EU-tukiohjelmien hyödyntämiseen vahvistetaan erityisesti big data painotuksella (Horizon verkosto, Tekes, kehittäjäorganisaatiot)
Tuetaan erilaisia big data kokeiluja ja jaetaan näistä saatuja kokemuksia. Erityisen tarpeelliseksi katsotaan datan saatavuus hallituissa kokeiluissa, joihin liittyy esimerkiksi mobiilipaikantaminen'
Disruptio datan vaikutuksesta tulevat voimakkaasti myös liiketoimintamalleihin: kokeilevat kehityshankkeet hyödyn ja tulonjaonmallien kehittämiseksi (vrt. myös yritysten yhteistyön aktivointitoimet)
Pääomaehtoisen rahoituksen saatavuuden edistäminen (miten yksityiset pääomasijoittajat mukaan? + Tekes pääomasijoitus Oy -> konsortiot)'
Mydata
MyData selvityksen malleja testataan valituilla alueilla kehityksen vauhdittamiseksi ja uusien tietomallien yleistymiseksi eri alojen yritysten avulla. Pitkällä aikavälillä luodaan alustaa MyDatalle, johon yksilö voi omaa tietoaan kerätä ja haluamallaan tavalla jakaa sekä hyödyntää.
Yhteistyö Iso-Britannian MiData-labn kanssa Midata-kehityksen vahvistamiseksi
Datan saatavuus
Avoimet rajapinnat ja data ovat myös big datan hyödyntämisen mahdollistajia, joten kehitystyötä tulisi edelleen vahvistaa sekä luoda tapoja yhdistää julkista avointa dataa ja yritysten dataa
Henkilötietojen osalta tarvitaan kansallinen anonymisoinnin järjestelmä
Datan hyödyntämiseen ratkaisuja etsiviä ja kehittäviä henkilöitä rekrytoidaan hallintoon, esimerkiksi kumppanikoodarimallin mukaisesti, College-to-govt harjoitteluohjelmat tms.
Yhteentoimivuuden kehittäminen datan jakamisen standardeilla ja yhteishankkeilla erityisesti kunta- ja kaupunkiympäristössä (mm Kuusaika- hankkeen puitteisa)
Määritellään kansallisen dataportaalin hyödyntäminen myös big data kanavana(Avoimen tiedon ohjelma, VM)
Velvoitetaan (VM) virastoja tunnistamaan selvät alueet, joilla voisi saada big datalla hyötyjä. Tuetaan virastojen pilottiprojekteja (Avoimen tiedon ohjelma/kehykset).
Sääntely
Suurena haasteena on se, miten tasapainottaa big datan hyödyntämiseen ja tietosuojaan liittyvät toimet sääntelyssä. Henkilöiden yksityisyyden suoja ei saa tässä vaarantua.
Sääntelyn kehittämisen ajatuksena tulee kuitenkin olla se, että markkinoille tulon esteitä voidaan purkaa ja samalla luodaan kannusteita datan saatavuuteen huomioiden henkilöiden oikeudet dataan. Yleisesti säädösvalmistelussa tulisi huomioida dataan liittyvät edellytykset, joten voidaan myös kysyä onko big datassa erityispiirteitä tai tarpeita huomoitavaksi sääntelyssä.
Sääntelyä tukisi yhteiset käytännöt ja periaatteet, ns. Big data ”etiketti” siitä, miten dataa hyödynnetään kunnioittaen niin kansalaisten kuin yritystenkin oikeuksia. Hyviä datan hallinnon ja käsittelyn tapoja tulee luoda yhteistyössä. Tämä voisi toimia myös Suomen vahvuutena kansainvälisessä kilpailussa datavarannoista.
Tehdään selvitys big datan käyttöön vaikuttavista laeista
Varmistetaan, että EU:n tietosuoja-asetus ja sen soveltaminen Suomessa mahdollistaa big data kehityksen yksityisyydensuojaa vaarantamatta
Kehitetään suomalainen Big data "etiketti" ohjesääntö
Datatietoisuus
Big datan hyödyntäminen kaikilla sektoreilla nyt olennaista, joten miten lisätään tietoisuutta ja ensimmäisiä askeleita kohti datan tunnistamista, kokeilua ja kehitystä. Big data teknologiakehitys evoluutiota, mutta bisnesprosessien kehitys käy läpi nyt revoluutiota, joten toimet erityisesti ymmärtämään liiketoiminnan muutosta.
Suomen jokaisen organisaation päätöksenteon tulisi muuttua tietoon perustuvaksi (data driven) sen sijaan että päätökset tehtäisiin mutu-pohjaisesti. Maailmalla on tietopohjaisesta päätöksenteosta esimerkkinä mm. amerikkalainen autonvalmistaja Ford, joka selvisi autoteollisuuden kriisistä siirtymällä data-driven päätöksentekoon. Tällainen tietoon perustuva päätöksenteko vaatii tuekseen toimivan tiedonkeruun ja analysoinnin. Sama tiedonkeruu ja -analysointi palvelee myös open data -aloitteita.
”Datalähettiläitä” hankitaan tuomaan big data- tietoutta ja osaamista yritysten ja hallinnon käyttöön toteutettuna mm. kansainvälisinä vierailijaluentoina ja osaajavaihtona
Luodaan alan yrityksiä, tutkijoita ja asiantuntijoita kokoava avoin Big data-klusteri sekä osaamisen kehittämistä tukevaa verkostotoimintaa tämän ympärille (Tekes, Teknologiateollisuus, Tekniikan Akateemiset, Ohjelmistoyrittäjät, TTL, yritykset jne).
Julkisen hallinnon organisaatioihin nimetään datavastaavia, joiden tehtäviin kuuluu datan keruun ja analysoinnin järjestäminen. Yksityisiä yrityksiä ja muita yhteisöjä varten voidaan järjestää valtiovallan taholta maksullista tai maksutonta neuvontaa.
Teknologiat ja standardit
Big datan teknologisia kehitystarpeita on tunnistettu olevan mm. datan varastoinnin tekniset standardit, datan välittämisen ja integroinnin tavat. Teknologiakohtaisia ekosysteemejä on syntymässä, joten näiden ymmärtäminen ja sovittaminen omaan kehitysympäristöön on olennaista. Datan käsittelyn ja hallinnoinnin harmonisointi edistäisi datan yhteen toimivuutta ja siten käyttöä. On huomattava, että dataan liittyviä standardeja (esim INSPIRE, PSI) on jo olemassa, joten näitä voidaan hyödyntää ja soveltaa myös big dataan.
Tunnistetaan keskeiset standardointiprosessit joissa tulee olla mukana sekä organisoidutaan toimimaan näissä
Standardien luominen erityisesti datan varastointiin (storage) ja siirtoon (exchange) kehittää datan käsittelyn tekniikoita, työskentelymetodeja ja tehokkaita algoritmeja.
Tietosuoja ja yksityisyys on myös teknologinen kehityskysymys. Panostetaan tieto/yksityisyydensuojan ratkaisujen teknologiakehitykseen (esim. Tekes)
Infrastruktuuri
Big datan hyödyntäminen vaatii korkealuokkaista tieto- ja viestintäinfrastruktuuria. Varmistetaan, että perusedellytykset, kuten viestintä- ja tiedonsiirtoyhteydet, pilvikapasiteetti yms. ovat kansainvälistä huipputasoa ja ennakoidaan tarpeita infrastuktuurin osalta niin yksittäisen toimijan kuin yhteishankkeiden/toiminnan kannalta.
Sidosryhmien toimintaa verkostona on tuettava. Keskeisten kansallisten toimijoiden tunnistaminen ja organisointimallin luominen on tarpeen myös infrastruktuurin kehittämistä ohjaamaan. Infrastruktuurikoordinaation tehtävä on hakea tehokuutta ja yhteentoimivuutta.
Kehitetään kansallista big data infrastuktuuria: Jaettujen infrojen kehittäminen(shared computing infrastructure) Yhteisiä datan hallintasysteemejä (ylläpito ja laadunvarmistus) Arvioinnin kehittämien erilaisista analyysimenetelmistä Datapalvelujen ekosysteemin luonti (open cloud Massachusettsin tapaan ja datapalvelujen ”biotope” esim. jakelupiste, kauppapaikka ja julkaisukirjastot sekä datasovellusten edistäjä (incubator) eli ovat perustaneet ODIn UKn tapaan) Kokeilulaboratorio, jossa voidaan testata teknologioita ilman omaa mittavaa panostusta
Toimijat ja hankkeet
Tähän osioon kerätään suomalaiset ja yhteistyön kannalta kansainväliset toimijat tai hankkeet big datan kehitystyössä. Erityisesti tarkasteltava niitä toimijoita, jotka ovat kriittisiä strategian toteuttamisen kannalta. Toimijoista luodaan näkemystä verkostosta, joka voi toteuttaa strategiassa esitettyjä toimia ja luoda esimerkkejä tunnistetuilla sovellusalueilla eli toimia siten suomalaisina edelläkävijöinä.
Vaikuttavuus
Tässä osiossa on tarkoitus luoda arvioi strategiassa esitettyjen toimenpiteiden vaikuttavuudesta ja potentiaalista kansantaloudessamme.
Taustaksi arvioita big datan potentiaalista kansainvälisistä ja kotimaisista tutkimuksista tai selvityksistä (OECD, WEF, EU) -> Suomen osuus tästä (esim Suomen bkt suhteessa maailman bkt:sta).
Strategian toimien vaikuttavuuden arviointia ajassa. Esimerkiksi kuva siitä, miten välittömästi toimet vaikuttavat: kokeilut vaikuttavat lyhyellä aikavälillä, koulutus pitkällä jne. Varmistetaan siten, että saavutetaan vaikuttavuutta sekä lyhyellä että pidemmällä aikavälillä.
Vaihtoehtoisia/täydentäviä tarkastelukulmia vaikuttavuuteen:
1. Esitetään arvioinnin pohjalta, miten ja kuinka merkittävästi edellä mainittujen toimien toteuttaminen vaikuttaisi yhteiskuntaan tai talouteen. Linkitetään ”grand challengeihin” mm. kestävyysvaje (esimerkkien kautta esim. julkinen hallinto)?
2. Määritä tarvittavat investoinnit strategian toteutukseen = ”ROI”
3. Arvoketju ja luonti A) Datan arvoketju: 1. data hankinta (acquisition) 2. analyysi 3. tuki ja joukkoistaminen (curation) 4. varastointi 5. käyttö B) Arvonluonti: kysy miten datasta saadaan arvoa (data extraction)?
4. Kansantalouden tasolla tarvitaan esimerkkejä demonstroimaan bd vaikutuksia kasvuun ja työllisyyteen = datan relevanttiuden arviointi: 1. datan määrällinen kysyntä (edustaa myös poikkisektorien mahdollisuuksia, kuten geodata) 2. kyseisen sektorin menestymisen merkitys (osuus kansantaloudesta; esim teollisuus, palvelut, julkinen sektori, maatalous, kolmas sektori)
5. Arvio Suomen big data PPP ekosysteemin edellytyksistä ja potentiaalista. Ensin on ymmärrettävä ketä tässä toimii ja mitä toimintaa on --> kartoitetaan keskeiset toimijat ja hankkeet
6. Potentiaali versus vaihtoehto ettei asiaa edistetä Ks. Janin kuvat
Strategian toimeenpano Luodaan roadmap toimien vastuista, etenemisjärjestyksestä ja aikatauluista. Vahvistetaan strategian toimeenpano valtioneuvoston periaatepäätöksellä tai hallitusohjelmassa. Ryhdytään toimiin!
Katso myös
Viitteet