Strategiatausta big data

Opasnet Suomista
Versio hetkellä 20. toukokuuta 2014 kello 14.47 – tehnyt Emil A. (keskustelu | muokkaukset) (Ak: Uusi sivu: == Tausta ja kysymys == Liikenne- ja viestintäministeriö asetti 13. joulukuuta 2013 Big datan käyttö -työryhmän. Työryhmän tehtävänä on luoda kokonaiskuva big datasta...)
(ero) ← Vanhempi versio | Nykyinen versio (ero) | Uudempi versio → (ero)
Siirry navigaatioon Siirry hakuun

Tausta ja kysymys

Liikenne- ja viestintäministeriö asetti  13. joulukuuta 2013 Big datan käyttö -työryhmän. Työryhmän tehtävänä on luoda kokonaiskuva big datasta Suomessa ja laatia
luonnos kansalliseksi big data -strategiaksi.
Strategia tähtää sellaisten toimenpiteiden löytämiseen, joilla on mahdollista parantaa eri lähteistä saatavan datan tehoksta ja innovatiivista käyttöä. 
Työryhmä keskittyy muun muassa tietoaineistojen käytettäväksi saamiseen ja  big data-osaamiseen,  käytön esteiden tunnistamiseen ja käyttöä edistävien toimintamallien
kehittämiseen. Lisäksi työryhmän tehtävänä on löytää Suomen kannalta  keskeisiä sovellusalueita, joilla on mahdollista hyödyntää big dataa
Työryhmän työn on tarkoitus valmistua 30. kesäkuuta 2014 mennessä. Tämän wikialustan avulla kerätään kommentteja, ideoita ja toimenpide-ehdotuksia kansalliseen big
data-strategiaan. Tämä ei ole strategian lopullinen rakenne, vaan luonnoksen avulla pyritään keräämään ideat, tekijät ja toimenpiteet tunnistettuihin 
aihealueisiin.Kommentteja, ideoita ja ehdotuksia voi lisätä kunkin osion keskustelusivulle (keskustelusivu löytyy wikin vasemmasta yläkulmasta)
Big data-työryhmä LVM:n nettisivuilla ja valtion hankerekisterissä:
http://www.lvm.fi/web/hanke/big-data
http://www.hare.vn.fi/mHankePerusSelaus.asp?h_iId=20201 


Ohjeistusta edellytys- ja sovellusalueista kommentointiin

  • kuvausta kyseisestä asiasta, taustatekijästä, sekä sen nykytilasta, esimerkkejä ja perusteluja miksi edellytys tai sovellusalue on meille tärkeä, millaisia vahvuuksia tai heikkouksia Suomella on tässä jne.

Ohjeistusta toimenpideosion kommentointiin

  • ideoita toimenpiteiksi, joita otsikkoasian kehittämiseksi tarvitaan (strategian toimenpideosio kootaan myöhemmin näistä)

Ohjeistusta toimijat ja hankkeet-osion kommentointiin

  • listausta keskeisistä toimijoista ja hankkeista, jotka strategiassa esitettyjen asioiden eteenpäin viemiseksi ovat olennaisia

Ohjeistusta vaikuttavuus-osion kommentointiin

  • ideoita, linkkejä ja tutkimuksia siitä miten big data toimien vaikuttavuutta ja erityisesti tässä strategiassa esitettyjen toimien vaikuttavuutta voisi arvioida määrällisesti ja laadullisesti

Johdanto

4 00 000 000 000 000 000 000 tavua eli 4,4 zettatavua oli tutkimusyhtiö IDC:n mukaan eri laitteiden luomasta ja tallennetusta digitaalisen datasta muodostuvan niin sanotun digitaalisen avaruuden koko vuonna 2013. Tablettien, älypuhelinten ja muiden mobiililaiteiden, erilaisten asiakastieto- ja maksujärjestelmien, internetissä toimivien videopalveluiden ja sosiaalisen median, teollisuuden ja liikenteen uusien sensorijärjestelmien yleistymisen ja lisääntyvän käytön seurauksena digitaalinen avaruus kasvaa vuosittain 40 %:lla eli kymmenkertaiseksi vuoteen 2021 mennessä.

Teknologisen kehityksen ja siihen liittyen etenkin pilvipalveluiden kehityksen seurauksena digitaalisen tiedon tallennus- ja prosessointikustannukset ovat laskeneet jopa sadasosiin kymmenen vuoden takaisista kustannuksista. Nämä kehitystrendit yhdessä uusien digitaalista tietoa käsittelevien laskentamenetelmien kehityksen kanssa ovat tuoneet suurten data-aineistojen hyödyntämismahdollisuudet myös muiden kuin suuryritysten ulottuville. Hyödyntämismahdollisuuksien etsintää ja kehitystä on lisännyt vielä tiedon viestintäteknologioiden ja viestintäverkkojen muassaan tuoma reaaliaikaisen käsittelyn ja siihen liittyvän päätöksenteon – yhä useammin automaattisen päätöksenteon - reaaliaikaisuuden mahdollisuus.

Erittäin suurten tietomassojen hyödyntämistä koskevan yhteiskunnallisen ja taloudellisen keskusten yhtenä merkkipaaluna voidaan pitää konsulttiyhtiö McKinseyn vuonna 2011 julkaisemaa tutkimusta ”Big data: The next frontier for innovation, competition and productivity”. Tutkimus arvioi big datan hyödyntämisen potentiaalisen vuosittaisen arvon Yhdysvaltojen terveydenhuollolle 300 miljardiksi dollariksi ja EU-alueen julkiselle sektorille 250 miljardiksi euroksi. ’ Poliittisesti huomionarvoista oli myös tutkimuksen lupaus uusista työpaikosta: Pelkästään Yhdysvalloissa töitä on luvassa 140 000 – 190 000 data-analyytikolle. McKinseyn ohella myös muut suuret tutkimus- ja konsulttiyhtiöt pitävät big dataa yhtenä lähivuosien tärkeimmistä teknologisista trendeistä.

Big datan suuri yhteiskunnallinen lupaus on siirtynyt nopeasti myös eri maiden ja organisaatioiden poliittisille agendoille. Yhdysvalloissa Obaman hallinto julkaisi vuonna 2012 Big Data Research and Development Initiative –ohjelman, joka eri hallinnonalojen hankkeiden kautta pyrkii edesauttamaan maan teknologisen edelläkävijäaseman säilyttämistä myös big data –alueella. Samaan tähtää myös hallituksen äskettäin julkaisema Big Data and Future of Privacy- julkaisu , joka hakee ratkaisuja big dataan liittyviin juridisiin ja eettisiin kysymyksiin. Englannissa istuva hallitus on asiantuntija-arvioiden pohjalta määritellyt big datan yhdeksi kahdeksasta maan taloudellisen tulevaisuuden kannalta keskeisistä teknologiasta. Tähän liittyen hallitus julkaisi vuonna 2013 myös huomattavia investointilupauksia sisältävän toimenpideohjelman ”Seizing the data opportunity – A strategy for UK data capability”. (https://www.gov.uk/government/uploads/system/uploads/attachment_data/file/254136/bis-13-1250-strategy-for-uk-data-capability-v4.pdf)

Datan hyödyntämismahdollisuudet ja big data ovat nousseet vahvasti esille EU:n Digitaaliseen Agendaan ja uuteen Horizon –ohjelmaan liittyvissä hankkeissa. Samoin on laita OECD:n toiminnassa ja erityisesti New Sources of Growth: Knowlwedge-Based Capital – teemaan liittyvissä projelteissa ja selvityksissä.

Digitaalisaation ja sen merkittävänä osana big datan mahdollisuuksiin on luonnollisesti avainkysymys myös suomalaisen elinkeinoelämän ja koko yhteiskunnan tulevalle kehitykselle. Big dataan liittyvät distruptioilmiöt yhtäältä ravistelevat myös suomalaisia yrityksiä ja niiden toimintaympäristöä, mutta toisaalta avaavat myös uusia mahdollisuuksia kilpailukyvyn, kilpailedun ja uusien liitetoimintojen kehittämiseen.

Suomella hyvät edellytykset vastata big datan haasteeseen: Kansainvälisisten vertailututkimusten mukaan Suomi on maailman digitaalisesti edistyneimpien maiden joukossa erityisesti mitä tulee teknisiin valmiuksiin. Suomessa on esimerkiksi korkeatasoiset digitaaliset perusrekisterit ja myös runsaasti osaamista, jonka päälle voidaan suhteellisen nopeasti rakentaa kilpailukykyista big data -osaamista.

Big datan lähteitä Kapowin mukaan

Yhteisesti jaettua ja täysin yksiselittäistä määrittelyä ei termille ole. Useimmiten käytetään kolmen V:n määritelmää, jolla viitataan sekä datan määrään (volume),syntyvauhtiin (velocity) sekä erilaiseen, struktoroimattomaan dataan (variety). Eri näkökulmista, muun muassa eri palveluntarjoajien määritelmissä, painotetaan ilmiön eri puolia. Esimerkikisi Intel määrittelee big datan puhtaasti koon (mediaaniarvona 300tb dataa viikottain), Microsoft lähestyy asiaa analyysin vaadittavien monimutkaisten menetelmien kautta. Lisäksi termiä voitaisiin lähestyä myös analyysiin käytettävien työkalujen kautta . (Mm. Hadoop)

Big Datan voi käsittää myös tietynlaisena tiedon paradigmanmuutoksena. Siirrytään yrityksissä ja hallinnossa tekemään päätöksiä suoraan ”mitattuun” tietoon perustuen. Tutkimuksessa ei välttämättä tarvitse samalla tavalla muodostaa teoriaa, kun voidaan käydä valtavia tietomassoja läpi ilman ennakko-oletuksia ja ns. ”löytää” malleja, yhteyksiä

Tässä strategiassa big dataa lähestytään määritelmän neljännen V:n, eli arvon sekä toiminnan kautta. Toiminta tarkoittaa tässä datan analysointia, käsittelyä ja hyödyntämistä erilaisiin käyttötarkoituksiin. Strategia ei siten keskitytä pelkästään massiivisten, esimerkiksi supertietokoneita analyysiin vaativiin reaaliaikaisiin tietomassoihin. Strategia kohdistuu myös käsittelymenetelmällisesti yksinkertaisempaan dataan ja erityisesti erilaisten tietoaineistojen yhdistelyyn. Ajatuksena on ollut tunnistaa ja löytää Suomen kannalta oleellisia alueita, joilla kerättävä tieto, uudet tiedonkäsittelymenetelmät ja laajempi tiedon hyödyntäminen voivat tuoda arvoa. Strategian tavoitteet ja toimet kohdistuvat niin yksityiseen kuin julkiseen sektoriin.

Lähtökohtana big datasta saatavien yhteiskunnallisten ja taloudellisten hyötyjen kannalta nähdään tarve laajalle yhteistyölle. Data-aineistot sijaitsevat erilaisten organisaatioiden ja instituutioiden huomassa, joiden yhdistelystä ja soveltamisesta syntyy arvoa. Laajan yhteistyön tarve kohdistuu siten niin hallinnon, yritysten kuin esimerkiksi järjestöjen ja kansalaisten kesken.


Big Data-strategioita maailmalla

Euroopan ja Suomen kehityksen katsotaan tulevan muutaman vuoden jäljessä kansainvälisesti suuria big datan hyödyntäjämaita, erityisesti USA:ta.

Strategioiden tarkastelussa huomaa, että eri maissa alan kehitykseen sekä muun muassa säästöjen ja kilpailukyvyn kannalta big data nähdään yhtenä oleellisimmista kehityskuluista. Niinpä monissa maissa alalle laitetut panostukset ovat mittavia. Big data-kehityksen kärjessä kulkeminen nähty äärimmäisen tärkeänä. Big data-maailmassa kilpailu on todella kovaa ja investoinnit alalle suuria.

USA:ssa Obaman hallinto julkaisi toukokuun alussa uuden big dataa käsittelevän raportin. Raportissa big dataa tarkastellaan niin hallinnon kuin yritystenkin kannalta. Erityinen huomio raportissa on big dataan liittyvissä politiikkakysymyksissä. Erityishuomio kohdistetaan yksityisyyden suojaan. Tässä yhteydessä on tärkeä huomata, että eri maiden erilaiset lainsäädäntökehikot, jotka voivat osaltaan aiheuttaa haasteita big datan hyödyntämiseen liittyen.(http://www.whitehouse.gov/sites/default/files/docs/big_data_privacy_report_may_1_2014.pdf)

Alan kärkimaassa Yhdysvalloissa on taas panostettu pelkästään hallinnossa big data-kehitykselle satoja miljoonia dollareita. Big data-alalla toimivien yritysten suhteen maalla taas on selkeä etumatka esimerkiksi Eurooppaan verrattuna. Esimerkiksi Saksassa ja Ranskassa big data nähdään myös tiiviisti teollisuuden kilpailukyvyn avaintekijänä. Maat ovat huomioneet laajasti big datan teollisuuspolitiikassaan. Ranskassa big data kuuluu seitsemän tärkeimmän tulevaisuuden teknologian joukkoon. Strategioissa nähdään big datan tuovan hallinnolle pidemmällä tähtäimellä merkittäviä kehitys- ja säästömahdollisuuksia.

//LISÄÄ BIG DATA-STRATEGIOITA MAAILMALLA LINKKI//

Suomen rooli big data kilpailussa?

Suomella on paljon vahvuuksia menestyä datan hyödyntämisessä. Yhtenä tämän strategian tehtävänä on nostaa esille sovellusalueita, joissa Suomella on selvästi potentiaalia löydettävissä datan hyödyntämisessä. Perinteisesti meillä on osaamista mm. lääketieteellisesssä tutkimuksessa, mobiiliteknologioissa, peliteollisuudessa ja ympäristömonitoroinnissa, jotka kaikki ovat hyvin dataintensiivisiä ja sen monimuotoiseen analyysiin perustuvia aloja. Toisaalta strategian avulla on kohdistettava toimia myös niihin yhteiskunnallisesti ja taloudellisesti merkittäviin alueisiin, missä olemme selkeästi kehityksessä jäljessä, mutta joista olisi saatavissa selkeitä hyötyjä.

Suomella on myös vahvaa menetelmä- ja it-osaamista, jota muuntamalla ja hyödyntämällä koulutuksen, tutkimuksen ja asiantuntemuksen jakamisen kautta saataisiin mukaan big data kehitystyöhön.

Big datan hyödyntäminen julkisella sektorilla on vasta alkutekijöissään, mutta tarjoaa suuria mahdollisuuksia niin palvelujen kuin prosessienkin parantamiseen ja tehostamiseen sekä uusiin toimintatapoihin. Suomi on ollut edelläkävijämaita avoimessa datassa ja julkinen sektori avaa tietoaineistojaan vaihtelevaan tahtiin. Tätä avoimuuden ja hyvälaatuisten julkisten tietovarantojen saatavuuden kulttuuria tulisi hyödyntää myös big data kehitystyössä. Avoimen ja big datan, julkisten ja ykistyisten data-aineistojen yhdistelyssä piilee todella suuri potentaali.

Big datassa on huomioitava erityisesti erilaisten datojen vaatimukset datan käytön ja hallinnan suhteen. Esimerkiksi henkilötietona terveysdatan käsittely tarjoaa erilaisia käyttömahdollisuuksia kuin esimerkiksi laitteista saatava sensoridata (iOT). Suomi on hyvin korkean tietosuojan maa. Nykyisessä maailmassa tätä voidaan pitää uudenlaisena vahvuutena, jota ei saa vaarantaa. Toisaalta korkealaatuinen viestintäinfrastruktuuri ja Suomen vahvuus mobiilipuolella antaa hyvän peruspohjan erilaiselle teolliseen internetiin ja internet-of-thingsiin liittyvälle kehitykselle. Tieteellisessä laskennassa ja tiedon käsitttelymenetelmien osaamisessa on myös yksi Suomen vahvuus.

Edellytykset:

Tähän kohtaan kuvataan niitä vaikuttavia tekijöitä, asioita ja ehtoja, joita tarvitaan siihen, että big datan käyttö voisi edistyä Suomessa. Edellytysten taso kuvastaa siten vahvuuksiamme että heikkouksiamme big datan alueella. Edellytykset kohdistuvat kaikkiin yhteiskunnan osiin; yrityksiin, hallintoon ja yksittäisiin datan hyödyntäjiin. Edellytyksistä ja potentiaalisten sovellusalueiden kuvauksista johdetaan tarvittavat toimenpiteet myöhemmässä strategian osassa.

Datatietoisuus

Datatietoisuudessa on kyse pitkälti datan potentiaalisen arvon ymmärtämisestä. Erilaisten organisaatioiden tuottama ja tallentama data tulee käsiteö tuHyöty ei aina näy heti ja ole saatavissa suoraviivaisesti, mutta tulevaisuudessa ja esimerkiksi muiden, esimerkiksi reaaliaikaisten datalähteiden kanssa yhdistelemällä saatetaan saavuttaa huomattavia etuja. Kyse on siis datan itsensä arvon ymmärtämisestä. Erilaisesta datasta saadaan oleellista informaatiota ulos, usein kyse on siitä, että osataan vain kysyä oikeita kysymyksiä ja hakea oikeita asioita.

Nykyaikaisen analytiikan ja big datan omaksuminen osaksi jokapäiväistä työtä on keskeinen askel kohti tiedolla johtamisen yrityskulttuuria. Uuden teknologian ja prosessointikapasiteetin kustannusrakenteiden jatkuva kehitys vaatii omien kyvykkyyksien säännöllistä uudelleentarkastelua. Se mikä datan tarkastelussa vuosi sitten oli mahdotonta tai kannattamatonta, voi tänään olla varsin perusteltua ja liiketoiminnallisesti kannattavaksi todistettavaa. Samalla budjetilla voidaan ensi vuonna jälleen tarkastella laajempaa datamassaa, etsien tarkempia signaaleja, uusia toimintamahdollisuuksia ja aiemmin tunnistamattomia optimointikohteita. Tämä sykli toistuu yhä uudelleen ja organisaatioiden onkin opittava kyseenalaistamaan vanhat datan tarkastelun rajat ja kiinnittämään tarkemmin huomiota uusien lähteiden syntyyn. On tultava datatietoiseksi. Maailmalla on tietopohjaisesta päätöksenteosta esimerkkinä mm. amerikkalainen autonvalmistaja Ford, joka selvisi autoteollisuuden kriisistä siirtymällä data-driven päätöksentekoon.

Perinteisesti organisaatiot ovat tottuneet tarkastelemaan oman liiketoimintansa tuottamaa dataa. Ja siitäkin erityisesti esivalittua osajoukkoa, liiketoiminnan ydintietoa. Tämä tieto on kerättynä erilaisissa perusjärjestelmissä (ERP, CRM, CMS) ja sekä datan tuntemus että sen analysointiin käytettyjen välineiden osaaminen on vahvaa. Big datan huomiointi tässä kontekstissa tarkoittaa datan keräämisen laajuuden tarkastelua. Jos perusjärjestelmien lokitasot, tapahtumien kirjaaminen tai tapahtumien sisällön laajuus on aiemmin rajoitettu tallennus- ja prosessointikapasiteetin kustannusten perusteella, voidaan näitä arvioida uudelleen nykyisen kustannusrakenteen ja kapasiteetin myötä. Ydinliiketoimintaa on myös syytä tarkastella säännöllisesti uudelleen tiedonkeräämisen potentiaalin näkökulmasta. Onko aiempi analytiikka tai toiminnan tarkastelu nostanut esiin asioita, joissa datan kerääminen ei ole riittävällä tasolla? Voitaisiinko tuota tunnistettua, kiinnostavaa dataa kerätä tuomalla järjestelmiin uusia ominaisuuksia tai toimintaympäristöön esimerkiksi erilaisia sensoreita? Näihin mahdollisuuksiin tarttuminen kartuttaa oman liiketoiminnan tuottamaa datavarantoa entisestään ja saattaa nostaa big datan teknologioiden omaksumisen varsin ajankohtaiseksi.

Datatietoinen organisaatio ei kuitenkaan rajoita tiedonjanoaan ainoastaan omien järjestelmien keräämään dataan, vaan katsoo ympäröivää ekosysteemiä laajemmin. Datan mahdollisuuksia on syytä arvioida kumppaniverkoston kanssa, tunnistaen synergioita, datan vaihdon mahdollisuuksia tai jopa uuden liiketoiminnan perustamisen potentiaalia datavarantojen yhdistämisen myötä.

Data rinnastetaan useissa puheissa nykyisin luonnonvaroihin, joten sille syntyy luonnollisesti myös arvo kauppatavarana. Tämän ilmiön myötä datan kerääminen ja koostaminen on synnyttänyt ja synnyttää edelleen uusia toimijoita markkinoille. Näiden datakauppiaiden toiminta puolestaan esiintyy joko yksittäisinä palveluina tai koostettuna datan markkinapaikoille. Kysyntä ja tarjonta määrittävät ennen pitkää erilaisen datan arvon, aivan kuten muillakin luonnonvaroilla. Nykyaikainen, datatietoinen organisaatio huomioi myös nämä kaupalliset datavarannot arvioidessaan liiketoimintansa datavetoista kehitystä.

Kolmas näkökulma saatavilla olevaan dataan on avoin data. Sekä EU-tason että kansallinen lainsäädäntö ohjaa erityisesti julkishallinnon dataa voimakkaasti kohti avoimuutta. Tulevaisuudessa kansallisin varoin kerättyä, varsin arvokasta dataa on paljon saatavilla ja hyödynnettävissä edelleen liiketoiminnan kehityksessä. Avoimen datan kulttuurin kehitys vetää mukanaan myös yksityisiä ja kaupallisia toimijoita, joiden intresseissä on avata dataansa julkisuus- ja goodwill-tarkoituksissa sekä vauhdittaakseen oman erityisosaamisalueensa kehitystä. Organisaatioiden onkin syytä ottaa mukaan kokonaisvaltaiseen data-strategiaansa myös avoin data ja sen erilaiset mahdollisuudet. Hyötyjä on tunnistettavissa sekä avoimen datan kuluttajana että tuottajana.

Kansallisessa big data -strategiassa avoimen datan kehitys on yksi keskeisistä teemoista. Nykyaikainen suhtautuminen datan avaamiseen, lainsäädännön kehitykseen reagointinopeus ja tiedon jakamisen kulttuurin kehitys luovat myös kansallista pääomaa ja auttavat Suomea toimimaan esimerkkimaana. Kokemukset avoimen datan päätöksistä, käytännön toteutuksista ja vaikutuksista liiketoimintakenttään ovat lähitulevaisuudessa haluttua pääomaa. Parhaiden käytäntöjen tuotteistaminen voi luoda myös hyvää tukea suomalaisen osaamisen vientiin ja vauhdittaa osaltaan talouskasvua. Tietoon perustuva päätöksenteko vaatii tuekseen toimivan tiedonkeruun ja analysoinnin. Sama tiedonkeruu ja -analysointi palvelee myös open data -aloitteita.

Samalla täytyy huomioida myös big datan käyttöön liittyvät mahdolliset riskit, esimerkiksi yksityisyydensuojaan liittyen. Kehityksessä ja erilaisissa toimenpiteissä täytyy pohtia myös mahdollisesti seuraavia ongelmia.

Kokeilut/t&k rahoituksen suuntaaminen

Erilaisten big data-ratkaisujen kehittämisessä oleellisessa osassa ovat kokeilut. Toimivat ratkaisut löytyvät usein varsin pienimuotoistenkin kokeilujen jälkeen. Yritysten ja julkisen hallinnon omilla toimilla voidaan mahdollistaa ketterämpi, kokeileva kulttuuri. Hallinto voi mahdollistaa tätä yhteistyössä yritysten kanssa, esimerkiksi tarjoamalla erilaisia resursseja. (mm.FORGE Service Lab) Kyse on myös siitä, että organisaatioiden ilmapiiriä muutetaan start-up-henkisempään suuntaan. Suuri osa kokeiluista myös epäonnistuu eikä niistä välttämättä synny uutta liiketoimintaa. Tämä tulisi kuitenkin usein käsittää tärkeänä osana oppimisprosessia. Samalla internettalouden aikana yhdestä onnistuneesta kokeilusta voi seurata jopa globaali hitti.

Big data-kokeiluille tulisi saada riittäviä resursseja ja rahoitusta. Erilaiset mallit, sovellukset. yms. ovat useimmiten äärimmäisen nopeasti skaalattavissa ylöspäin. Niinpä yksittäisestä toimivasta kokeilusta syntyvä palvelu/teknologia/tuote voi olla nopeastikin täysosuma. T&K-rahaa tulisi kohdentaa big dataan liittyville kokeiluille ja tutkimukselle. Lisäksi muun muassa EU:n Horisontti 2020-ohjelman mahdollisuudet tulee käyttää täysimääräisesti hyväksi.

Haastetta ketterien kokeilujen toteuttamiselle asettaa se, että suurten tietovarantojen haltijat ja niitä kerryttävät tahot ovat usein suuria eivätkä aina niin ketteriä organisaatioita. Toisaalta data-analytiikan alueelle on syntynyt ja syntymässä uusia pieniä yrityksiä, jotka voisivat tarjota tehokkaampia menetelmiä big datan hyödyntämiseen ja uuden liiketoiminnan synnyttämiseen. Myös T&K&I -rahoitusta suuntaamalla olisi mahdollista saattaa erilaisia big-data -toimijoita yhteisiin projekteihin ja hakemaan yhdessä ratkaisuja todellisiin asiakastarpeisiin. Eri kokoisten yritysten yhteistyölle ja yhteisille projekteille tulisi olla saatavilla t&k- tukea.

Yhteistyö voi olla myös kansainvälistä. Suomalaisten yritysten, esimerkiksi pk-sektorilta, sekä kansainvälisten veturiyritysten yhteistyötä tulisi aktiivisesti edistää. Esimerkiksi Saksa on avainasemassa teollisen internetin tulevissa ratkaisuissa. Suomalaisilla yrityksillä ja niiden osaamisella on paljon erilaisia mahdollisuuksia näiden globaalisti johtavien yritysten big data-kehityksessä.

Ylipäänsä big dataan liittyviä ja kohdentuvia tutkimusinvestointeja täytyy tehdä, mikäli Suomi pyrkii pysymäään kehityksessä mukana. Big data-kehitykselle ollaan muissa maissa osoitettu huomattavia investointeja valtion taholta.

Suomessa julkisten toimijoiden tulee osittain paikata yksityisten pääomasijoitusten puutetta. Esimerkiksi Tekesin eri ohjelmien kautta saatavaa rahoitusta tulee kohdistaa big data-kehitykseen. Oleellista on saada myös yritykset mahdollisuuksiensa mukaan lisäämään riskirahoitustaan big dataan liittyvien.

Yritysten yhteistyö ja datan vaihto

Dataintensiivisen liiketoiminta kasvaa jatkuvasti. Data on yhä arvokkaampaa: toisaalta kaikki data ei ole kaikille yhtä arvokasta. Toiselle organisaatiolle jonkin muun tahon tuottama ja tallentama, mutta ei käyttämä, data voisi olla kullanarvoista. Toimivan datanvaihdon ja datamarkkinoiden luonti on tärkeää, jotta datamoodiin siirtyvät organisaatiot saavat potentiaaliset hyödyt irti big data-vallankumoksesta.

Eri yritysten ja organisaatioiden keräämän ja tarjoaman datan hankkimisen ja käyttämisen täytyy olla mahdollista. Tavoitteena on saada datan vaihdosta ja yhteisestä (avoimesta) käytöstä yleistä toimintaa. Datan hankkimisesta on usein sen kerääjälle kustanuksia ja datan jakamiseen omasta organisaatiosta täytyy löytyä kannusteita. Laajempien datamarkkinoiden syntyminen vauhdittaisi huomattavasti uutta big dataan keskittyvää liiketoimintaa.

Tähän liittyy vielä kosolti haasteita. Yritysten (ja hallinnon) välinen yhteistyö on tärkeässä roolissa. Esimerkiksi pienempien innovatiivisten yritysten ja paljon dataa keräävien suurten yritysten yhteistyö on suhteellisen harvinaista. Käytännössä suurempi yritys voi muun muassa avata dataansa ja platformin kehitykselle (ks. esim. Smart Data Innovation Lab Saksassa). Toisaalta tälle pitää löytyä riittävät kannusteet myös suuremman yrityksen puolelta. Yksi mahdollisuus on selvittää, onko syntynymässä standardeja siihen, että yritykset voivat avata "sandboxeja" muiden käyttöön ja analyysiä varten.

Big datan prosessointi on erityisen haasteellista. Dataa saattaa olla niin paljon ja sitä voi syntyä niin suurella nopeudella, että sitä ei voi siirtää fyysisesti toisen organisaation käsiteltäväksi. Tällaisissa tilanteissa tiedon analysointia varten täytyy siirtää prosessoivaa koodia toisen organisaation sisälle. Tämä on ongelma, joka vaatii sekä teknistä että tietoturvallista ratkaisua. Samalla täytyy varmistua siitä, kuinka toinen osapuoli voi luottaa ulkopuoliseen ohjelmakoodiin. Yksi ratkaisu tähän voisi olla yhteiskunnan luoma luotettu dataoperaattori, joka huolehtii datan analysointikoodista ja resurssoinnista yhteistyössä osapuolten kanssa.

Suomen laaja start-up-kenttä (esim. AaltoES) tulee kytkeä tiiviisti mukaan big data-ratkaisujen ja palvelujen kehitykseen. Yritysten ja ketterien start-uppien kokeilevaa yhteistyötä tulee lisätä.

Saksassa yhteistyötä tehdään muun muassa suuret ja pienet yritykset sekä tutkimuspuolen yhteen tuovan Smart Data Innovation Labin kautta 
http://www.kit.edu/kit/english/pi_2014_14408.php
http://www.sdil.de/de/

Koulutus

Big datan hyödyntämisen kannalta koulutus on avainasemassa. Tällä hetkellä muun muassa erilaisten analyysimenetelmien osaajista on pulaa. Samoin tarvitaan yritysjohtajia, jotka ymmärtävät data-analyysin mahdollisuudet päätöksenteon tukena ja yritysten kilpailukyvyn turvaajina. Tulevaisuudessa osaajilta vaaditaan yhä enemmän, jolloin koulutuspuutteet voivat muodostua merkittäväksi esteeksi big datan laajemmassa hyödyntämisessä.

Koulutuspuutteisiin tulee vastata jokaisella koulutustasolla peruskoulusta lähtien sekä myös yritysten taholla esimerkiksi täydennyskoulutuksien muodossa. Perustana olevia matemaattisia, tilastotieteellisiä sekä ohjelmointitaitoja tulisi painottaa opetussuunnitelmissa jo hyvin varhain, jotta tulevat osaamistarpeet tulisivat paremmin katettua pitkällä tähtäimellä. Tiettyjen tärkeiden tietotyökalujen opetusta tulee esimerkiksi keskiasteella lisätä. Lisäksi datalähtöisempi ja empiirisen kokeilevaa lähestymistapaa tulee korostaa.

Tämä ei kuitenkaan vastaa välittömiin tarpeisiin. Suomessa on käynnistymässä sekä ammattikorkeakouluissa että yliopistoissa useita big dataan ja data-analytiikkaan liittyviä koulutusohjelmia. Yliopistotasolla esimerkiksi Aalto-yliopiston kaikkien kuuden koulun maisteriopiskeljoiden on syksystä 2014 lähtien mahdollista suorittaa sivuaineen laajuinen "Analytics and Data Science" -kokonaisuus. Tämä kokonaisuus täydentää mm. jo olemassaolevia Koneoppimisen ja tiedonlouhinnan sekä Tieto- ja palvelujohtamisen maisteriohjelmia, jotka tarjoavat valmiuksia data-analyysiin.

Big Data-koulutusohjelmia Suomessa:

* Jyväskylän yliopisto:  Data-analyysin monitieteellinen maisterikoulutus (DATA)
https://www.jyu.fi/it/laitokset/mit/opiskelu/maisteriopinnot

* Tampereen teknillinen yliopisto: Big Data ja data-analytiikka liiketoiminnan 
kehittämisessä- täydennyskoulutus.
http://www.tut.fi/fi/yrityksille/taydennyskoulutus/koulutustarjonta/big-data/index.htm

* Aalto yliopisto: Master's Degree Programme in Information and Service Management
http://www.aalto.fi/fi/studies/education/programme/information_service_management_master/

* Itä-Suomen yliopisto: Datatieteen koulutusohjelma
https://www.uef.fi/fi/cs/datatiede


Kaikkien suomalaisten korkeakoulujen, jotka eivät vielä ole havahtuneet big datan vaikutuksiin, tulisi huomioida kehitys ja pikaisesti saada datalähtöisyys ja data-analyysi näkymään eri alojen koulutuksessa. Näissä koulutusohjelmissa voitaisiin tehdä yritysten kanssa tiivistä yhteistyötä, jotta tulevat varsin akuutit tarpeet saadaan edes osittain katettua myös suoraan käytännön taidoilla varustetuilla valmistuneilla. Erilaisilla harjoittelu- ja tutustumismahdollisuuksilla on oma tärkeä osansa. Data-analytiikkaan koulutettaville tulisi tarjota mahdollisuuksia opiskelun aikana erilaisiin harjoitteluihin. Näitä voisi yritysten lisäksi tarjota myös julkishallinnossa, mikä osaltaan auttaisi siirtymistä datalähtöisempään toimintatapaan.

Koulutustarpeita Big data-alalla E-Skills UK:n selvityksen mukaan:
http://www.e-skills.com/research/research-publications/big-data-analytics/

Lisäksi alueella tulisi lisätä monialaista koulutusta. Datalta täytyy osata kysyä oikeita kysymyksiä, joten erilaisten taitojen ja erilaisen osaamisen yhdistäminen on välttämätöntä. Niinpä data-analytiikkaa ja datan "ymmärtämistä" tulisi näkyä melkein alan kuin alan koulutuksessa, aina kauppatieteellisestä yhteiskunta- ja sosiaalitieteisiin. Pelkkä tekninen osaaminen ei riitä, vaan tarvitaan ymmärrystä substanssialoista sekä kykyä yhdistellä asioita ja aloja luovasti. Monella alalla käytettävissä olevan tiedon hyödyntäminen toisi huomattavaa lisäarvoa. On tärkeää kouluttaa osaajia myös yksityisyyden ja tietosuojan alueilla, sillä EU:ssa valmisteilla oleva lainsäädäntö saattaa tuoda yrityksille merkittäviä sanktioita (mahdollisesti 5% liikevaihdosta) henkilötietojen virheellisestä käytöstä. Nykyinen lainsäädäntö antaa yrityksille mahdollisuuden käyttää dataa vain siihen tarkoitukseen kun se on alunperin kerätty, mikä luonnollisesti rajoittaa datan käyttöä huomattavasti.

Erilaisen big dataan liittyvän osaamisen tarve on suuri. Uusia työnkuvia muodostuu jatkuvasti. Kaikkea big datan hyödyntämiseen liittyvää ei voida kouluttaa samalle henkilölle. Erilaisia vahvuuksia sisällään pitävät monialaiset tiimit tulevat työskentelemään big datan parissa. Niinpä jo koulutuksessa erilaista tiimityöskentelyä täytyy tukea ja erilaisen koulutustaustan omaavia saattaa yhteisten ongelmien eteen.

Opettajien osaamisen rajoitteet voivat muodostaa big data-osaamisen kehitykselle haasteen, kaikilla koulutustasoilla. Yhtenä ratkaisuna voivat olla erilaiset verkko-oppimistyökalut sekä MOOCit (massive open online course). Näiden hyöydyntäminen vaatinee esimerkiksi yliopistoilta halua yhteistyöhön.

Koulutuspuolen ja sekä yritysten ja hallinnon yhteistyötä tarvitaan lisää. Esimerkiksi erilaisia harjoittelumahdollisuuksia sekä opinnäytepaikkoja pitää saada lisättyä. Nämä koskevat niin suoran käytännön (esim. AMK-koodarit) sekä vaikkapa laajemmin data-analytiikkaan ja data managementiin keskittyviä opiskelijoita.

Soveltava osaaminen yrityksissä

Yrityksiltä vaaditaan big datan kanssa nyt tai tulevaisuudessa työskentelevän henkilöstön täydennyskoulutusta. Ongelmana on jälleen osaavien kouluttajien pieni määrä. Myös yritysten osalta erilaisten MOOCien ja muiden verkkotyökalujen käyttö voi helpottaa akuuttia pulaa. Samalla big data-kehityksen hyödyntäminen vaatii jatkuvaa osaamisen päivittämistä.

Edellisessä kappaleessa mainittu yhteistyö oppilaitosten kanssa ja muun muassa käytännön harjoittelut auttavat tulevaisuudessa osaajapulaan. Akuutti (seuraavat pari vuotta) osaajatarve täytyy kuitenkin ratkaista pääosin muilla keinoilla. Vaarana on pitkälti USA:n johtaman kehityksen kelkasta putoaminen, jos osaavaa työvoimaa ei ole erilaisiin tehtäviin saatavilla.

Tutkimus

Big dataan liittyy paljon yhteiskunnallisia kysymyksiä, joiden ymmärtämiseen tarvitaan monialaista tutkimusta. Digitaalisten aineistojen hyödyntäminen vaatii tuekseen viisasta sääntelyä. Tarvitaan yhteiskunnallista ja juridista ymmärrystä siitä, miten aineistoihin liittyvää lainsäädäntöä voidaan kehittää tavalla, joka vie eteenpäin toivottuja tapahtumainkulkuja. Digitaalisesta jäljittämisestä pitää käydä avointa keskustelua, ja sen hyödyistä ja haitoista on oltava tutkimuksellisesti perusteltua näyttöä.

Tutkimusnäkökulmasta huomattavaa on se, että suuria aineistoja analysoitaessa yksilökohtaista aineistoa voidaan yhdistää lukuisista eri lähteistä ja toisaalta aineistot saattavat olla varsin epäyhtenäisiä. Ne voivat koostua eri paikkoihin jääneistä digitaalisista jäljistä tai olla kirjoitettuja viestejä, terveystietoja tai arkistoituja kuvia. Tällainen aineistojen moninaisuus haastaa käsitystä tiedon ja tutkimuksen luonteesta. Suurten aineistojen analyysia voi ajatella sarjana kokeiluja, jolloin onnistuneilla kokeiluilla voi kyseenalaistaa aiempaa osaamista ja kehitellä yhteistoiminnan muotoja, käytäntöjä ja sovelluksia. Näin kompetenssi rakentaa uutta tiedontuotannon maailmaa kasvaa merkittävästi.

Big data on eri tiedeparadigmojen keskiössä

Tutkimusnäkökulmasta big dataa voi ajatella myös yhteistoiminnan areenana. Tätä edellyttää monialaisia tutkimusryhmiä. Tietoa louhitaan yhteistyössä muiden kanssa ja aineistolle esitetään yhä uusia kysymyksiä. Kyse on jatkumosta, jossa kuljetaan pikkuhiljaa kohti mielenkiintoisia vastauksia tai aineiston esittämisen tapoja. Vahvat toimijat, kuten Google, Amazon, tai NSA, hyödyntävät digitaalista aineistoa, jotta ne oppisivat tunnistamaan ihmisten aikeita, tarpeita ja liikkeitä. Yksittäisille ihmisille hyöty on huomattavasti rajallisempi kuin silloin, kun aineistoanalyysi aidosti tukee ihmisiä esimerkiksi heidän hyvinvointipyrkimyksissään tai arvoprojekteissaan. Tästä näkökulmasta olisi tärkeää, että aineistojen analyysimenetelmät kehittyisivät tavoilla, joilla ne myös hyödyntäisivät digitaalisia jälkiä jättäviä ihmisiä ja yhteiskuntaa laajemmassakin mielessä. Big data haastaa tutkijoita sekä käyttämään mielikuvitustaan että tekemään eettisesti kestäviä valintoja tutkimustyössään.

Tutkimusrahoitusta on ohjattava tavalla, joka suosii teknologiaosaajien ja yhteiskuntatieteilijöiden yhteistyötä big dataan liittyvissä asioissa. Eettisiä kysymyksiä ei voi ajatella teknologian käytöistä irrallisena alueena vaan ne on pidettävä mukana tutkimuksen kaikissa vaiheissa.

Suomessa big data-alan tutkimus on vielä suhteellisen hajanaista. Erilaisten, mielellään monialaisten big data-tutkimuskeskusten luonti voisi vauhdittaa alan kehitystä. Perinteisesti Suomessa on huippuluokan osaamista esimerkiksi tieteellisestä laskennasta (esim. CSC), laskennan ja algoritmiosaamisen sekä erilaisten muiden alojen luova yhdistäminen toisi suuria hyötyjä. Suomalaisella big data-tutkimuksella on oivat mahdollisuudet kuulua maailman kärkikastiin.

Useat maat pyrkivät big data-tutkimuksen ykköskaartiin. Maailmalla on perustettu muun muassa big dataan keskittyneitä tutkimuskeskuksia. Britit  
investoivat hiljattain Alan Turingin nimeä kantavan instituutin perustamiseen
https://www.gov.uk/government/news/plans-for-world-class-research-centre-in-the-uk
http://www.theguardian.com/technology/2014/mar/19/budget-2014-alan-turing-institute

Infrastruktuuri

Verkkoon kytkeytyneiden laitteiden ja niiden lähettämän sekä vastaanottaman datan määrä kasvaa huimaa vauhtia. Ciscon ennusteiden mukaan vuoteen 2017 mennessä yhteensä noin 19 miljardia laitetta on kytkettynä internetiin. Suurin osa dataliikenteestä tulee tällöin muodostumaan koneiden keskinäisestä (machine-to-machine) viestinnästä.

Kaiken internetissä myös tulevaisuuden verkoilta, niin kiinteiltä kuin langattomilta, vaaditaan yhä enemmän. Pienilläkin viiveillä voi olla ratkaisevan suuri merkitys erilaisten big dataan perustuvien ratkaisujen kannalta. WEF:in mukaan big datan hyödyntämisen kannalta olennaista on, että verkot toimivat hyvin yhteen niin kotimaassa kuin kv. datavirtojen kohdalla, ne ovat turvallisia, tehokkaita ja toimintavarmoja. (WEF: The Global Information Technology Report 2014) Oleellisessa osassa ovat myös erilaiset yhteentoimivuutta varmistavat toimet ja standardit. Voisiko Suomella olla erilaisten standardien kehittämisen ja kehitystyön suhteen mahdollisuuksia? (vrt. GSM yms)

World Economic Forumin Global Information Technology Report kuvaa myös big dataa koskevia teknisiä ja policy-kysymyksiä (s.39)
http://www3.weforum.org/docs/WEF_GlobalInformationTechnology_Report_2014.pdf

Langattomien verkkojen osalta tulee ennakoivasti allokoida riittävästi ennakkoon mobillidatakäyttöön soveltuvia taajuuksia. Verkkojen tulee kehittyä älykkäämmäksi, jotta valtaisien datamassojen siirtyminen on mahdollista.

Datan käytettävyys ja avoimuus

Jotta big data-vallankumouksesta saadaan enemmän hyötyä irti, täytyy kumouksen raaka-aineen eli datan itsensä, olla mahdollisimman laajasti avointa ja helposti käytettävissä.Erilaisten tietoaineistojen avaaminen ja niiden yhdistely mahdollistaa uusia palveluinnovaatioita. Näin tietoaineistojen avaaminen toimii Avaaja ei useimmiten voi tietää, miten avattua tietoaineistoa käytetään ja mihin sitä mahdollisesti yhdistellään. Esimerkiksi datamassan tuomaa mahdollista liiketoiminnallista potentiaalia ei voi siis lähtökohtaisesti tietää etukäteen.

Julkisen tiedon tulee olla mahdollisimman laajasti avointa ja maksutonta. Julkisen tiedon hyödyntäminen on kirjattu myös nykyisen hallituksen hallitusohjelmaan tavoitteena. Tietovarantoja avataankin tällä hetkellä osana valtiovarainministeriön vetämää avoimen tiedon ohjelmaa.

Avoimen tiedon tulee olla muodossa, jossa sen hyödyntäminen on mahdollisimman helppoa. Esimerkiksi erilaisten julkisten tietoaineistojen koneluettavia standardimuotoja tulee edistää.

Myös yritysten ja muiden organisaatioiden datan avoimuuteen ja jakoon tulee mahdollisuuksien mukaan kannustaa. Tätä on kuvattu hieman tarkemmin kohdassa "yritysten yhteistyö ja datamarkkinat".

Valtiovarainministeriön vetämä avoimen tiedon ohjelma avaa julkisia tietoaineistoja http://www.vm.fi/vm/fi/05_hankkeet/02381_avoin_tieto/index.jsp

Lainsäädäntö, sääntely ja tietosuoja

Yksityiselämän suoja on turvattu Suomessa perusoikeutena (PL 10 §). Myös Euroopan ihmisoikeussopimus ja EU:n perusoikeuskirja edellyttävät, että jokaisen oikeutta yksityiselämään on kunnioitettava. Yksityisyyden suojaa joudutaan usein punnitsemaan suhteessa muihin perus- ja ihmisoikeuksiin, kuten sananvapauteen ja julkisuusperiaatteeseen. Viime aikoina kansainvälisessä keskustelussa on myös yhä useammin noussut esiin digitaalisten perusoikeuksien turvaaminen. Suomen perustuslain mukaan henkilötietojen suojasta on säädettävä tarkemmin lailla. Henkilötietolaki (523/1999) on henkilötietojen käsittelyä koskeva yleislaki. Lain tarkoituksena on muun muassa toteuttaa yksityiselämän suojaa ja edistää hyvän tietojenkäsittelytavan kehittämistä ja noudattamista. Henkilötietolain velvoitteet pitää huomioida aina, kun käsitellään henkilötietoja, eli tietoja, jotka ovat yhdistettävissä tiettyyn henkilöön. Lakia ei kuitenkaan sovelleta tilanteisiin, joissa luonnollinen henkilö käsittelee henkilötietoja yksinomaan henkilökohtaisiin tai niihin verrattaviin tavanomaisiin yksityisiin tarkoituksiinsa.

Big Datan käsittelyn yhteensovittaminen henkilötietolain kanssa ei ole täysin ongelmatonta. Erityisesti henkilötietolaissa kuvattu käyttötarkoitussidonnaisuus, informointivelvollisuus ja rekisteröidyn suostumus ovat Big Datan näkökulmasta haasteellisia. Tästä syystä tietojen käsittelijän on syytä varmistaa, että käsittely on henkilötietolain mukaista, jos osana Big Dataa käsitellään henkilötietoja, joita ei ole täydellisesti anonymisoitu. Esimerkiksi pelkästään nimien ja muiden yksilöintitietojen poistaminen ei vielä välttämättä tarkoita, että tiedot muuttuvat anonyymeiksi, jos henkilöt ovat edelleen välillisesti tunnistettavissa. Euroopan unionissa valmisteilla olevan tietosuoja-asetuksen on tarkoitus uudistaa ja harmonisoida unionin tietosuojalainsäädäntöä. Jos asetus tulee voimaan, se muuttaa monella tavoin jäsenmaiden kansallista henkilötietojen käsittelyä koskevaa sääntelyä. Big Datan näkökulmasta merkityksellisiä ovat muun muassa profilointia, tietojen käsittelyn läpinäkyvyyttä, rekisteröidyn informointia tai rekisteröidyn oikeutta tulla unohdetuksi koskevat artiklaehdotukset. Tietosuoja-asetus vaikuttaisi voimaan tullessaan kaiken sellaisen datan käsittelyyn, jota ei ole täysin anonymisoitu.

Viranomaisen hallussa olevien asiakirjojen julkisuuteen sovelletaan julkisuuslakia (621/1999). Julkisuuslaki soveltuu myös silloin, kun luovutetaan henkilötietoja viranomaisen henkilörekisteristä. Henkilötietojen luovutuksen edellytyksenä on tällöinkin, että luovutuksen saajalla on henkilötietolain mukainen oikeus käsitellä kyseisiä henkilötietoja. Näin ollen julkistakaan henkilötietoa ei voida automaattisesti saattaa vapaasti uudelleen käytettäväksi, vaan luovutuksen reunaehdot määräytyvät julkisuuslain, henkilötietolain ja mahdollisen erityislainsäädännön mukaisesti. Tämä tulee huomioida myös Big Datan käsittelyssä jos käsitellään viranomaislähtöistä tietoa.

Henkilötietojen suojaa ja julkisuutta koskevan sääntelyn lisäksi Big Datan käsittelyyn voi vaikuttaa immateriaalioikeudellinen sääntely. Erilaiset tietokannat ja niihin liittyvät ohjelmistot saattavat esimerkiksi nauttia tekijänoikeudellista suojaa. Lisäksi tietoihin ja niiden käyttöön saattaa liittyä sopimusoikeudellisia ja muita kaupallisia velvoitteita, jotka tietojen käsittelijän tulee huomioida.

Tulevaisuudessa Big Datan hyödyntäminen saattaa johtaa siihen, että sen aiheuttamia ongelmia joudutaan ratkaisemaan uuden sääntelyn kautta. Esimerkiksi syrjivät hinnoittelukäytännöt saattaisivat johtaa lainsäädännöllisiin uudistuksiin. Yritysten ja muiden organisaatioiden kannalta hyvä perusneuvo tietosuojan toteuttamiseen on, että tietojenkäsittely ensin suunnitellaan huolellisesti ja sen jälkeen pysytään tässä suunnitelmassa. Läpinäkyvyys tietojenkäsittelyssä korostuu tulevaisuudessa, mikä vaikuttaa suoraan myös Big Dataan. Kaiken kaikkiaan sekä kansallista että kansainvälistä sääntelyä tulisi kehittää siihen suuntaan, että se mahdollistaa Big Datan hyödyntämisen tarkoituksenmukaisella tavalla.

Turvallisuus

TULOSSA

Oman tiedon hallinta

Kansalaisten tulee voida vaikuttaa siihen, mihin ja miten heidän tietojaan käytetään. Kerättyä tietoa tulisi halutessaan voida hyödyntää myös eteenpäin. Tiettyjä tietoja luovuttamalla voisi saada esimerkiksi parempaa ja yksillöllisempää tai halvempia palveluita. Samalla tämä saattaisi mahdollistaa uudenlaisten palveluiden kehittämisen. Useimmiten jo nyt pyydettäessä luovutettavien tietojen laajempi hyödynnettävyys olisi myös tietoja keräävien yritysten intresseissä. Niin sanottu Mydata-kehitys voisi tarjota yhden mahdollisen tavan omien tietojen hyödyntämiseen ja hallitsemiseen. Ratkaistaviin kysymyksiin kuuluu muun muassa, missä tietoa säilytetään (aggregaattipalvelut, joihin haluamiaan tietoja voi kerätä ml. QS-tiedot?) sekä missä muodossa tietoa tulisi luovuttaa. Samalla yksittäisen kansalaisen (asiakkaan) kannalta omien tietojen hallinta ja hyödyntäminen mahdollistaa mm. säästöjä, juuri itsensä kannalta sopivien palveluiden "räätälöinnin" sekä luottamuksen lisäämisen tietoja kerääviä yrityksiä kohtaan.

LVM teettää selvitystä Mydatasta. Selvityksen tavoitteena on kiteyttää tulevaisuuden skenaariot henkilökohtaisen datan hallinnoinnin, yhdistämisen ja  
jakamisen alueella sekä luoda pohjaa suomalaisen henkilökohtaiseen dataan perustuvan yhteistyöverkoston syntymiselle. Selvitys valmistuu 16.9.2014 mennessä
http://www.lvm.fi/web/hanke/liikenteen-ja-viestinnan-avoin-tieto

Osallistaminen

Demokraattista osallitumisen mahdollisuuksia sekä kansalaisten äänen kuulumista esimerkiksi päätöksentekoon voidaan lisätä big datan avulla. Teknologia ja uudet tiedon analysointimenetelmät tulisi valjastaa tukemaan myös demokratian ja kansalaislähtöisyyden kehitystä. Tämä olisi esimerkillistä ja rohkeaa, toisaalta kokemukset voisivat olla myös vientikelpoisia.Ylipäätään asiakkaiden, käyttäjien sekä kansalaisten osallistaminen on tarpeellinen lähtökohta big data-kehitykselle. Välttämättä ihmisten tietoja ei vain viedä, kuten synkemmissä big datan riskejä korostavissa arvioissa mainitaan, vaan ihmisiä voidaan big datan avulla myös osallistaa mukaan esimerkiksi heitä koskevien päätösten tekemiseen. Tässä lähtökohtana on käyttäjän suostumus.

Kansalaismielipide päätöksenteon tueksi big datan avulla?
Big data tarjoaa paljon mahdollisuuksia myös osallistamisen ja demokratian kannalta. Uusien menetelmien avulla voitaisiin esimerkiksi käsitellä erilaisia
kansalaisten mielipiteitä tarjoavia aineistoja ja lähteitä. Muun muassa sosiaalisen median, 
erilaisten kyselyiden ja keskusteluiden yhdistelyllä voisi saada paremman kuvan kansalaisten mahdollisista ongelmista ja esimerkiksi reaktioista
erilaisiin päätöksiin. Menetelmien avulla voisi löytää piileviä aiheita ja tehdä päätöksenteosta ja hallinnosta responsiivisempaa sekä 
kansalaislähtöisempää.

Samalla osallistaminen voi olla toimiva menetelmä myös uusien datalähtöisten palveluiden kehittämisessä. Käyttäjien havaintoja tai heiltä saatua tietoa voi hyödyntää toiminnan parantamisessa ja osittain erilaisten mallien synnyttämisessä. Esimerkkinä tästä voisi olla vaikka reittisuosituksia yms. antava liikennesovellus, joka yhdistelisi sekä käyttäjien dataa että esimerkiksi reaaliaikaista liikennedataa saavuttaakseen mahdollisimman tarkat ennusteet sekä paremman palvelun.

Osallistamista sekä käyttäjien havaintojen keräämistä ja hyödyntämistä tulisi soveltaa myös hallinnon palautteen keräämisessä ja toiminnan suunnittelemisessa yhä enemmän.

Tekniset käytännöt ja standardit

Eri organisaatioihin kertyvä data täytyy pystyä ottamaan tehokkaasti käyttöön siellä missä sitä tarvitaan; tätä tarkoitusta varten tarvitaan yhteisiä sopimuksia tai standardeja siitä, kuinka dataa tallennetaan, jaellaan ja prosessoidaan. Big datan täysimääräisessä hyödyntämisessä oleellista on myös se, että erilaisista tietokannoista ja dataseteistä voidaan hakea tietoa, malleja ja tuloksia. Toisin sanoen yhteentoimivuus on oleellista.

Tällä hetkellä tätä edistäviä yhteisiä, maailmanlaajuisessa käytössä olevia, esimerkiksi datan varastointiin ja tiedonsiirtämiseen liittyviä big data-standardeja ei kaikilla osa-alueilla ole, teknologioiden yhä kehittyessä. Standardisointi kehitetään eri puolilla kovaa vauhtia, asiaa selvitetään muun muassa Yhdysvaltain National Institute of Standards and Technologyssa. Tämän lisäksi useissa muissa standardoimisorganisaatioissa pohditaan ja etsitään mahdollisuutta eri teknologioiden yhteentoimivuuden varmistaville big data-standardeille.

Samalla standardointia tarvitaan myös yritysten keskinäisen datan vaihdon mahdollistamiseen. Erilaiset big data-ratkaisut ja teknologiat eivät ole tällä hetkellä yhteenvoimivia. Tulevaisuudessa nähtäneen yhteisiä standardeja ja käytäntöjä, joiden avulla big data-ratkaisujen yhteentoimivuus varmistetaan.

Suomen ja suomalaisten yritysten tulee pysyä mukana ja edistää standardikehitystä osallistumalla mahdollisuuksiensa mukaan erilaisten ja eri alojen standardointielinten toimintaan. Lisäksi tietoa standardien ja teknologian kehityksestä tulee jakaa keskinäisessä verkostossa. Standardien ollessa vielä kehittymättömiä, niiden muotoutumiseen pyritään vaikuttamaan niin, että muotoutuvat standardit ovat mahdollisimman pitkälle suomalaisten alan yritysten edun mukaisia.

Suomessa on tehtävä myös big data-alan teknologiakartoituksia ja tunnistettava oleellisimpia teknologioita, malleja sekä standardeja. Samalla erilaisten big dataan liittyvien määritelmien ja termien yhtenäisyys on oleellista. Tätä tulisi myös Suomessa tehdä. (esim Standardoimisliitto)

//TÄHÄN TEKNOLOGIAT JA TEKNISET KÄYTÄNNÖT TULOSSA//

Sovellusalueet ja niiden potentiaali Suomessa

Terveys

Terveysalalla Suomella on suuri potentiaali big datan suhteen. Suomesta löytyy maailmanlaajuisesti katsoen poikkeuksellisen laadukkaita ja kattavia tietokantoja, muun muassa geenitietoihin liittyen. Näiden vahvuuksien vastuullinen käyttäminen big data-ratkaisuissa voisi tarjota Suomelle merkittävän, globaalin kilpailukykytekijän.

Terveydenhuollon kenttä liittyy big dataan lukuisilla eri tavoilla, ja Suomessa on jo alan osaamista esimerkiksi bioinformatiikan ja molekkyylilääketieteen alalla. Toinen tärkeä linkitys tulee itsenmittausteknologioiden kehityksestä, jossa suomalaisyrityksissä on osaamista kymmenien vuosien ajalta. Terveysdatan laajemman saatavuuden ennustetaan muuttavan ihmisten käsitystä itsestään ja omasta terveydestään. Elämäntavoista ja geenitiedon avulla kertyvän big datan avulla voi ehkä tulevaisuudessa ehkäistä sairastumista. Nykyään terveystietoja voi kerätä esimerkiksi Taltioniin, josta voi tulla tulevaisuudessa tärkeä alusta henkilökohtaiselle big datalle.

Big data mahdollistaa terveydenhuoltoon uudenlaisen oppimisen, kun kerrytetty ja analysoitu data tukee lääkärien ja muun hoitohenkilökunnan työtä. IBM:n kehittämä Watson on yksi esimerkki siitä millaisia käyttöjä big datalle on kehitelty. Kun potilas kertoo oireistaan lääkärille, lääkäri voi samalla kysellä Watsonilta taustatietoja potilaan oireiden perusteella. Watson käy muutamassa sekunnussa tietokannastaan läpi hakusanojen avulla tuhansia oppikirjoja ja satoja tuhansia tieteellisiä artikkeleita.

Big datalta odotetaan terveydenhuollon laadun parantumista ja säästöjä. Data-analyysin odotetaan kehittyvän tavalla, joka auttaa yksittäisen kansalaisen terveysriskien ennustamisessa erilaisten datavirtojen avulla sekä sairauksien ehkäisyssä. On tärkeää, että suomalaiset tuntevat kansainvälisen kentän ja ovat mukana ohjaamassa ajankohtaisia kehityskulkuja.

Terveystietojen hyötykäyttöön liittyy yksityisyyteen, sosiaalisiin ja eettisiin näkökulmiin liittyviä kysymyksiä, jotka on otettava vakavasti. Ilman niitä suotuisat kehityskulut tuskin ovat mahdollisia. Yksi tapa on määritellä vastuullisen aineiston käytön puitteita yhteistyössä eri alojen osaajien kanssa.

Suomessa on muun muassa Sote-uudistuksen myötä oiva tilaisuus pohtia tarkemmin, kokeilla ja ottaa käyttöön big dataan perustuvia ratkaisuja. Dataan perustuvista hoitomenetelmistä ja -käytännöistä on saatu merkittäviä tuloksia. Big dataan perustuvien ratkaisuilla voidaan saavuttaa selviä taloudellisia säästöjä. Nykyisessä taloudellisessa tilanteessa, varsinkin kuntien osalta, säästöjen saavuttaminen uuden teknologian avulla palvelutasoa sinänsä laskematta on avainasemassa.

Erilaisten dataan perustuvien omahoitomenetelmien käyttöönottoa tulee samalla tukea.

Julkishallinto

Suomea viime vuosina koetelleet finanssi- ja pankkikriisit, työn ulkomaille siirtymiseen vaikuttavat globaalin kilpailutilanteen muutokset sekä nopean teknologiakehityksen myötä kiihtyvät liiketoiminnan murrokset perinteisesti työllistäneillä toimialoilla ovat kaikki aikamme globaalitalouden ilmiöitä, jotka asettavat suuria haasteita ja uudistusmisvaatimuksia Suomen jo ennestään ylivelkaantuneelle julkiselle sektorille. Em. globaalien ilmiöiden seuraukset Suomelle ilmenevät mm. vientiteollisuuden paikoittaisena kilpailukyvyn romahtamisena, rakenteellisen työttömyyden kasvamisena ja julkisen talouden kestävyysvajeen syvenemisenä. Edessä oleva suurten suomalaisten ikäluokkien eläköityminen tulee tulevaisuudessa rasittamaan julkisen talouden kustannusrakenteita entisestään.

Suomen virkaa tekevä hallitus on pyrkinyt torjumaan kestävyysvajetta ja tasapainottamaan julkista taloutta mm. rakennepoliittisilla uudistustoimenpiteillä, jotka kohdistuvat moniin eri yhteiskunnan osa-alueisiin kuten esim. terveydenhuoltoon, kuntauudistukseen, työurien pidennykseen, rakenteelliseen ja nuorisotyöttömyyden torjuntaan sekä työ- ja kouluttautumismahdollisuuksien lisäämiseen. Rakenteellisten muutosten mahdollistamien kustannussäästöjen lisäksi tuottavuuden lisääminen niin kustannus- kuin palvelutehokkuutta parantamalla on keskeisiä julkisen sektorin tavoitteita.

Big Data ajattelutapana (kts. Datatietoisuus) ja teknologiana antaa omalta osaltaan uudenlaisia näkökulmia hallinnolle edistää tuottavamman yhteiskunnan ja kestävyysvajeen torjumisen strategisia päätavoiteita, lisäten samalla kansalaisten tyytyväisyyttä julkisiin palveluihin. Big Datan avulla on mahdollista realisoida tuottavuushyötyjä useimmilla hallinnon alueilla. Datalähtöisempää julkishallintoa voidaan yleisesti tarkastella esim. kolmessa seuraavassa osa-alueessa: Datalähtöisen päätöksenteon ja jatkuvan organisaatiokehityksen tuominen osaksi julkishallinnon kulttuuria, kansalaisten henkilökohtaisemmat palvelut sekä yritysten ja kansalaisten parempi osallistaminen mm. julkisten palveluiden kehitykseen (kts. Osallistaminen) Lisäksi Big Datan hyödyntämistä tulee tarkastella eri hallinnonaloille kohdistettavissa olevien yksittäisten Big Data-käyttötapausten kautta.

Big Datan tuottavuusparannuksista julkishallintoon on haastavaa esittää tarkkoja arvioita ilman täsmällisempää analyysiä, mutta McKinsey arvioi vuoden 2011 raportissaan Euroopan julkishallintojen kykenevän Big Dataa hyödyntämällä vähentämään hallinnollisia kulujaan n. 15-20 prosenttia ja lisäämään 0,5 prosentin vuotuisen parannuksen tuottavuuteen. (McKinsey Global Institute, 2011, Big data: The next frontier for innovation, competition, and productivity)

Tavoitteena data- ja asiakaslähtöisempi organisaatiokulttuuri

Datalähtöinen organisaatiokulttuuri edellyttää, että julkishallinto pyrkii tietoisesti ja jatkuvasti omaksumaan maailmalla parhaiten toimiviksi todettuja käytäntöjä tiedolla johtamisessa, organisaatioiden kehittämisprosesseissa (esim. lean-prosessit), organisaation tavoitteisiin sidotussa suorituskykymittauksessa sekä dataan perustuvan päätöksenteossa. Datalähtöisessä julkishallinnossa organisaatiot, niin pienet kuin suuremmat yksiköt, määrittelevät omaa missiotaan ja tavoitteitaan tukevat, selkeästi ymmärrettävät ja läpinäkyvät datalähtöiset suorituskykymittarit. Kansainvälisestikin vertailukelpoisesti valitut mittarit ohjaavat organisaatioita tekemään ohjattuja päätöksiä, jotka palvelevat mahdollisimman tehokkaasti organisaation oman mission ja kansalaisten palvelutulosten toteutumista. Datalähtöistä päätöksentekoa tukevat Big Data-järjestelmät mahdollistavat päätöksenteon tavalla, jossa tekeillä olevien päätösten hyötyjä, kustannuksia ja pitkän tähtäimen vaikutuksia on mahdollista ymmärtää ja simuloida ennen päätösten varsinaista toimeenpanemista. Big Datalla on tärkeä merkitys entistä edistyneempien ja ennakoivempien mittareiden mahdollistamisessa, samoin kuin laadukkaiden mittarien edellyttämän hienojakoisten signaalien löytämisessä organisaatioiden suurista tietomassoista. Muutos datalähtöiseksi organisaatioksi on kokonaisvaltainen, joskin eri kypsyysvaiheessa olevat organisaatiot toki ottavat askeleita tavoitteisiin vaiheittain. Datan avaamisesta, laadun varmistamisesta, tiedonhallinnan roolien, prosessien ja vähimmäisarkkitehtuurikyvyyksien luomisesta edetään tietoisesti kohti omaa toimintaansa mittaavaa ja optimoivaa organisaatiota. Lopulta oleellista on valita organisaation suorituskykyä kuvaavat korkean tason suoriutuskykymittarit siten, että ne voidaan ymmärrettävästi ja läpinäkyvästi linkittää organisaation mission ja tavoitteiden toteutumiseen ja näitä edistäviin käytännön toimenpiteisiin. Mittareiden pohjana olevien oletusten, käsittelysääntöjen ja lopulta itse datan läpinäkyvyys kansalaisille toimii omalta omaltaan takeena valittavien mittareiden luotettavuudelle ja ”peukaloimattomuudelle”. Julkisten toimijoiden tärkeimmät korkean tason suorituskykymittarit kohdistuvatkin yleensä lopulta toimijoiden palvelemiin ”ulkoisiin asiakkaisiin” – eli kansalaisiin ja heidän palvelukokemukseensa, mikä tilivelvoittaa hallintoa jatkuvasti parantamaan kansalaisille tarjoamaansa palvelua. Yleisiä, koko Suomea koskevia taloudellisia ja yhteiskunnallisia korkean tason mittareita ylläpitää esim. Findikaattori (www.findikaattori.fi ).

Ranskan datalähtöinen hallintoreformi
Esimerkkinä julkishallinnon mission asiakaslähtöistämisestä voidaan pitää Ranskan massiivista finanssikriisin jälkeistä hallintoreformia, jonka  
säästötavoite vuoden 2009-2013 aikana oli 15 miljardia euroa ja leikkaustarve yli 150 000 julkisen sektorin tehtävää. Kustannusäästöjen lisäksi 
tavoitteena oli palvelun laadun radikaali parantaminen. Reformia valmistellessa kansalaisilta ja yrityksiltä pyydettiin yksinkertaista pisteytysarviota  
koskien yhteensä 50 erilaista kansalaisten ja julkishallinnon välistä ”elämänaikaista tapahtumaa” sekä vastaavasti 30 erilaista yritysten ja 
julkishallinnon välistä ”yritysten elinkaarenaikaista tapahtumaa”. Esimerkkeinä kansalaisia koskevista tapahtumista olivat esim. ”avioliiton solmiminen”
ja yrityksiä koskevista interaktioista esim. ”uuden yrityksen perustaminen”. Reformin alussa kansalaiset ja yritykset arvioivat kunkin julkishallintoon
suuntautuvan interaktionsa koettua monimutkaisuutta arvoilla ”yksinkertainen”, ”OK”, ”monimutkainen ”, ”erittäin monimutkainen”. Varustettuna näillä
alustavilla kansalais- ja yritysnäkökulmilla julkisen asioinnin havaitusta monimutkaisuudesta, tuli kyseisiä asiointiprosesseja hallinnoivien yksiköiden
uudeksi ja ainoaksi asiakaslähtöiseksi missioksi uudistaa koko toimintansa siten, että kansalaisten ja yritysten monimutkaiseksi kokemat ”elämän
tapahtumat” saadaan mahdollisimman nopeasti muutettua mahdollisimman yksinkertaiseksi. Reformin valmistuttua kyselyn tulokset osoittivat julkisen 
asioinnin havaitun monimutkaisuuden pudonneen (eli koetun palvelun laadun lisääntyneen) 20 prosenttia kansalaisten tapauksessa ja 25 prosenttia yritysten
tapauksessa. http://www.mckinsey.com/insights/public_sector/transforming_government_in_france
Suorituskykykyä vertailemalla parhaita käytäntöjä

Julkishallinnon yksiköiden oman päätöksenteon tehostamisen lisäksi datalähtöisellä mittaamisella on erittäin tärkeä merkitys julkisten yksiköiden keskinäisessä suorituskykyvertailussa (benchmarking), joka tarjoaa julkisen toimijan ulospäin läpinäkyvän suorituskykyinformaation lisäksi yksikölle itselleen vahvan sisäisen insentiivin ja lähtökohdan kehittää omaa suorituskykyään edelleen. Suorituskykyvertailun keskeisenä oivalluksena on se, että näennäisesti erilliset julkiset toimijat voivat olla missioltaan, perusprosseiltaan tai esim. rakenteeltaan hyvinkin samankaltaisia. Nämä keskinäiseen vertailuun soveltuvat yksiköt voivat olla esim. eri henkilökunnan tai tahon toimesta johdettuja sisaryksiköitä samassa julkisessa emo-organisaatiossa tai hallinnonalassa mutta aivan yhtä hyvin verrokkiorganisaatiot voivat olla kokonaan erillisiä julkisia toimijoita tai yksityisiä yrityksiä Suomesta tai muualta maailmasta. Kun julkiset toimijat ja yritykset eri puolilla Suomea ja maailmaa mittaavat omaa suorituskykyään lisääntyvässä määrin keskenään vertailukelpoisella standardimittaristolla, voivat tietyllä osa-alueella muihin nähden alisuorittavat julkishallinnon yksiköt oppia, omaksua tai parhaassa tapauksessa suoraan kopioida parhaita suorituskyvyn tehostamiskäytäntöjä niiltä verrokkiyksiköiltä, jotka ovat kyseisellä osa-alueella kansainvälistä huippua.

Verokarhulle tehoa datalähtöisellä benchmarkkauksella
Esimerkkinä suorituskykyvertailusta on tutkimus, jossa yhteensä 13 maan verohallintoa verrattiin toisiinsa erilaisilla verohallinnollisilla osa-alueilla
(esim. verotietoja koskevat rutiinitoimenpiteet, ei-ilmoitettuihin tietoihin liittyvät auditoinnit, tehostettu proaktiivinen veronkeruu,  monikanavainen 
asiakaspalvelu). Tiivistäen, tutkimus osoitti että yksikään verohallinnoista ei ollut paras kaikilla osa-alueilla eli kaikilla oli opittavaa toisiltaan
suorituskyvyn parantamisessa. Lisäksi tutkimus osoitti, että 13 verohallintoa yhdessä voisivat kerätä 86 miljardia euroa lisää suorina veroina ja säästää
6 miljardia kuluissa, mikäli kaikki verohallinnot toteuttaisivat veronkeruun yhtä hyvin kuin paras kolmasosa. (Thomas Dohrmann and Gary Pinshaw, ”The road
to improved compliance: A McKinsey benchmarking study of tax administrations 2008-2009)  
http://www.mckinsey.com/client_service/public_sector/expertise/public_finance

Edellä esitetyt datalähtöisemmän organisaatio- ja päätöksentekokulttuurin luominen sekä suorituskyvyn jatkuva parantaminen ovat tärkeitä askeleita kohti huomispäivän tuottavampaa ja sitä kautta kestävämpää julkishallintoa. Datalähtöisen kulttuurin voivat saada toimimaan ainoastaan julkishallinnossa työskentelevät ja työnsä merkityksellisyydestä motivoituneet ihmiset, jotka sekä ymmärtävät oman työnsä perimmäisen palvelutarkoituksen ja jotka ovat valmiita datalähtöisyyden edellyttämään asennemuutokseen. Ihmisten kouluttaminen, motivoiminen ja vastuuttaminen tähän uuteen organisaatiokulttuuriin on suuri haaste ja muutos, jota on lähestyttävä kokonaisvaltaisesti pelkkien inkrementaalisten organisaatiomuutosten sijaan. Datalähtöisen muutoksen käynnistäjiksi ja suunnannäyttäjiksi tarvitaankin kokeneita ja vastuutettuja tiedolla johtamisen pioneereja, joilla on vahvan datalähtöisen näkemyksen lisäksi kyky motivoida ihmisiä ja organisaatioita pitkäjänteisesti.

Kansalaisille yksilöllisempää julkista palvelua

Eräs julkishallinnon kestotavoitteista on tarjota kustannus- ja palvelutehokkaampia palveluita kansalaisilleen eli säästää nykyisten palveluiden kustannuksissa ja/tai parantaa palveluiden vaikuttavuutta kustannusrakenne säilyttäen. Keskeinen keino parantaa palvelun vaikuttavuutta ja kansalaistyytyväisyyttä on segmentoida kansalaiset Big Datan tarjoamin menetelmin ja siten tarjota heille henkilökohtaisempaa palvelua. Datalähtöisemmät palvelut vievät myös kansalaisten kokeman loppukäyttäjäkokemuksen seuraavalle tasolle. Sen perusteella millainen kansalainen on, missä kansalainen on, mitä kommunikointivälinettä hän käyttää ja mitä hän on parhaillaan tekemässä, voi älykäs palvelu ehdottaa kansalaiselle ”päätöksiä” siitä, mitä hänen mahdollisesti tai luultavasti kannattaisi tehdä seuraavaksi. Kansalaisen tehtäväksi jää sitten tyypillisesti ja minimissään annettujen datalähtöisten ehdotusten hyväksyminen, tarvittaessa myös käyttäjälle päätöksen yhteydessä annettujen tarkempien perustelujen tai toimintasuositusten pohjalta. Henkilökohtaisemmat ja päätöksentekoa helpottavat käytettävät palvelut parantavat automaattisesti kansalaisten tyytyväisyyttä ja luottamusta julkishallintoon.

Saksassa työvoimahallinto löytää big datalla töitä
Esimerkkinä suuren mittakaavan kansalaisten analyyttisestä segmentoinnista ja julkishallinnon personoidusta asiakaspalvelusta on Saksan valtiollinen 
työllisyysvirasto Bundesagentur fur Arbeit (BA), jonka päätehtävänä on integroida työnhakijat mahdollisimman nopeasti takaisin työvoimaan ja omalta 
osaltaan tehostaa yritysten rekrytointiprosesseja. Segmentoimalla tarkasti tarjolla olevat työtehtävät ja työntekijät sekä räätälöimällä yksilöllisesti 
mm. työnhaun edistämiseen tarkoitetut neuvontapalvelut, BA on saanut aikaan merkittäviä tuloksia. Vuodesta 2006 vuoteen 2011 BA:n asiakkaan keskimääräinen
työttämänäoloaika putosi 162 päivästä 136 päivään, työttömien määrä putosi 4,5 miljoonasta 2,9 miljoonaan ja BA:n kautta työllistyneiden määrä (per 
vuosi) kasvoi 240 000 ihmisestä 510 000 ihmiseen. Myös BA:n asiakastyytyväisyys niin työntekijöiden kuin työnantajien puolella parantui huomattavasti
kyseisenä aikana. (McKinsey Interview 2013, Frank Jurgen Weise, Behind the German jobs miracle.
http://www.mckinsey.com/features/government_designed_for_new_times/table_of_contents )  

Laadukkaiden palveluiden tulee lisäksi kaikin tavoin säästää kansalaisten aikaa, esim. kaikki kansalaisille näkyvät hakemus- ja tiedonsyöttöprosessit tulisi automatisoida byrokratian ja käsittelyvirheiden vähentämiseksi. Kansalaisille on oltava mahdollisuus itse päivittää esim. kaikkia julkiseen asiointiinsa liittyviä, valmiiksi esitäytettyjä henkilö- ja hakemustietojaan. Riippumatta mikä taho julkiset digitaaliset palvelut varsinaisesti teknisesti rakentaa, tulee kaikkien palveluiden tukea helposti saatavissa olevaa reaaliaikaista palautetta niiden käytöstä, niin kansalaisten antaman eksplisiittisen yhteisöllisen palautteen kautta kuin palvelun varsinaiseen käyttöön perustuvaan analytiikan muodossa. Käytöstä kerättyä palautetta voidaan jälkeen päin analysoida niin palvelun käytettävyyden kuin varsinaisen julkisen asioinnin kehittämisen kannalta.

Julkishallinnon mahdollisia Big Data-käyttötapauksia 

Julkishallinnolla on suuria määriä dataa, tyypillisesti rakenteisessa teksti- ja numeromuodossa. Julkishallinnon tuottavuutta voidaan  parantaa  
yksittäisillä ja kustannussäästöjä teknisillä Big Data-ratkaisuilla, jotka on kohdistettavissa julkishallinnon eri hallinnonalojen ja yksiköiden 
täsmällisiin tietojenkäsittelyllisiin ongelmiin. Hyödynnettäessä Big Dataa julkishallinnossa, on teknisiä IT-ratkaisuja huomattavasti tärkeämpää saada 
aikaan datalähtöisyyden edellyttämä asennemuutos julkishallinnon ihmisissä ja työskentelytavoissa ja sitä kautta luoda jatkuvaan mittaamiseen ja hallinnon
parantamiseen liittyvä datalähtöinen organisaatiokulttuuri. Alla on lueteltu mahdollisia sovelluskohteita Big Data –ratkaisuille:

Työvoima ja kouluttautuminen

*Koulutustarjonta-, työtarjonta- ja työvoimatarjontatietovarantojen yhdistäminen ja analyyttinen segmentointi työttömän työvoiman mahdollisimman nopeaksi
ja tarkaksi kohdistamiseksi tarjolla oleviin ja työttömille hakijoille yksilöllisesti soveltuviin työ- ja jatkokouluttautumistilaisuuksiin. Tällä voidaan
omalta osaltaan tukea hallituksen tavoitteita nuorisotyöttömyyden torjumisessa, työurien pidentämisessä, ammatillisen koulutuksen tarjoamisessa, 
välityömarkkinoissa sekä työtarjousten lisäämisessä (ja niiden tiukennetusta vastaanottovelvollisuudesta).
Sosiaalietuuksien ja –tukien väärinkäytön data-analyyttinen ennakoiminen ja tukihakemusten/päätösten käsittelyn nopeuttaminen
*Tarjotun työn ja sen vastaanottamisen tarpeen perusteleminen data-analyyttisesti tarjotusta työstä kieltäytymisen vähentämiseksi
*Education to Employment (E2E) parhaiden käytäntöjen soveltaminen yhdessä yritysten kanssa, mm. kasvan teknologiatyöttömyyden suunnan ennakoimiseksi
*Yleisesti työllisyyteen liittyvien koulutus- ja osaamistarpeiden tilannekuvaseuranta ja työvoimapoliittisten strategioiden paremmaksi ennakoimiseksi

Harmaan talouden ja kansainvälisen veronkierron torjunta

*Tehostettu petosten ja virheiden havainnointi Big Data-ratkaisuilla osaksi harmaan talouden torjuntaohjelmaa
*Kovaan dataan perustuvien veroanalyysien täydentäminen esim. sosiaalisen median pehmeämmällä datalla

Hallituksen kestävän kehityksen mittarit

*Yhteiskunnalliseen kestävyyteen liittyvät Big Data-mittarit ja niiden kansalaisystävällinen seuranta
*Ympäristön kestävyyteen liittyvät Big Data-mittarit ja niiden kansalaisystävällinen seuranta

Kansalaisille avoimempi ja ymmärrettävämpi kuva valtiontalouden tilasta 

*Kansantalouden data-analyyttinen "simulaattori” palvelemaan yksityisten, julkisten tahojen ja yksittäisten kansalaisten tekemiä tutkimuksia koskien
 valtiontalouden tilaa  
*Valtion rahoitusvirtojen ihmisystävällisemmät visualisoinnit avoimen datan pohjalta, esim. oman äänestyspäätöksen helpottamiseksi
*Muut taloudelliseen kestävyyteen liittyvät Big Data-mittarit ja niiden kansalaisystävällinen ja -motivoiva seuranta

Älykkäät verkot

TULOSSA

Tutkimus

Big data-kehitys tarjoaa tutkimukselle huomattavia mahdollisuuksia. Esimerkiksi uusien, dataan perustuvien tutkimusmenetelmien kehitys tuo lähes alan kuin alan tutkijoille huomattavasti parempia mahdollisuuksia tutkia erilaisia asioita ja toisaalta löytää ongelmiin myös vastauksia. Muun muassa erilaisen mobiilidatan, trendidatan sekä sosiaalisesta mediasta saatavan datan määrän kasvu tuo tutkijoiden ulottuville aivan uudenlaisia aineistoja.

Menetelmäkehityksen lisäksi tärkeää on muistaa niiden hyödyntämisessä muun muassa monitieteisyys. Esimerkiksi erilaisiin yhteiskunnallisiin ongelmiin voidaan hakea vastauksia uusien menetelmien avulla. Tämä vaatii eri tieteenalat ylittävää työskentelyä, muun muassa matemaatikkojen, ohjelmoijien ja yhteiskuntatieteilijöiden kesken. Erilaiset laitos- ja tieteenalarajat eivät saa estää uusien menetelmien sekä mahdollisuuksien täysimääräistä käyttöä. Yliopistojen tulisi olla valmiita muun muassa erilaisten monialaisten tutkimustiimien tukemiseen.

Liikenne

Liikenteen alalla datan räjähdysmäinen lisääntyminen ja big data-ratkaisut tarjoavat selkeitä mahdollisuuksia. Erilaisilla ratkaisuilla tavoitellaan muun muassa liikenneturvallisuuden parantumista ja liikenteen tehostumista sekä liikenteen ekologisuutta. Ratkaisut voivat liittyä muun muassa liikenteen ohjausjärjestelmiin, logistiikan optimointiin sekä erilaisiin reittipalveluihin.

Suomella on mahdollisuus profiloitua liikenteen kokeiluympäristönä (LVM: älyliikenne ja liikenteen sähköiset palvelut http://www.lvm.fi/web/hanke/liikenteen-sahkoiset-palvelut, http://www.lvm.fi/alyliikenne ). Tätä puoltaa muun muassa Suomen suhteellisen pienimuotoinen liikenne, jolloin pienempiä kokeiluja voidaan hyvin tehdä. Suomessa tehdään myös alan tutkimusta ja ylipäänsä ollaan maailmassa kärkijoukossa esimerkiksi avoimen liikennedatan käytön suhteen. Suomessa on myös tehty tutkimusta uudenlaisista liikennejärjestelmistä.

Parhaimmillaan erilaiset liikenteeseen liittyvät big data-innovaatiot(esim. liikenneanalyysi ja -ennusteet) voivat olla merkittäviä vientituotteita.Erilaista tutkimus- ja innovaatiotukea sekä muuta rahoitusta on liikenteen alalla saatavissa suhteellisen runsaasti. Näin ollen mahdollisuus merkittävään toimintaan on olemassa.

Teollinen internet

Huolto ja ennakoivat etäpalvelut ovat yksi osa-alue laajemmassa kokonaisuudessa, josta usein käytetään termiä Teollinen Internet (TI). Tällä tarkoitetaan sulautettujen ja älykkäiden laitteiden ja järjestelmien, niistä jatkuvasti kertyvän datan ja siihen pohjautuvan data-analytiikan sekä ihmisten työn tehokasta yhdistämistä liiketoimintaprosesseissa. Tämä mahdollistaa sen, että tuotanto- ja muut resurssit, tieto, esineet ja ihmiset muodostavat reaaliaikaisesti verkottuneen kokonaisuuden.

Sovellusalueita ovat mm. valmistavan teollisuuden prosessit ja niiden optimointi, ennakoiva huolto, energian käytön hallinta, käyttöomaisuuden hallinta ja ennakoiva huolto. Vähintään yhtä suuret hyödyntämismahdollisuudet ovat myös varsinaisen teollisuuden ulkopuolisessa elinkeinolämässä, kuten esim. terveydenhuollossa, kaupan ja logistiikan alueella, rakentamisessa ja kiinteistöjen hoidossa sekä kunnnallisten ja muiden julkisten palvelujen tuottamisessa (energia, vesi, jätevesi...). Yhteistä kaikille sovellusalueille on se, että tavalla tai toisella on olemassa automatisoitu linkki fyysisen maailman ja digitaalisen maailman välillä. Usein tuo linkki syntyy joukosta antureita tai tägejä, joilla voidaan saada tietoa esineiden tai ihmisten tilasta, olinpaikasta ja muista tekijöistä. Kun tätä tietoa yhdistetään ja analysoidaan yhdessä kertyneen historiatiedon sekä muiden tietovarantojen kanssa, voidaan tehostaa merkittävästi nykyisiä toimintatapoja ja -prosesseja sekä luoda myös aivan uusia palveluja ja liiketoimintaa. Alan uusissa palveluissa on myös huomattava vientipotentiaali. Toisaalta esimerkiksi etähuoltoratkaisujen avulla voidaan pitää ja saada lisää korkean jalostusarvon työpaikkoja Suomeen.

GE:n valmistamista lentokoneturbiineista kerätään päivässä huimia datamääriä. Yksi turbiinin sensori kerää päivässä noin 500 gigaa dataa. Yhdessä 
turbiinissa taas on 20 sensoria ja GE:llä on noin 12 000 turbiinia.
http://sites.tcs.com/big-data-study/ge-big-data-case-study/
http://www.lopezresearch.com/2013/06/04/the-new-industrial-revolution-according-to-ge-and-ptc/ 

Suomella olisi mahdollisuuksia muun muassa palveluliiketoiminnan synnyttämisessä teollisen internetin avustuksella ja -ympärille. Palvelu ja huolto yhdistettynä etähuoltoon, automatisointiin, ennakoivaan huoltoon. Merkittävä osa ongelmanratkaisuista ja korjauksista voidaan automatisoida. Tämä toiminta sopii eri teollisuusalueille: Metalliteollisuus, konepajat (esim. Konecranes), tietoliikenne. Kaikki vähänkin arvokkaammat laitteet tai toiminnallisuudet pystyvät itse analysointiin ja ne voidaan testata/analysoida/korjata etäältä. Usein vikaantuminen voidaan jo ennakoida. Tällä toiminnan optimoinnilla saadaan merkittäviä säästöjä ja kompetenssi siirretään halpatyösuunnasta korkeamman kompetenssin vaatimuksiin.

Eri toimialoilla samoja tai samantapaisia tarpeita. Teollisen internetin kehityksen hyödyntäminen vaatii osaamista ja kombinaatiota erilaisista asioista. Näihin lukeutuvat muun muassa kompetenssi, anturien kehitys, etäyhteyksien parantuminen sekä Big Data analytiikka. Haasteena teollisen internetin kehityksessä Suomessa on muun muassa se, että kovin laajamittaista hyödyntämistä

Suomessa on alaa silmällä pitäen hyvä koulutustaso ja kompetenssi, jokseenkin osaajapula voi ainakin big data-osaajien kohdalla uhata tulevaisuudesa. Myö toimintaa ja intressi on jo osittain olemassa. Etäinen sijainti päämarkkinoilta ja päämyyntialueilta on Suomelle luonnollisista. Tämä tarjoaa tietyssä mielessä otollisen . Sopivia teollisuusaloja, joihin big data-lähtöinen palveluliiketoiminta on sovellettavissa, ovat muun muassa metalli-, kone- sekä tietoliikenneteollisuus. Kaikilla näillä on perinteisesti ollut Suomessa tärkeä rooli viennin kannalta. Toisaalta nämä alat ovat osittain olleet kriisissä ja vaativat uudistumista. Big dataan perustuvat ratkaisut ovat avainasemassa kansainvälisessä kilpailussa mukana pysymiselle.

Cleantech

Big data liitettynä cleantech-osaamiseemme mahdollistaa uusia innovointi- ja vientimahdollisuuksia mm. jättimäisille ja kasvaville Aasian markkinoille. Suuri osa Cleantech- ratkaisuista perustuu kerääntyvän digitaalisen tiedon parempaan hyödyntämiseen ja toiminnan optimointiin tämän pohjalta. Erilaisilla big data-ratkaisuilla onkin Cleantech-kehityksen kannalta oleellinen rooli.

Cleantechin yleinen merkitys on vahvassa kasvussa resurssiniukassa maailmassa, ei välttämättä aina omana ympäristötekniikan alanaan vaan kaikkeen muuhun liiketoimintaan sulautettuna.

Myös Cleantech-kehitystä silmälläpitäen tarvitaan uusi platform-ajattelua hyödyntävä yhteistyön malli, jolla pienet yritykset voisivat suoraviivaisemmin toimia toimia isojen teollisuusyritysten innovaatiopartnereina ja sitä kauttaa tuottaa runsaasti ja tehokkaasti yksinkertaisia konsepteja/palveluita suuryritysten teknologian (alustat, laitteet) tai datan ympärille

Nopean kansainvälistymisen haasteet käännettävä vahvuuksiksi uusilla vientikelpoisilla innovaatioilla ja palveluilla. Cleantechin innovoinnista ja vahvuuksista huolimatta Suomella ei välttämättä juurikaan ole alueelta omia, kansainvälisesti tunnistettuja kotimaisia käyttöreferenssejä. Ratkaisuja täytyisi siis kokeilla rohkeasti ensin myös kotimaassa. Osittain haasteena ovat myös teollisen internetin standardien ja osin teknologioiden kypsymättömyys, vaikka tulevaisuuden potentiaalia on paljon. Cleantech kulkee siis käsi kädessä teollisen internetin kehityksen kanssa.

Cleantech on yksi työ- ja elinkeinoministeriön nimeämistä kasvun kärjistä.Valtioneuvoston periaatepäätös kasvun uusien kärkien cleantechin ja biotalouden 
vauhdittamisesta. https://www.tem.fi/files/39772/VNP_kasvun_karjet_cleantech_ja_biotalous_08052014.pdf

Markkinointi ja mainonta

Gartnerin mukaan 50% Big Dataan käytettävistä investoinneista menee markkinointiin. Markkinointi on muuttumassa teknologiavetoiseksi. Gartnerin mukaan Chief Marketing Officerit käyttävät vuonna 2017 enemmän rahaa IT:hen kuin Chief Information Officerit.

Big Datan tyypillisimmät käyttötapaukset markkinoinnin ja mainonnan alueella liittyvät kuluttajakokemuksen parantamiseen, sisällön personointiin ja viestinnän kohdentamiseen.

Big Datalla on suuri rooli muun muassa seuraavissa markkinoinnin ja mainonnan aloissa:
* Consumer Experience Management
* Real-time Bidding
* native advertising
* mobile & video advertising
* location-based advertising
* micro-targeting
* real-time personalization

Läpileikkaavia teemoja

Mydata

My Data viittaa toimintakulttuuriin, jossa organisaatio palauttaa keräämäänsä yksilökohtaista tietoa ihmiselle itselleen. Sen jälkeen ihminen voi hyödyntää sitä suoraan tai jakaa sen edelleen haluamallaan tavalla. Edelleen jaettu tieto voi olla analysoimatonta raakadataa tai se voidaan jalostaa esimerkiksi visualisoimalla muotoon, jossa muut voivat sitä hyödyntää.

My Data -näkökulmat ovat tärkeitä big dataan liittyvissä keskusteluissa, koska niiden avulla voi purkaa big dataan ja yksityisyyteen liittyviä uhkia. My Data -aloitteiden päämääränä on ollut henkilöitä koskevan tiedon ympärille syntyvien sovellusten, palveluiden ja toimintarakenteiden kehitys tavalla, jossa ihmisillä on keskeinen päätösvalta tiedon keräämisen, jalostamisen ja hyödyntämisen suhteen. My Data -aloittesiin liittyvä keskustelu yksityisyydestä korostaa ihmisten valtaa päättää siitä, kuka heidän tietojaan saa käyttää ja uusiokäyttää sen sijaan, että ihmiset antavat kerralla suostumuksen aineistojen käyttöön. Digitaalisuuteen liittyy nimenomaan mahdollisuus monistaa ja käyttää tietoa yhä uudelleen, jolloin ihminen ei suostumustaan antaessaan voi tietää tai hallita tulevaisuuden käyttötarkoituksia.

Onnistunut My Data -työskentely edellyttää, että yhteisistä henkilökohtaisiin aineistoihin liittyvistä periaatteista pystytään sopimaan. Tarvitaan viisasta sääntelyä, jonka avulla aineistojen jakaminen on mahdollista. Tarvitaan koneluettavia rajapintoja aineistojen jakamisen tueksi, standardeja ja palveluita tiedon hallittuun siirtämiseen, varastointiin, käsittelyyn ja analysointiin. Nämä pyrkimykset tukevat myös big datan hyötykäyttöä tulevaisuudessa.

Quantified self

Quantified Self –liikkeen juuret ovat Kaliforniassa ja erityisesti Wired-lehden ympärillä. Liikkeen keskeisenä ajatuksena on yksilöllisen mittaustiedon hyötykäyttö terveyden ja hyvinvoinnin edistämisessä. Viime vuosien aikana liike on levinnyt eri puolille maailmaa, ja saanut uusia muotoja. Kyse ei ole enää yksinomaan superterveydestä haaveilevien teknointoilijoiden liike vaan mittaamista istutetaan yhä uusille elämänalueille. Big data ja QS –näkökulmilla on paljon yhteistä, koska QS on yksi mahdollinen big datan tuottaja. Digitaalisten itsenmittausaineistojen arkistointiin tarvitaan uusia ratkaisuja. Tiedon hallinta on turvattu, kun yksilö omistaa tietonsa ja antaa sille käyttöoikeuden halutessaan. Kun itsenmittaajat haluavat jakaa aineistoja myös muille, tiedon käyttö on turvattava tavalla, joka hyödyttää sekä tiedon jakajaa että hyödyntäjää.

Itsenmittauksen ympärillä on paljon uusia aloitteita, joita motivoi myös terveydenhuollon toimialamuutos. Suomessa itsemittausteknologioita kehittäneitä, kansainvälisillä markkinoilla toimivia yrityksiä on useita, muun muassa Firstbeat, Suunto ja Polar. Lisäksi alalla on lukuisia lupaavia start up -yrityksiä. Mittalaitteiden avulla ihmiset saavat uudenlaista tietoa itsestään. Itsehoito on aiempaa helpompaa, kun ihmiset voivat mitata kotona verenpainettaan tai seurata unen laatuaan. Tämä voi muuttaa vähitellen terveydenhuollon painopistettä ja lääkärien työtä. Lääkärit voivat keskittyä tiukemmin nimenomaan erikoistuneeseen sairauksien hoitoon, kun sairauksien ennaltaehkäisyyn on uudenlaisia vaihtoehtoja.

Toisaalta QS haastaa myös käsityksiä terveydenhallinnasta ylittämällä olemassa olevan terveystoimialan. Itsenmittaajat ovat osoittaneet, että esimerkiksi ajankäyttödata voi olla terveysdataa. Esimerkiksi riippuvuuksia voi tarkastella ajankäytön avulla. Kiinnostavaa on myös terveydentila suhteessa ympäristöntilaan. Voiko ilmanlaatusta ennakoida tulevaisuudessa keuhkoahtaumapotilaan kohtauksen?

QS-näkökulma on alkanut levitä myös muille toimialoille, esimerkiksi oman talouden hallintaan tai koulutukseen. Mittatietoa voi käyttää esimerkiksi omaehtoisen oppimisen seurantaan tai tekemään näkyväksi opettajien pärjäämistä eri luokkien kanssa.

Tiedon etsintä

Tietomäärien valtava lisääntyminen luo päivittäisiin työtehtäviin lisähaasteita myös kaikille tietotyöntekijöille. Esimerkiksi tiedonetsintä on alue, jota paremmin tukemalla voidaan saavuttaa merkittäviä kustannussäästöjä. Erilaisille tietotulvaa helpottaville työkaluille ja mm. etsintämentelmille on monkansallisten jättien hallitsevasta asemasta huolimatta vielä kysyntää esimerkiksi tutkimuksen parissa. Tietotyö sinällään lisääntyy jatkuvasti, joten erilaisiin tarpeisiin räätälöidyllä, erilaisen tiedon etsintää helpottavia työkaluja tarvitaan monilla aloilla.Suomessa tehdään merkittävää alaan liittyvää tutkimusta.

Alalta voi oikeilla panostuksilla löytyä hyvin erilaisia hyötyjä. Tietyn alan työhön kuuluva tietotulvan hallinta ei välttämättä onnistu vielä nykyisillä työkaluilla. Uusilla tiedonhakumenetelmillä, esimerkiksi vuorovaikuttaisesti oppivan visuaalisen järjestelmän, avulla voidaan löytää relevantimpaa tietoa helpommin ja nopeammin. Näin työn laatu ja tehokkuus paranee.

SCINET tekee parempia hakuja

HIITissä on kehitetty SCINET-tiedonhakujärjestelmä, joka on testeissä todettu Google Scholaria tehokkaammaksi. SCINET hakee tällä hetkellä tieteellisiä
artikkeleita. Konseptia ollaan kuitenkin laajentamassa myös muunlaiseen  
tiedonhakuun.http://www.tiede.fi/artikkeli/uutiset/suomalaistutkijat_tekivat_uudenlaisen_hakukoneen. 
http://research.ics.aalto.fi/mi/online-papers/Ruotsalo13cikm.pdf 

Suomessa on erittäin korkealaatuista ja monitieteellistä tutkimusta alueella (HIIT:istä 7 tutkimusryhmää ja Työterveyslaitoksen Aivot työssä -tutkimusryhmä, www.reknow.fi / Tietotyön vallankumous). Panostuksia alalle olisi saatavissa: Tietotyön vallankumous on TEKESin toinen strateginen tutkimusavaus syksyllä 2013.

Paikka/lokaatiotieto

TULOSSA

Toimenpiteet

Yhteistyö eri alojen välillä

Yleisesti jaetaan näkemys tarpeesta hakea datan avulla synergioita eri aloilta. Pilvipalvelujen hyödyntäminen on tässä olennaista, sillä se mahdollistaa uudenlaisen datan yhdistelyn ja jakamisen. Löydettävä siten toimia, joilla erityisesti yritysten horisontaalista ja vertikaalista verkottumista voidaan edesauttaa siten, että (big ja avointa) dataa jaettaisiin sopivalla alustalla/rajapinnoilla yhteiseen käyttöön ja yhdisteltäväksi uudella tavalla.

Yrityksillä (erityisesti suurilla) on hyödyntämätöntä dataa, mutta ei osaamista/resursseja/ideaa käyttää tätä. Vaatii toimien suuntaaminen: 1. kannustetaan/tuetaan yrityksiä avaamaan rajapintoja dataansa 2. yhteiset kehitysalustat datan jakamiseksi, joista jalostuu uusia lisäarvopalveluja

Haasteena nähdään se, ettei yrityksillä ole välttämättä kannusteita tai liiketoiminnan intressien kannalta järkevää tapaa jakaa dataansa. Kuitenkin ”varallisuus”-ajattelun riskinä voi olla, että käyttämättömästä datasta ei saada mitään arvoa ja kilpailijat menevät ohi. Yhteistyön kehittäminen vaatii uutta ymmärrystä jakamistalouteen ja siten hyödyn- ja tulonjakomallien kehittämistä. Datan markkinapaikkoja tulee myös kehittää.

Big datan potentiaalista kertoo jo se, että perusteilla on big data labseja ja tutkimuskeskuksia ympäri Eurooppaa, kuten esimerkki Saksan Smart Data Innovation Labista kiellii. Suomen on mentävä mukaan tähän toimintaan, jotta yhteistyö, kokeilut, tutkimus, yritysten sovellusosaaminen ja siten yleinen alan kehitys vauhdittuisi. Osaavien ihmisten välisten yhteyksien rakentaminen katsotaan nyt olennaiseksi, samoin kuin hyvien käytäntöjen jakaminen eri toimijoiden välillä. Verkostotoiminnan tavoitteiden on oltava kuitenkin selkeitä: toiminnan on tuettava yritysten ja ihmisten suorituskykyä tuloksia seurattavissa olevalla tavalla.

Selvitetään tarvetta Big data-hubille, erityisesti isojen ja pk-yritysten yhteisille datahankkeille ja datan vaihdolle liiketoiminnassa

Singapore ja social analytics: social analytics-yhteistyökonsortio kehittää tämän alan työkaluja yhdessä. 
http://www.ida.gov.sg/Collaboration-and-Initiatives/Collaboration-Opportunities/Store/Social-Analytics-SA-for-Business-Enterprises-Call-for-Collaboration-CFC 

Edistetään erityisesti pk-yritysten ja start-uppien big data resursseja (välineitä ja pääsyä aineistoihin) ja osaamista. Aktivoidaan näitä yrityksiä myös mukaan kansallisiin hankkeisiin ja yritysten aloitteisiin (vrt. GE:n tarjoamat fasiliteetit)

Luodaan kansallinen data-analytiikan toimijoiden verkosto (tutkimuslaitos/yliopistoyhteistyö), jossa edistetään myös teknologiasiirtoa yrityksiin (menetelmät, työkalut, osaaminen)

Osallistutaan ja jaetaan kansallisesti näkemyksiä EU:n Big/NESSI data foorumin toimiin

EU:n big data public private forum: olemassa olevaan infrastruktuuriin perustuva ekosysteemi, jossa luodaan myös yhteistyön malleja, fasilitoidaan datan 
siirtoa (data exchange) ja tarkastellaan samalla miten liiketoiminta/(asiakas) johtaminen muuttuu. Forumilla tehdään kokeiluja big data aineistoilla, 
joiden avulla kehitetään osaamista, tutkimuksen hyödyntämistä ja työkalujen siirtoa (research transfer community) http://www.big-project.eu/ 

Verkottuneet käyttäjät (connected users) ovat nyt big data kehityksen keskiössä, sillä se tarkoittaa useilla sektoreilla tiedon hyödyntämisen nopeutumista. Esim. liikenteessä käyttäjiltä kerättyä tietoa yhdistetään liikenteen hallintaan.

Kehitetään joukkoistamiseen perustuvia big data- malleja, joista parhaillaan syntyy uudentyyppisiä laajoja ekosysteemejä.

Koulutus

Osaamisen kehittäminen on olennaisin big dataa edistävä ja samalla kehitystä rajoittava tekijä. Tarvitaan sekä teknistä että toimialaspesifistä osaamisen kehittämistä. Osaamisessa tärkeää erilaisten datamuotojen käsittely ja jalostaminen (“blended human and algoritmic data processing). Datatieteilijältä odotettavat taidot (kuvailua edellytyksissä) ovat poikkitieteellisiä, joten tiimien (osaajapoolit) rakentaminen voisi olla yhtenä ratkaisuna osaajapulaan.

Tutkintoperusteisen ja käytännönläheisen opiskelun kehittäminen esimerkiksi harjoitteluna yrityksissä, osallistumisena tutkimusohjelmiin tai vapaaehtoisina kursseina tai verkkomoduleina ovat molemmat tarpeen.

Data-analytiikkaosaamista on saatava kaikille oppitasoille peruskoulusta lähtien. Yliopistotutkinnon yleisiin/yleissivistäviin opintoihin tulisi saada datan hallinnan ja käsittelyn painotusta oppiaineesta riippumatta.

Alan koulutusorganisaatiot, yritykset ja asiantuntijat muodostavat opetushallituksen johdolla näkemyksen tarjolla olevasta koulutuksesta ja tarvittavista vähimmäistaidoista eri rooleissa, jotka tulevat mukaan tutkintoihin (ammattikorkea, yliopisto, täydennyskoulutus). Oppilaitokset ja yliopistot voivat täten myös paremmin erikoistua ja tehdä yhteistyötä esimerkiksi verkkomuotoisen opiskelun kehittämiseksi.

EU:n tavoitteena on luoda Euroopassa yliopistojen verkosto datataitojen osalta.

Vaikutetaan siihen, että peruskoulun opetussuunnitelmiin sisältyy dataan käyttöön liittyvää opetusta vuonna 2016 ja tuetaan open source teknologioiden leviämistä.

Opettajankoulutuksen kehittäminen (big data opetustaidot):

Kartoitetaan opetushallinnon johdolla tarvittavia osaamisprofiileja ja olemassa olevaa koulutustarjontaa.

'Koordinoidaan kansallisesti käynnisteillä ja sunnitteilla olevia big data koulutusohjelmia.

Osallistutaan EU-laajuisen big dataan erikoistuvien yliopistojen verkoston luomiseen

Soveltava koulutus yrityksissä

Soveltavan ja täydennyskoulutuksen malleja on kehitettävä big data asiantuntijaksi kasvamiseksi. Yrityksissä osaamista kehittäisivät erilaiset harjoittelujaksot ja projektit yms. alan opiskelijoille, tutkijoille ja työmarkkinoilla vapaana oleville osaajille.

Ohjelmointi/tietojenkäsittely/bisnesprosessien opiskelijoita kannustetaan yrityksiin big data harjoitteluun, projekteihin ja opinnäytetöihin (hyvänä esimerkkinä Aallossa diplomityöparit)

Toteutetaan reaaliaikaista tarvekartoitusta siitä, kuinka paljon ja millaista osaamista yritykset tarvitsevat (big data yritysklusteri/foorumi)'''

Täydennys- ja muuntokoulutusta uudistetaan vastaamaan big data osaamistarpeita

'Tuetaan yritysten big data osaamista kehittävien sisäisten hautomojen toimintaa, osaamisvaihtoa ja työnkiertoa'

Tutkimus

Kokeilut ja rahoitus

Kokeilevaa toimintaa big datan hyödyntämiseksi ja analyysimenetelmien soveltamiseksi käytännön tilanteisiin ja yhteiskunnallisiin haasteisiin sekä uuteen liiketoimintaan tulee tukea ja edistää. Big datan kokeilut tulisi saada siten vahvemmin mukaan erilaisten ohjelmien ja kehityshankkeiden osaksi.

Esimerkiksi Tekes on käynnistänyt ohjelmavalmistelun Teollisen Internetin alueelle. Saman valmistelun yhteydessä tarkastellaan tarpeet myös 5G-mobiiliverkkojen alueella, joka on yksi tekijä teollisen internetin toteuttamisessa. Valmistelun tuloksena voi olla yksi tai useampi ohjelma tai jokin muu kokonaisuus. Big data ja data-analytiikka ovat myös keskeisessä roolissa teollisen internetin sovelluksissa. Valmistelun tuloksena mahdollisesti käynnistyvä(t) ohjelma(t) tai muut toimenpiteet voisivat käynnistyä syksyllä 2014 (Q4/2014). Valmistelun verkkosivut http://www.tekes.fi/teollinen-internet-ja-5G.

Erityisesti menetelmiä ja teknologiaa kehittävät yritykset voivat tarvita pääomaehtoista rahoitusta kehitystoimintaansa. Pääomaehtoista rahoitusta ja big datan liiketoimintamahdollisuuksien arviointiosaamista tulee siten kehittää. Yhdysvalloissa big data houkuttaa merkittäviä riskisijoituksia. Suomalaisen menetelmä- ja teknologiaosaamisen kehittäminen ja kaupallistaminen tulee löytää niin yksityistä kuin julkista rahoitusta sekä näiden yhdistelmiä esimerkkinä Tekes Pääomasijoitus Oy.

Kansallista tukea ja verkostoa EU-tukiohjelmien hyödyntämiseen vahvistetaan erityisesti big data painotuksella (Horizon verkosto, Tekes, kehittäjäorganisaatiot)

Tuetaan erilaisia big data kokeiluja ja jaetaan näistä saatuja kokemuksia. Erityisen tarpeelliseksi katsotaan datan saatavuus hallituissa kokeiluissa, joihin liittyy esimerkiksi mobiilipaikantaminen'

Disruptio datan vaikutuksesta tulevat voimakkaasti myös liiketoimintamalleihin: kokeilevat kehityshankkeet hyödyn ja tulonjaonmallien kehittämiseksi (vrt. myös yritysten yhteistyön aktivointitoimet)

Pääomaehtoisen rahoituksen (yksityiset ja julkiset pääomasijoittajat) saatavuutta tulee edistää

Mydata

MyData selvityksen malleja testataan valituilla alueilla kehityksen vauhdittamiseksi ja uusien tietomallien yleistymiseksi eri alojen yritysten avulla. Pitkällä aikavälillä luodaan alustaa MyDatalle, johon yksilö voi omaa tietoaan kerätä ja haluamallaan tavalla jakaa sekä hyödyntää.

Yhteistyö Iso-Britannian MiData-labn kanssa Midata-kehityksen vahvistamiseksi

Datan saatavuus

Avoimet rajapinnat ja data ovat myös big datan hyödyntämisen mahdollistajia, joten kehitystyötä tulisi edelleen vahvistaa sekä luoda tapoja yhdistää julkista avointa dataa ja yritysten dataa

Datan hyödyntämiseen ratkaisuja etsiviä ja kehittäviä henkilöitä rekrytoidaan hallintoon, esimerkiksi kumppanikoodarimallin mukaisesti, College-to-govt harjoitteluohjelmat tms.

Yhteentoimivuuden kehittäminen datan jakamisen standardeilla ja yhteishankkeilla erityisesti kunta- ja kaupunkiympäristössä (mm Kuusaika- hankkeen puitteisa)

Määritellään kansallisen dataportaalin hyödyntäminen myös big data kanavana Avoimen tiedon ohjelman osana (VM)

Velvoitetaan virastoja tunnistamaan data-aineistoja, joista big data kehityksen kannalta saataisiin merkitäviä hyötyjä. Tuetaan tässä virastojen pilottiprojekteja (Avoimen tiedon ohjelma/kehykset).

Sääntely

Suurena haasteena on se, miten tasapainottaa big datan hyödyntämiseen ja tietosuojaan liittyvät toimet sääntelyssä. Henkilöiden yksityisyyden suoja ei saa tässä vaarantua.

Sääntelyn kehittämisen ajatuksena tulee kuitenkin olla se, että markkinoille tulon esteitä voidaan purkaa ja samalla luodaan kannusteita datan saatavuuteen huomioiden henkilöiden oikeudet dataan. Yleisesti säädösvalmistelussa tulisi huomioida dataan liittyvät edellytykset, joten voidaan myös kysyä onko big datassa erityispiirteitä tai tarpeita huomoitavaksi sääntelyssä.

Sääntelyä tukisi yhteiset käytännöt ja periaatteet, ns. Big data ”etiketti” siitä, miten dataa hyödynnetään kunnioittaen niin kansalaisten kuin yritystenkin oikeuksia. Hyviä datan hallinnon ja käsittelyn tapoja tulee luoda yhteistyössä. Tämä voisi toimia myös Suomen vahvuutena kansainvälisessä kilpailussa datavarannoista.

Tehdään selvitys big datan käyttöön vaikuttavista laeista

Varmistetaan, että EU:n tietosuoja-asetus ja sen soveltaminen Suomessa mahdollistaa big data kehityksen yksityisyydensuojaa vaarantamatta

Kehitetään suomalainen Big data "etiketti" ohjesääntö

Datatietoisuus

Big datan hyödyntäminen kaikilla sektoreilla on olennaista, joten tietoisuutta aiheesta on lisättävä kohti datan tunnistamista, kokeiluja ja kehitystoimintaa. Sanotaan, että big datan teknologiakehitys on evoluutiota, mutta samalla liiketoimintaprosessien kehitys käy läpi nyt revoluutiota. Erityisesti yrityksissä tarvitaan siten toimenpiteitä ymmärryksen lisäämiseksi liiketoiminnan muutoksesta dataintensiivisessä kilpailussa.

Suomen jokaisen organisaation päätöksenteon tulisi muuttua tietoon perustuvaksi (data driven) sen sijaan että päätökset tehtäisiin mutu-pohjaisesti. Maailmalla on tietopohjaisesta päätöksenteosta esimerkkinä mm. amerikkalainen autonvalmistaja Ford, joka selvisi autoteollisuuden kriisistä siirtymällä data-driven päätöksentekoon. Tällainen tietoon perustuva päätöksenteko vaatii tuekseen toimivan tiedonkeruun ja analysoinnin. Sama tiedonkeruu ja -analysointi palvelee myös open data -aloitteita.

”Datalähettiläitä” hankitaan tuomaan big data- tietoutta ja osaamista yritysten ja hallinnon käyttöön toteutettuna mm. kansainvälisinä vierailijaluentoina ja osaajavaihtona

Luodaan alan yrityksiä, tutkijoita ja asiantuntijoita kokoava avoin Big data-klusteri sekä osaamisen kehittämistä tukevaa verkostotoimintaa tämän ympärille (Tekes, Teknologiateollisuus, Tekniikan Akateemiset, Ohjelmistoyrittäjät, TTL, yritykset jne).

Julkisen hallinnon organisaatioihin nimetään datavastaavia, joiden tehtäviin kuuluu datan keruun ja analysoinnin järjestäminen. Yksityisiä yrityksiä ja muita yhteisöjä varten voidaan järjestää neuvontaa.

Teknologiat ja standardit

Big datan teknologisia kehitystarpeita on tunnistettu olevan mm. datan varastoinnin tekniset standardit, datan välittämisen ja integroinnin tavat. Teknologiakohtaisia ekosysteemejä on syntymässä, joten näiden ymmärtäminen ja sovittaminen omaan kehitysympäristöön on olennaista. Datan käsittelyn ja hallinnoinnin harmonisointi edistäisi datan yhteen toimivuutta ja siten käyttöä. On huomattava, että dataan liittyviä standardeja (esim INSPIRE, PSI) on jo olemassa, joten näitä voidaan hyödyntää ja soveltaa myös big dataan.

Tunnistetaan keskeiset standardointiprosessit joissa tulee olla mukana sekä organisoidutaan toimimaan näissä

Standardien luominen erityisesti datan varastointiin (storage) ja siirtoon (exchange) kehittää datan käsittelyn tekniikoita, työskentelymetodeja ja tehokkaita algoritmeja.

Tietosuoja ja yksityisyys on myös teknologinen kehityskysymys. Panostetaan tieto/yksityisyydensuojan ratkaisujen teknologiakehitykseen (esim. Tekes)

Infrastruktuuri

Big datan hyödyntäminen vaatii korkealuokkaista tieto- ja viestintäinfrastruktuuria. Varmistetaan, että perusedellytykset, kuten viestintä- ja tiedonsiirtoyhteydet, pilvikapasiteetti yms. ovat kansainvälistä huipputasoa ja ennakoidaan tarpeita infrastuktuurin osalta niin yksittäisen toimijan kuin yhteishankkeiden/toiminnan kannalta.

Keskeisten kansallisten toimijoiden tunnistaminen ja organisointimallin luominen on tarpeen myös infrastruktuurin kehittämistä ohjaamaan. Infrastruktuurikoordinaation tehtävä on hakea tehokuutta ja yhteentoimivuutta.

Kansainvälisesti hyvänä esimerkkinä voidaan verrata Open Cloud Massachusettsin toimintatapaa ja datapalvelujen ”biotope”-ajattelua sekä UK:n ODI toimintaa muun muassa datasovellusten edistäjänä ja datan saatavuuden kehittäjänä.

Jaettujen infrastruktuurien kehittämistä tehdään tarpeiden mukaan ja ne voivat tarkoittaa esimerkiksi: - Tiedonkäsittely- ja laskentainfrastruktuurien kehittämistä - Yhteisiä datan hallintasysteemejä ylläpitoon ja laadunvarmistukseen - T&k-yhteistyön ja arvioinnin kehittämistä erilaisista analyysimenetelmistä - Datapalvelujen ekosysteemin luontia, kuten datan jakelupisteet, kauppapaikat ja julkaisukirjastot sekä datasovellusten edistäjärooli - Kokeilulaboratorio, jossa voidaan testata teknologioita ilman omaa mittavaa panostusta

Kehitetään kansallista big data infrastuktuuria verkostomaisella yhteistyöllä

Toimijat ja hankkeet

Tähän osioon kerätään suomalaiset ja yhteistyön kannalta kansainväliset toimijat tai hankkeet big datan kehitystyössä. Erityisesti tarkasteltava niitä toimijoita, jotka ovat kriittisiä strategian toteuttamisen kannalta. Toimijoista luodaan näkemystä verkostosta, joka voi toteuttaa strategiassa esitettyjä toimia ja luoda esimerkkejä tunnistetuilla sovellusalueilla eli toimia siten suomalaisina edelläkävijöinä.

Vaikuttavuus

Tässä osiossa on tarkoitus luoda arvio strategiassa esitettyjen toimenpiteiden vaikuttavuudesta ja potentiaalista kansantaloudessamme.

Taustaksi tuodaan tähän arvioita big datan potentiaalista kansainvälisiä ja kotimaisia tutkimuksia tai selvityksiä vertaillen (OECD, WEF, EU). Suomen osuutta voidaan arvioida esimerkiksi bkt suhteella.

Big Datan tuottavuusparannuksista julkishallintoon on haastavaa esittää tarkkoja arvioita ilman täsmällisempää analyysiä, mutta McKinsey arvioi vuoden 2011 raportissaan Euroopan julkishallintojen kykenevän Big Dataa hyödyntämällä vähentämään hallinnollisia kulujaan n. 15-20 prosenttia ja lisäämään 0,5 prosentin vuotuisen parannuksen tuottavuuteen. (McKinsey Global Institute, 2011, Big data: The next frontier for innovation, competition, and productivity)

Strategian toimien vaikuttavuutta arviointia ajassa. Esimerkiksi kuva siitä, miten välittömästi toimet vaikuttavat: kokeilut vaikuttavat lyhyellä aikavälillä, koulutus pitkällä jne. Varmistettaa siten, että saavutetaan vaikuttavuutta sekä lyhyellä että pidemmällä aikavälillä.

kuva: Toimien vaikuttavuus ajassa ja tarvittavat resurssit

Strategiassa valitaan vaihtoehtoisia/toisiaan täydentäviä tarkastelukulmia vaikuttavuuteen toimenpiteiden tarkentuessa:

1. Esitetään arvioinnin pohjalta, miten ja kuinka merkittävästi edellä mainittujen toimien toteuttaminen vaikuttaisi yhteiskuntaan tai talouteen. Linkitetään ”grand challengeihin” mm. kestävyysvaje (esimerkkien kautta esim. julkinen hallinto)

2. Määritetään arvio tarvittavista investoinneista strategian toteutukseen ja investoitavien pääomien tuottoa (”ROI”)

3. Datan arvoketju ja arvonluonti A) Datan arvoketju: 1. data hankinta (acquisition) 2. analyysi 3. tuki ja joukkoistaminen (curation) 4. varastointi 5. käyttö B) Arvonluonti: miten datasta saadaan arvoa (data extraction)

4. Kansantalouden tasolla tarvitaan esimerkkejä demonstroimaan big datan käytön vaikutuksia kasvuun ja työllisyyteen. Vaatii myös datan relevanttiuden arviointia: 1. datan määrällinen kysyntä (edustaa myös poikkisektorien mahdollisuuksia, kuten geodata) 2. kyseisen sektorin merkitys (osuus kansantaloudesta; esim teollisuus, palvelut, julkinen sektori, maatalous, kolmas sektori)

5. Arvio Suomen big data PPP ekosysteemin edellytyksistä ja potentiaalista. Ensin on ymmärrettävä ketä tässä toimii ja mitä toimintaa on, joten olisi kartoitettava keskeiset toimijat ja hankkeet

6. Potentiaali, että kehitystoimet toteutetaan versus vaihtoehto ettei asiaa edistetä mitenkään

Strategian toimeenpanoon luodaan suunnitelma.

Luodaan yhteistyössä roadmap toimien vastuista, etenemisjärjestyksestä, aikatauluista, vaikuttavuudesta ja mahdollisista riskeistä. Vahvistetaan strategian toimeenpano valtioneuvoston periaatepäätöksellä ja/tai hallitusohjelmassa. Toimet, jotka voidaan käynnistää heti resursoidaan ja organisoidaan välittömästi.

Viitteet