Big data 3: Edellytykset

Kohteesta Opasnet Suomi
Loikkaa: valikkoon, hakuun

Edellytykset:

Tähän kohtaan kuvataan niitä vaikuttavia tekijöitä, asioita ja ehtoja, joita tarvitaan siihen, että big datan käyttö voisi edistyä Suomessa. Edellytysten taso kuvastaa siten vahvuuksiamme että heikkouksiamme big datan alueella. Edellytykset kohdistuvat kaikkiin yhteiskunnan osiin; yrityksiin, hallintoon ja yksittäisiin datan hyödyntäjiin. Edellytyksistä ja potentiaalisten sovellusalueiden kuvauksista johdetaan tarvittavat toimenpiteet myöhemmässä strategian osassa.

Datatietoisuus

Datatietoisuudessa on kyse pitkälti datan potentiaalisen arvon ymmärtämisestä. Erilaisten organisaatioiden tuottama ja tallentama data tulee käsiteö tuHyöty ei aina näy heti ja ole saatavissa suoraviivaisesti, mutta tulevaisuudessa ja esimerkiksi muiden, esimerkiksi reaaliaikaisten datalähteiden kanssa yhdistelemällä saatetaan saavuttaa huomattavia etuja. Kyse on siis datan itsensä arvon ymmärtämisestä. Erilaisesta datasta saadaan oleellista informaatiota ulos, usein kyse on siitä, että osataan vain kysyä oikeita kysymyksiä ja hakea oikeita asioita.

Nykyaikaisen analytiikan ja big datan omaksuminen osaksi jokapäiväistä työtä on keskeinen askel kohti tiedolla johtamisen yrityskulttuuria. Uuden teknologian ja prosessointikapasiteetin kustannusrakenteiden jatkuva kehitys vaatii omien kyvykkyyksien säännöllistä uudelleentarkastelua. Se mikä datan tarkastelussa vuosi sitten oli mahdotonta tai kannattamatonta, voi tänään olla varsin perusteltua ja liiketoiminnallisesti kannattavaksi todistettavaa. Samalla budjetilla voidaan ensi vuonna jälleen tarkastella laajempaa datamassaa, etsien tarkempia signaaleja, uusia toimintamahdollisuuksia ja aiemmin tunnistamattomia optimointikohteita. Tämä sykli toistuu yhä uudelleen ja organisaatioiden onkin opittava kyseenalaistamaan vanhat datan tarkastelun rajat ja kiinnittämään tarkemmin huomiota uusien lähteiden syntyyn. On tultava datatietoiseksi. Maailmalla on tietopohjaisesta päätöksenteosta esimerkkinä mm. amerikkalainen autonvalmistaja Ford, joka selvisi autoteollisuuden kriisistä siirtymällä data-driven päätöksentekoon.

Perinteisesti organisaatiot ovat tottuneet tarkastelemaan oman liiketoimintansa tuottamaa dataa. Ja siitäkin erityisesti esivalittua osajoukkoa, liiketoiminnan ydintietoa. Tämä tieto on kerättynä erilaisissa perusjärjestelmissä (ERP, CRM, CMS) ja sekä datan tuntemus että sen analysointiin käytettyjen välineiden osaaminen on vahvaa. Big datan huomiointi tässä kontekstissa tarkoittaa datan keräämisen laajuuden tarkastelua. Jos perusjärjestelmien lokitasot, tapahtumien kirjaaminen tai tapahtumien sisällön laajuus on aiemmin rajoitettu tallennus- ja prosessointikapasiteetin kustannusten perusteella, voidaan näitä arvioida uudelleen nykyisen kustannusrakenteen ja kapasiteetin myötä. Ydinliiketoimintaa on myös syytä tarkastella säännöllisesti uudelleen tiedonkeräämisen potentiaalin näkökulmasta. Onko aiempi analytiikka tai toiminnan tarkastelu nostanut esiin asioita, joissa datan kerääminen ei ole riittävällä tasolla? Voitaisiinko tuota tunnistettua, kiinnostavaa dataa kerätä tuomalla järjestelmiin uusia ominaisuuksia tai toimintaympäristöön esimerkiksi erilaisia sensoreita? Näihin mahdollisuuksiin tarttuminen kartuttaa oman liiketoiminnan tuottamaa datavarantoa entisestään ja saattaa nostaa big datan teknologioiden omaksumisen varsin ajankohtaiseksi.

Datatietoinen organisaatio ei kuitenkaan rajoita tiedonjanoaan ainoastaan omien järjestelmien keräämään dataan, vaan katsoo ympäröivää ekosysteemiä laajemmin. Datan mahdollisuuksia on syytä arvioida kumppaniverkoston kanssa, tunnistaen synergioita, datan vaihdon mahdollisuuksia tai jopa uuden liiketoiminnan perustamisen potentiaalia datavarantojen yhdistämisen myötä.

Data rinnastetaan useissa puheissa nykyisin luonnonvaroihin, joten sille syntyy luonnollisesti myös arvo kauppatavarana. Tämän ilmiön myötä datan kerääminen ja koostaminen on synnyttänyt ja synnyttää edelleen uusia toimijoita markkinoille. Näiden datakauppiaiden toiminta puolestaan esiintyy joko yksittäisinä palveluina tai koostettuna datan markkinapaikoille. Kysyntä ja tarjonta määrittävät ennen pitkää erilaisen datan arvon, aivan kuten muillakin luonnonvaroilla. Nykyaikainen, datatietoinen organisaatio huomioi myös nämä kaupalliset datavarannot arvioidessaan liiketoimintansa datavetoista kehitystä.

Kolmas näkökulma saatavilla olevaan dataan on avoin data. Sekä EU-tason että kansallinen lainsäädäntö ohjaa erityisesti julkishallinnon dataa voimakkaasti kohti avoimuutta. Tulevaisuudessa kansallisin varoin kerättyä, varsin arvokasta dataa on paljon saatavilla ja hyödynnettävissä edelleen liiketoiminnan kehityksessä. Avoimen datan kulttuurin kehitys vetää mukanaan myös yksityisiä ja kaupallisia toimijoita, joiden intresseissä on avata dataansa julkisuus- ja goodwill-tarkoituksissa sekä vauhdittaakseen oman erityisosaamisalueensa kehitystä. Organisaatioiden onkin syytä ottaa mukaan kokonaisvaltaiseen data-strategiaansa myös avoin data ja sen erilaiset mahdollisuudet. Hyötyjä on tunnistettavissa sekä avoimen datan kuluttajana että tuottajana.

Kansallisessa big data -strategiassa avoimen datan kehitys on yksi keskeisistä teemoista. Nykyaikainen suhtautuminen datan avaamiseen, lainsäädännön kehitykseen reagointinopeus ja tiedon jakamisen kulttuurin kehitys luovat myös kansallista pääomaa ja auttavat Suomea toimimaan esimerkkimaana. Kokemukset avoimen datan päätöksistä, käytännön toteutuksista ja vaikutuksista liiketoimintakenttään ovat lähitulevaisuudessa haluttua pääomaa. Parhaiden käytäntöjen tuotteistaminen voi luoda myös hyvää tukea suomalaisen osaamisen vientiin ja vauhdittaa osaltaan talouskasvua. Tietoon perustuva päätöksenteko vaatii tuekseen toimivan tiedonkeruun ja analysoinnin. Sama tiedonkeruu ja -analysointi palvelee myös open data -aloitteita.

Samalla täytyy huomioida myös big datan käyttöön liittyvät mahdolliset riskit, esimerkiksi yksityisyydensuojaan liittyen. Kehityksessä ja erilaisissa toimenpiteissä täytyy pohtia myös mahdollisesti seuraavia ongelmia.

Kokeilut/t&k rahoituksen suuntaaminen

Erilaisten big data-ratkaisujen kehittämisessä oleellisessa osassa ovat kokeilut. Toimivat ratkaisut löytyvät usein varsin pienimuotoistenkin kokeilujen jälkeen. Yritysten ja julkisen hallinnon omilla toimilla voidaan mahdollistaa ketterämpi, kokeileva kulttuuri. Hallinto voi mahdollistaa tätä yhteistyössä yritysten kanssa, esimerkiksi tarjoamalla erilaisia resursseja. (mm.FORGE Service Lab) Kyse on myös siitä, että organisaatioiden ilmapiiriä muutetaan start-up-henkisempään suuntaan. Suuri osa kokeiluista myös epäonnistuu eikä niistä välttämättä synny uutta liiketoimintaa. Tämä tulisi kuitenkin usein käsittää tärkeänä osana oppimisprosessia. Samalla internettalouden aikana yhdestä onnistuneesta kokeilusta voi seurata jopa globaali hitti.

Big data-kokeiluille tulisi saada riittäviä resursseja ja rahoitusta. Erilaiset mallit, sovellukset. yms. ovat useimmiten äärimmäisen nopeasti skaalattavissa ylöspäin. Niinpä yksittäisestä toimivasta kokeilusta syntyvä palvelu/teknologia/tuote voi olla nopeastikin täysosuma. T&K-rahaa tulisi kohdentaa big dataan liittyville kokeiluille ja tutkimukselle. Lisäksi muun muassa EU:n Horisontti 2020-ohjelman mahdollisuudet tulee käyttää täysimääräisesti hyväksi.

Haastetta ketterien kokeilujen toteuttamiselle asettaa se, että suurten tietovarantojen haltijat ja niitä kerryttävät tahot ovat usein suuria eivätkä aina niin ketteriä organisaatioita. Toisaalta data-analytiikan alueelle on syntynyt ja syntymässä uusia pieniä yrityksiä, jotka voisivat tarjota tehokkaampia menetelmiä big datan hyödyntämiseen ja uuden liiketoiminnan synnyttämiseen. Myös T&K&I -rahoitusta suuntaamalla olisi mahdollista saattaa erilaisia big-data -toimijoita yhteisiin projekteihin ja hakemaan yhdessä ratkaisuja todellisiin asiakastarpeisiin. Eri kokoisten yritysten yhteistyölle ja yhteisille projekteille tulisi olla saatavilla t&k- tukea.

Yhteistyö voi olla myös kansainvälistä. Suomalaisten yritysten, esimerkiksi pk-sektorilta, sekä kansainvälisten veturiyritysten yhteistyötä tulisi aktiivisesti edistää. Esimerkiksi Saksa on avainasemassa teollisen internetin tulevissa ratkaisuissa. Suomalaisilla yrityksillä ja niiden osaamisella on paljon erilaisia mahdollisuuksia näiden globaalisti johtavien yritysten big data-kehityksessä.

Ylipäänsä big dataan liittyviä ja kohdentuvia tutkimusinvestointeja täytyy tehdä, mikäli Suomi pyrkii pysymäään kehityksessä mukana. Big data-kehitykselle ollaan muissa maissa osoitettu huomattavia investointeja valtion taholta.

Suomessa julkisten toimijoiden tulee osittain paikata yksityisten pääomasijoitusten puutetta. Esimerkiksi Tekesin eri ohjelmien kautta saatavaa rahoitusta tulee kohdistaa big data-kehitykseen. Oleellista on saada myös yritykset mahdollisuuksiensa mukaan lisäämään riskirahoitustaan big dataan liittyvien.

Yritysten yhteistyö ja datan vaihto

Dataintensiivisen liiketoiminta kasvaa jatkuvasti. Data on yhä arvokkaampaa: toisaalta kaikki data ei ole kaikille yhtä arvokasta. Toiselle organisaatiolle jonkin muun tahon tuottama ja tallentama, mutta ei käyttämä, data voisi olla kullanarvoista. Toimivan datanvaihdon ja datamarkkinoiden luonti on tärkeää, jotta datamoodiin siirtyvät organisaatiot saavat potentiaaliset hyödyt irti big data-vallankumoksesta.

Eri yritysten ja organisaatioiden keräämän ja tarjoaman datan hankkimisen ja käyttämisen täytyy olla mahdollista. Tavoitteena on saada datan vaihdosta ja yhteisestä (avoimesta) käytöstä yleistä toimintaa. Datan hankkimisesta on usein sen kerääjälle kustanuksia ja datan jakamiseen omasta organisaatiosta täytyy löytyä kannusteita. Laajempien datamarkkinoiden syntyminen vauhdittaisi huomattavasti uutta big dataan keskittyvää liiketoimintaa.

Tähän liittyy vielä kosolti haasteita. Yritysten (ja hallinnon) välinen yhteistyö on tärkeässä roolissa. Esimerkiksi pienempien innovatiivisten yritysten ja paljon dataa keräävien suurten yritysten yhteistyö on suhteellisen harvinaista. Käytännössä suurempi yritys voi muun muassa avata dataansa ja platformin kehitykselle (ks. esim. Smart Data Innovation Lab Saksassa). Toisaalta tälle pitää löytyä riittävät kannusteet myös suuremman yrityksen puolelta. Yksi mahdollisuus on selvittää, onko syntynymässä standardeja siihen, että yritykset voivat avata "sandboxeja" muiden käyttöön ja analyysiä varten.

Big datan prosessointi on erityisen haasteellista. Dataa saattaa olla niin paljon ja sitä voi syntyä niin suurella nopeudella, että sitä ei voi siirtää fyysisesti toisen organisaation käsiteltäväksi. Tällaisissa tilanteissa tiedon analysointia varten täytyy siirtää prosessoivaa koodia toisen organisaation sisälle. Tämä on ongelma, joka vaatii sekä teknistä että tietoturvallista ratkaisua. Samalla täytyy varmistua siitä, kuinka toinen osapuoli voi luottaa ulkopuoliseen ohjelmakoodiin. Yksi ratkaisu tähän voisi olla yhteiskunnan luoma luotettu dataoperaattori, joka huolehtii datan analysointikoodista ja resurssoinnista yhteistyössä osapuolten kanssa.

Suomen laaja start-up-kenttä (esim. AaltoES) tulee kytkeä tiiviisti mukaan big data-ratkaisujen ja palvelujen kehitykseen. Yritysten ja ketterien start-uppien kokeilevaa yhteistyötä tulee lisätä.

Saksassa yhteistyötä tehdään muun muassa suuret ja pienet yritykset sekä tutkimuspuolen yhteen tuovan Smart Data Innovation Labin kautta 
http://www.kit.edu/kit/english/pi_2014_14408.php
http://www.sdil.de/de/

Koulutus

Big datan hyödyntämisen kannalta koulutus on avainasemassa. Tällä hetkellä muun muassa erilaisten analyysimenetelmien osaajista on pulaa. Samoin tarvitaan yritysjohtajia, jotka ymmärtävät data-analyysin mahdollisuudet päätöksenteon tukena ja yritysten kilpailukyvyn turvaajina. Tulevaisuudessa osaajilta vaaditaan yhä enemmän, jolloin koulutuspuutteet voivat muodostua merkittäväksi esteeksi big datan laajemmassa hyödyntämisessä.

Koulutuspuutteisiin tulee vastata jokaisella koulutustasolla peruskoulusta lähtien sekä myös yritysten taholla esimerkiksi täydennyskoulutuksien muodossa. Perustana olevia matemaattisia, tilastotieteellisiä sekä ohjelmointitaitoja tulisi painottaa opetussuunnitelmissa jo hyvin varhain, jotta tulevat osaamistarpeet tulisivat paremmin katettua pitkällä tähtäimellä. Tiettyjen tärkeiden tietotyökalujen opetusta tulee esimerkiksi keskiasteella lisätä. Lisäksi datalähtöisempi ja empiirisen kokeilevaa lähestymistapaa tulee korostaa.

Tämä ei kuitenkaan vastaa välittömiin tarpeisiin. Suomessa on käynnistymässä sekä ammattikorkeakouluissa että yliopistoissa useita big dataan ja data-analytiikkaan liittyviä koulutusohjelmia. Yliopistotasolla esimerkiksi Aalto-yliopiston kaikkien kuuden koulun maisteriopiskeljoiden on syksystä 2014 lähtien mahdollista suorittaa sivuaineen laajuinen "Analytics and Data Science" -kokonaisuus. Tämä kokonaisuus täydentää mm. jo olemassaolevia Koneoppimisen ja tiedonlouhinnan sekä Tieto- ja palvelujohtamisen maisteriohjelmia, jotka tarjoavat valmiuksia data-analyysiin.

Big Data-koulutusohjelmia Suomessa:

* Jyväskylän yliopisto:  Data-analyysin monitieteellinen maisterikoulutus (DATA)
https://www.jyu.fi/it/laitokset/mit/opiskelu/maisteriopinnot

* Tampereen teknillinen yliopisto: Big Data ja data-analytiikka liiketoiminnan 
kehittämisessä- täydennyskoulutus.
http://www.tut.fi/fi/yrityksille/taydennyskoulutus/koulutustarjonta/big-data/index.htm

* Aalto yliopisto: Master's Degree Programme in Information and Service Management
http://www.aalto.fi/fi/studies/education/programme/information_service_management_master/

* Itä-Suomen yliopisto: Datatieteen koulutusohjelma
https://www.uef.fi/fi/cs/datatiede


Kaikkien suomalaisten korkeakoulujen, jotka eivät vielä ole havahtuneet big datan vaikutuksiin, tulisi huomioida kehitys ja pikaisesti saada datalähtöisyys ja data-analyysi näkymään eri alojen koulutuksessa. Näissä koulutusohjelmissa voitaisiin tehdä yritysten kanssa tiivistä yhteistyötä, jotta tulevat varsin akuutit tarpeet saadaan edes osittain katettua myös suoraan käytännön taidoilla varustetuilla valmistuneilla. Erilaisilla harjoittelu- ja tutustumismahdollisuuksilla on oma tärkeä osansa. Data-analytiikkaan koulutettaville tulisi tarjota mahdollisuuksia opiskelun aikana erilaisiin harjoitteluihin. Näitä voisi yritysten lisäksi tarjota myös julkishallinnossa, mikä osaltaan auttaisi siirtymistä datalähtöisempään toimintatapaan.

Koulutustarpeita Big data-alalla E-Skills UK:n selvityksen mukaan:
http://www.e-skills.com/research/research-publications/big-data-analytics/

Lisäksi alueella tulisi lisätä monialaista koulutusta. Datalta täytyy osata kysyä oikeita kysymyksiä, joten erilaisten taitojen ja erilaisen osaamisen yhdistäminen on välttämätöntä. Niinpä data-analytiikkaa ja datan "ymmärtämistä" tulisi näkyä melkein alan kuin alan koulutuksessa, aina kauppatieteellisestä yhteiskunta- ja sosiaalitieteisiin. Pelkkä tekninen osaaminen ei riitä, vaan tarvitaan ymmärrystä substanssialoista sekä kykyä yhdistellä asioita ja aloja luovasti. Monella alalla käytettävissä olevan tiedon hyödyntäminen toisi huomattavaa lisäarvoa. On tärkeää kouluttaa osaajia myös yksityisyyden ja tietosuojan alueilla, sillä EU:ssa valmisteilla oleva lainsäädäntö saattaa tuoda yrityksille merkittäviä sanktioita (mahdollisesti 5% liikevaihdosta) henkilötietojen virheellisestä käytöstä. Nykyinen lainsäädäntö antaa yrityksille mahdollisuuden käyttää dataa vain siihen tarkoitukseen kun se on alunperin kerätty, mikä luonnollisesti rajoittaa datan käyttöä huomattavasti.

Erilaisen big dataan liittyvän osaamisen tarve on suuri. Uusia työnkuvia muodostuu jatkuvasti. Kaikkea big datan hyödyntämiseen liittyvää ei voida kouluttaa samalle henkilölle. Erilaisia vahvuuksia sisällään pitävät monialaiset tiimit tulevat työskentelemään big datan parissa. Niinpä jo koulutuksessa erilaista tiimityöskentelyä täytyy tukea ja erilaisen koulutustaustan omaavia saattaa yhteisten ongelmien eteen.

Opettajien osaamisen rajoitteet voivat muodostaa big data-osaamisen kehitykselle haasteen, kaikilla koulutustasoilla. Yhtenä ratkaisuna voivat olla erilaiset verkko-oppimistyökalut sekä MOOCit (massive open online course). Näiden hyöydyntäminen vaatinee esimerkiksi yliopistoilta halua yhteistyöhön.

Koulutuspuolen ja sekä yritysten ja hallinnon yhteistyötä tarvitaan lisää. Esimerkiksi erilaisia harjoittelumahdollisuuksia sekä opinnäytepaikkoja pitää saada lisättyä. Nämä koskevat niin suoran käytännön (esim. AMK-koodarit) sekä vaikkapa laajemmin data-analytiikkaan ja data managementiin keskittyviä opiskelijoita.

Soveltava osaaminen yrityksissä

Yrityksiltä vaaditaan big datan kanssa nyt tai tulevaisuudessa työskentelevän henkilöstön täydennyskoulutusta. Ongelmana on jälleen osaavien kouluttajien pieni määrä. Myös yritysten osalta erilaisten MOOCien ja muiden verkkotyökalujen käyttö voi helpottaa akuuttia pulaa. Samalla big data-kehityksen hyödyntäminen vaatii jatkuvaa osaamisen päivittämistä.

Edellisessä kappaleessa mainittu yhteistyö oppilaitosten kanssa ja muun muassa käytännön harjoittelut auttavat tulevaisuudessa osaajapulaan. Akuutti (seuraavat pari vuotta) osaajatarve täytyy kuitenkin ratkaista pääosin muilla keinoilla. Vaarana on pitkälti USA:n johtaman kehityksen kelkasta putoaminen, jos osaavaa työvoimaa ei ole erilaisiin tehtäviin saatavilla.

Tutkimus

Big dataan liittyy paljon yhteiskunnallisia kysymyksiä, joiden ymmärtämiseen tarvitaan monialaista tutkimusta. Digitaalisten aineistojen hyödyntäminen vaatii tuekseen viisasta sääntelyä. Tarvitaan yhteiskunnallista ja juridista ymmärrystä siitä, miten aineistoihin liittyvää lainsäädäntöä voidaan kehittää tavalla, joka vie eteenpäin toivottuja tapahtumainkulkuja. Digitaalisesta jäljittämisestä pitää käydä avointa keskustelua, ja sen hyödyistä ja haitoista on oltava tutkimuksellisesti perusteltua näyttöä.

Tutkimusnäkökulmasta huomattavaa on se, että suuria aineistoja analysoitaessa yksilökohtaista aineistoa voidaan yhdistää lukuisista eri lähteistä ja toisaalta aineistot saattavat olla varsin epäyhtenäisiä. Ne voivat koostua eri paikkoihin jääneistä digitaalisista jäljistä tai olla kirjoitettuja viestejä, terveystietoja tai arkistoituja kuvia. Tällainen aineistojen moninaisuus haastaa käsitystä tiedon ja tutkimuksen luonteesta. Suurten aineistojen analyysia voi ajatella sarjana kokeiluja, jolloin onnistuneilla kokeiluilla voi kyseenalaistaa aiempaa osaamista ja kehitellä yhteistoiminnan muotoja, käytäntöjä ja sovelluksia. Näin kompetenssi rakentaa uutta tiedontuotannon maailmaa kasvaa merkittävästi.

Big data on eri tiedeparadigmojen keskiössä

Tutkimusnäkökulmasta big dataa voi ajatella myös yhteistoiminnan areenana. Tätä edellyttää monialaisia tutkimusryhmiä. Tietoa louhitaan yhteistyössä muiden kanssa ja aineistolle esitetään yhä uusia kysymyksiä. Kyse on jatkumosta, jossa kuljetaan pikkuhiljaa kohti mielenkiintoisia vastauksia tai aineiston esittämisen tapoja. Vahvat toimijat, kuten Google, Amazon, tai NSA, hyödyntävät digitaalista aineistoa, jotta ne oppisivat tunnistamaan ihmisten aikeita, tarpeita ja liikkeitä. Yksittäisille ihmisille hyöty on huomattavasti rajallisempi kuin silloin, kun aineistoanalyysi aidosti tukee ihmisiä esimerkiksi heidän hyvinvointipyrkimyksissään tai arvoprojekteissaan. Tästä näkökulmasta olisi tärkeää, että aineistojen analyysimenetelmät kehittyisivät tavoilla, joilla ne myös hyödyntäisivät digitaalisia jälkiä jättäviä ihmisiä ja yhteiskuntaa laajemmassakin mielessä. Big data haastaa tutkijoita sekä käyttämään mielikuvitustaan että tekemään eettisesti kestäviä valintoja tutkimustyössään.

Tutkimusrahoitusta on ohjattava tavalla, joka suosii teknologiaosaajien ja yhteiskuntatieteilijöiden yhteistyötä big dataan liittyvissä asioissa. Eettisiä kysymyksiä ei voi ajatella teknologian käytöistä irrallisena alueena vaan ne on pidettävä mukana tutkimuksen kaikissa vaiheissa.

Suomessa big data-alan tutkimus on vielä suhteellisen hajanaista. Erilaisten, mielellään monialaisten big data-tutkimuskeskusten luonti voisi vauhdittaa alan kehitystä. Perinteisesti Suomessa on huippuluokan osaamista esimerkiksi tieteellisestä laskennasta (esim. CSC), laskennan ja algoritmiosaamisen sekä erilaisten muiden alojen luova yhdistäminen toisi suuria hyötyjä. Suomalaisella big data-tutkimuksella on oivat mahdollisuudet kuulua maailman kärkikastiin.

Useat maat pyrkivät big data-tutkimuksen ykköskaartiin. Maailmalla on perustettu muun muassa big dataan keskittyneitä tutkimuskeskuksia. Britit  
investoivat hiljattain Alan Turingin nimeä kantavan instituutin perustamiseen
https://www.gov.uk/government/news/plans-for-world-class-research-centre-in-the-uk
http://www.theguardian.com/technology/2014/mar/19/budget-2014-alan-turing-institute

Infrastruktuuri

Verkkoon kytkeytyneiden laitteiden ja niiden lähettämän sekä vastaanottaman datan määrä kasvaa huimaa vauhtia. Ciscon ennusteiden mukaan vuoteen 2017 mennessä yhteensä noin 19 miljardia laitetta on kytkettynä internetiin. Suurin osa dataliikenteestä tulee tällöin muodostumaan koneiden keskinäisestä (machine-to-machine) viestinnästä.

Kaiken internetissä myös tulevaisuuden verkoilta, niin kiinteiltä kuin langattomilta, vaaditaan yhä enemmän. Pienilläkin viiveillä voi olla ratkaisevan suuri merkitys erilaisten big dataan perustuvien ratkaisujen kannalta. WEF:in mukaan big datan hyödyntämisen kannalta olennaista on, että verkot toimivat hyvin yhteen niin kotimaassa kuin kv. datavirtojen kohdalla, ne ovat turvallisia, tehokkaita ja toimintavarmoja. (WEF: The Global Information Technology Report 2014) Oleellisessa osassa ovat myös erilaiset yhteentoimivuutta varmistavat toimet ja standardit. Voisiko Suomella olla erilaisten standardien kehittämisen ja kehitystyön suhteen mahdollisuuksia? (vrt. GSM yms)

World Economic Forumin Global Information Technology Report kuvaa myös big dataa koskevia teknisiä ja policy-kysymyksiä (s.39)
http://www3.weforum.org/docs/WEF_GlobalInformationTechnology_Report_2014.pdf

Langattomien verkkojen osalta tulee ennakoivasti allokoida riittävästi ennakkoon mobillidatakäyttöön soveltuvia taajuuksia. Verkkojen tulee kehittyä älykkäämmäksi, jotta valtaisien datamassojen siirtyminen on mahdollista.

Datan käytettävyys ja avoimuus

Jotta big data-vallankumouksesta saadaan enemmän hyötyä irti, täytyy kumouksen raaka-aineen eli datan itsensä, olla mahdollisimman laajasti avointa ja helposti käytettävissä.Erilaisten tietoaineistojen avaaminen ja niiden yhdistely mahdollistaa uusia palveluinnovaatioita. Näin tietoaineistojen avaaminen toimii Avaaja ei useimmiten voi tietää, miten avattua tietoaineistoa käytetään ja mihin sitä mahdollisesti yhdistellään. Esimerkiksi datamassan tuomaa mahdollista liiketoiminnallista potentiaalia ei voi siis lähtökohtaisesti tietää etukäteen.

Julkisen tiedon tulee olla mahdollisimman laajasti avointa ja maksutonta. Julkisen tiedon hyödyntäminen on kirjattu myös nykyisen hallituksen hallitusohjelmaan tavoitteena. Tietovarantoja avataankin tällä hetkellä osana valtiovarainministeriön vetämää avoimen tiedon ohjelmaa.

Avoimen tiedon tulee olla muodossa, jossa sen hyödyntäminen on mahdollisimman helppoa. Esimerkiksi erilaisten julkisten tietoaineistojen koneluettavia standardimuotoja tulee edistää.

Myös yritysten ja muiden organisaatioiden datan avoimuuteen ja jakoon tulee mahdollisuuksien mukaan kannustaa. Tätä on kuvattu hieman tarkemmin kohdassa "yritysten yhteistyö ja datamarkkinat".

Valtiovarainministeriön vetämä avoimen tiedon ohjelma avaa julkisia tietoaineistoja http://www.vm.fi/vm/fi/05_hankkeet/02381_avoin_tieto/index.jsp

Lainsäädäntö, sääntely ja tietosuoja

Yksityiselämän suoja on turvattu Suomessa perusoikeutena (PL 10 §). Myös Euroopan ihmisoikeussopimus ja EU:n perusoikeuskirja edellyttävät, että jokaisen oikeutta yksityiselämään on kunnioitettava. Yksityisyyden suojaa joudutaan usein punnitsemaan suhteessa muihin perus- ja ihmisoikeuksiin, kuten sananvapauteen ja julkisuusperiaatteeseen. Viime aikoina kansainvälisessä keskustelussa on myös yhä useammin noussut esiin digitaalisten perusoikeuksien turvaaminen. Suomen perustuslain mukaan henkilötietojen suojasta on säädettävä tarkemmin lailla. Henkilötietolaki (523/1999) on henkilötietojen käsittelyä koskeva yleislaki. Lain tarkoituksena on muun muassa toteuttaa yksityiselämän suojaa ja edistää hyvän tietojenkäsittelytavan kehittämistä ja noudattamista. Henkilötietolain velvoitteet pitää huomioida aina, kun käsitellään henkilötietoja, eli tietoja, jotka ovat yhdistettävissä tiettyyn henkilöön. Lakia ei kuitenkaan sovelleta tilanteisiin, joissa luonnollinen henkilö käsittelee henkilötietoja yksinomaan henkilökohtaisiin tai niihin verrattaviin tavanomaisiin yksityisiin tarkoituksiinsa.

Big Datan käsittelyn yhteensovittaminen henkilötietolain kanssa ei ole täysin ongelmatonta. Erityisesti henkilötietolaissa kuvattu käyttötarkoitussidonnaisuus, informointivelvollisuus ja rekisteröidyn suostumus ovat Big Datan näkökulmasta haasteellisia. Tästä syystä tietojen käsittelijän on syytä varmistaa, että käsittely on henkilötietolain mukaista, jos osana Big Dataa käsitellään henkilötietoja, joita ei ole täydellisesti anonymisoitu. Esimerkiksi pelkästään nimien ja muiden yksilöintitietojen poistaminen ei vielä välttämättä tarkoita, että tiedot muuttuvat anonyymeiksi, jos henkilöt ovat edelleen välillisesti tunnistettavissa. Euroopan unionissa valmisteilla olevan tietosuoja-asetuksen on tarkoitus uudistaa ja harmonisoida unionin tietosuojalainsäädäntöä. Jos asetus tulee voimaan, se muuttaa monella tavoin jäsenmaiden kansallista henkilötietojen käsittelyä koskevaa sääntelyä. Big Datan näkökulmasta merkityksellisiä ovat muun muassa profilointia, tietojen käsittelyn läpinäkyvyyttä, rekisteröidyn informointia tai rekisteröidyn oikeutta tulla unohdetuksi koskevat artiklaehdotukset. Tietosuoja-asetus vaikuttaisi voimaan tullessaan kaiken sellaisen datan käsittelyyn, jota ei ole täysin anonymisoitu.

Viranomaisen hallussa olevien asiakirjojen julkisuuteen sovelletaan julkisuuslakia (621/1999). Julkisuuslaki soveltuu myös silloin, kun luovutetaan henkilötietoja viranomaisen henkilörekisteristä. Henkilötietojen luovutuksen edellytyksenä on tällöinkin, että luovutuksen saajalla on henkilötietolain mukainen oikeus käsitellä kyseisiä henkilötietoja. Näin ollen julkistakaan henkilötietoa ei voida automaattisesti saattaa vapaasti uudelleen käytettäväksi, vaan luovutuksen reunaehdot määräytyvät julkisuuslain, henkilötietolain ja mahdollisen erityislainsäädännön mukaisesti. Tämä tulee huomioida myös Big Datan käsittelyssä jos käsitellään viranomaislähtöistä tietoa.

Henkilötietojen suojaa ja julkisuutta koskevan sääntelyn lisäksi Big Datan käsittelyyn voi vaikuttaa immateriaalioikeudellinen sääntely. Erilaiset tietokannat ja niihin liittyvät ohjelmistot saattavat esimerkiksi nauttia tekijänoikeudellista suojaa. Lisäksi tietoihin ja niiden käyttöön saattaa liittyä sopimusoikeudellisia ja muita kaupallisia velvoitteita, jotka tietojen käsittelijän tulee huomioida.

Tulevaisuudessa Big Datan hyödyntäminen saattaa johtaa siihen, että sen aiheuttamia ongelmia joudutaan ratkaisemaan uuden sääntelyn kautta. Esimerkiksi syrjivät hinnoittelukäytännöt saattaisivat johtaa lainsäädännöllisiin uudistuksiin. Yritysten ja muiden organisaatioiden kannalta hyvä perusneuvo tietosuojan toteuttamiseen on, että tietojenkäsittely ensin suunnitellaan huolellisesti ja sen jälkeen pysytään tässä suunnitelmassa. Läpinäkyvyys tietojenkäsittelyssä korostuu tulevaisuudessa, mikä vaikuttaa suoraan myös Big Dataan. Kaiken kaikkiaan sekä kansallista että kansainvälistä sääntelyä tulisi kehittää siihen suuntaan, että se mahdollistaa Big Datan hyödyntämisen tarkoituksenmukaisella tavalla.

Turvallisuus

TULOSSA

Oman tiedon hallinta

Kansalaisten tulee voida vaikuttaa siihen, mihin ja miten heidän tietojaan käytetään. Kerättyä tietoa tulisi halutessaan voida hyödyntää myös eteenpäin. Tiettyjä tietoja luovuttamalla voisi saada esimerkiksi parempaa ja yksillöllisempää tai halvempia palveluita. Samalla tämä saattaisi mahdollistaa uudenlaisten palveluiden kehittämisen. Useimmiten jo nyt pyydettäessä luovutettavien tietojen laajempi hyödynnettävyys olisi myös tietoja keräävien yritysten intresseissä. Niin sanottu Mydata-kehitys voisi tarjota yhden mahdollisen tavan omien tietojen hyödyntämiseen ja hallitsemiseen. Ratkaistaviin kysymyksiin kuuluu muun muassa, missä tietoa säilytetään (aggregaattipalvelut, joihin haluamiaan tietoja voi kerätä ml. QS-tiedot?) sekä missä muodossa tietoa tulisi luovuttaa. Samalla yksittäisen kansalaisen (asiakkaan) kannalta omien tietojen hallinta ja hyödyntäminen mahdollistaa mm. säästöjä, juuri itsensä kannalta sopivien palveluiden "räätälöinnin" sekä luottamuksen lisäämisen tietoja kerääviä yrityksiä kohtaan.

LVM teettää selvitystä Mydatasta. Selvityksen tavoitteena on kiteyttää tulevaisuuden skenaariot henkilökohtaisen datan hallinnoinnin, yhdistämisen ja  
jakamisen alueella sekä luoda pohjaa suomalaisen henkilökohtaiseen dataan perustuvan yhteistyöverkoston syntymiselle. Selvitys valmistuu 16.9.2014 mennessä
http://www.lvm.fi/web/hanke/liikenteen-ja-viestinnan-avoin-tieto

Osallistaminen

Demokraattista osallitumisen mahdollisuuksia sekä kansalaisten äänen kuulumista esimerkiksi päätöksentekoon voidaan lisätä big datan avulla. Teknologia ja uudet tiedon analysointimenetelmät tulisi valjastaa tukemaan myös demokratian ja kansalaislähtöisyyden kehitystä. Tämä olisi esimerkillistä ja rohkeaa, toisaalta kokemukset voisivat olla myös vientikelpoisia.Ylipäätään asiakkaiden, käyttäjien sekä kansalaisten osallistaminen on tarpeellinen lähtökohta big data-kehitykselle. Välttämättä ihmisten tietoja ei vain viedä, kuten synkemmissä big datan riskejä korostavissa arvioissa mainitaan, vaan ihmisiä voidaan big datan avulla myös osallistaa mukaan esimerkiksi heitä koskevien päätösten tekemiseen. Tässä lähtökohtana on käyttäjän suostumus.

Kansalaismielipide päätöksenteon tueksi big datan avulla?
Big data tarjoaa paljon mahdollisuuksia myös osallistamisen ja demokratian kannalta. Uusien menetelmien avulla voitaisiin esimerkiksi käsitellä erilaisia
kansalaisten mielipiteitä tarjoavia aineistoja ja lähteitä. Muun muassa sosiaalisen median, 
erilaisten kyselyiden ja keskusteluiden yhdistelyllä voisi saada paremman kuvan kansalaisten mahdollisista ongelmista ja esimerkiksi reaktioista
erilaisiin päätöksiin. Menetelmien avulla voisi löytää piileviä aiheita ja tehdä päätöksenteosta ja hallinnosta responsiivisempaa sekä 
kansalaislähtöisempää.

Samalla osallistaminen voi olla toimiva menetelmä myös uusien datalähtöisten palveluiden kehittämisessä. Käyttäjien havaintoja tai heiltä saatua tietoa voi hyödyntää toiminnan parantamisessa ja osittain erilaisten mallien synnyttämisessä. Esimerkkinä tästä voisi olla vaikka reittisuosituksia yms. antava liikennesovellus, joka yhdistelisi sekä käyttäjien dataa että esimerkiksi reaaliaikaista liikennedataa saavuttaakseen mahdollisimman tarkat ennusteet sekä paremman palvelun.

Osallistamista sekä käyttäjien havaintojen keräämistä ja hyödyntämistä tulisi soveltaa myös hallinnon palautteen keräämisessä ja toiminnan suunnittelemisessa yhä enemmän.

Tekniset käytännöt ja standardit

Eri organisaatioihin kertyvä data täytyy pystyä ottamaan tehokkaasti käyttöön siellä missä sitä tarvitaan; tätä tarkoitusta varten tarvitaan yhteisiä sopimuksia tai standardeja siitä, kuinka dataa tallennetaan, jaellaan ja prosessoidaan. Big datan täysimääräisessä hyödyntämisessä oleellista on myös se, että erilaisista tietokannoista ja dataseteistä voidaan hakea tietoa, malleja ja tuloksia. Toisin sanoen yhteentoimivuus on oleellista.

Tällä hetkellä tätä edistäviä yhteisiä, maailmanlaajuisessa käytössä olevia, esimerkiksi datan varastointiin ja tiedonsiirtämiseen liittyviä big data-standardeja ei kaikilla osa-alueilla ole, teknologioiden yhä kehittyessä. Standardisointi kehitetään eri puolilla kovaa vauhtia, asiaa selvitetään muun muassa Yhdysvaltain National Institute of Standards and Technologyssa. Tämän lisäksi useissa muissa standardoimisorganisaatioissa pohditaan ja etsitään mahdollisuutta eri teknologioiden yhteentoimivuuden varmistaville big data-standardeille.

Samalla standardointia tarvitaan myös yritysten keskinäisen datan vaihdon mahdollistamiseen. Erilaiset big data-ratkaisut ja teknologiat eivät ole tällä hetkellä yhteenvoimivia. Tulevaisuudessa nähtäneen yhteisiä standardeja ja käytäntöjä, joiden avulla big data-ratkaisujen yhteentoimivuus varmistetaan.

Suomen ja suomalaisten yritysten tulee pysyä mukana ja edistää standardikehitystä osallistumalla mahdollisuuksiensa mukaan erilaisten ja eri alojen standardointielinten toimintaan. Lisäksi tietoa standardien ja teknologian kehityksestä tulee jakaa keskinäisessä verkostossa. Standardien ollessa vielä kehittymättömiä, niiden muotoutumiseen pyritään vaikuttamaan niin, että muotoutuvat standardit ovat mahdollisimman pitkälle suomalaisten alan yritysten edun mukaisia.

Suomessa on tehtävä myös big data-alan teknologiakartoituksia ja tunnistettava oleellisimpia teknologioita, malleja sekä standardeja. Samalla erilaisten big dataan liittyvien määritelmien ja termien yhtenäisyys on oleellista. Tätä tulisi myös Suomessa tehdä. (esim Standardoimisliitto)

//TÄHÄN TEKNOLOGIAT JA TEKNISET KÄYTÄNNÖT TULOSSA//


Paluu pääsivulle Big_Data_-strategia