Big Data -strategia
Kysymys
←--#: . Tähän voisi tehdä täsmällisemmän kysymyksenasettelun niin, että lukija tietää mitä tuleman pitää ja käyttäjä tietää millaista sisältöä kaivataan. Esimerkiksi jotain alla olevan tapaista (en tunne hankkeen taustoja, joten saatan olla hakoteillä joissakin asioissa). --Jouni Tuomisto (keskustelu) 16. huhtikuuta 2014 kello 06.49 (EEST) (type: truth; paradigms: science: defence)
Millainen kansallinen suuraineistostrategia (big data strategy) Suomella pitäisi olla vuosille 2014-2020, jotta
- se edistäisi yhteiskunnan moniarvoista kehittymistä,
- se toisi kansalaisille lisäarvoa oman elämän ja omien tietotarpeiden hallintaan,
- se ehkäisisi tiedon pahantahtoisen käsittelyn ihmisille ja yhteiskunnalle aiheuttamia haittoja, ja
- se parantaisi Suomen kansainvälistä kilpailukykyä?
- Tämä on big data- strategian kirjoituswikisivusto.
- Ohjeistusta edellytys- ja sovellusalueista kirjoittamiseen: Kirjoita
- kuvausta kyseisestä teemasta, sen nykytilasta, esimerkkejä ja perustelua siitä, miksi tämä meille olennaista
- ideoita toimenpiteiksi, joita tämän teeman kehittämiseksi tarvitaan (strategian toimenpideosio kootaan myöhemmin näistä)
----#: . Toivon teidän täydentävän sivulla Luettelo Opasnetissa toteutettavista hankkeista olevan taulukon omalta osaltanne ja laittavan samat tiedot myös tälle sivulle. Kiitos. --Jouni Tuomisto (keskustelu) 16. huhtikuuta 2014 kello 07.09 (EEST) (type: truth; paradigms: science: comment)
Vastaus
- Tähän kirjoitetaan strategiaan sisällytettävät toimenpiteet sitä mukaa kun ne jäsentyvät.
Johdanto
Big Data
Yhteisesti jaettua ja täysin yksiselittäistä määrittelyä ei termille ole. Useimmiten käytetään kolmen V:n määritelmää, jolla viitataan sekä datan määrään (volume),syntyvauhtiin (velocity) sekä erilaiseen, struktoroimattomaan dataan (variety). Eri näkökulmista, muun muassa eri palveluntarjoajien määritelmissä, painotetaan ilmiön eri puolia. Esimerkikisi Intel määrittelee big datan puhtaasti koon (mediaaniarvona 300tb dataa viikottain), Microsoft lähestyy asiaa analyysin vaadittavien monimutkaisten menetelmien kautta. Lisäksi termiä voitaisiin lähestyä myös analyysiin käytettävien työkalujen kautta . (Mm. Hadoop)
Big dataan törmää nykyään joka puolella. Termi on nykyään jatkuvasti esillä myös mediassa ja julkisuudessa. Osittain kyse on myös termin ja ilmiön ympärillä olevasta hypestä, big dataan liittyy äärimmäisen suuria odotuksia ja toisaalta myös dystooppisia pelkoja. Viime vuoden aikana saavutettiinkin Gartnerin hypekuvaajan mukaan tulevina vuosina saavutetaankin ylimitoitettujen odotusten huippu . Tästä huolimatta ilmiötä ei tule tuomita teknoutopiaksi, vaan big data todella muuttaa toimintapoja lähes joka sektorilla. Myös Gartner ja muut tutkimusyhtiöt ovat hyvin yksimielisiä big datan disrubtiivisesta vaikutuksesta.
Maailmassa syntyvän ja kerättävän datan määrä kasvaa huimaa vauhtia, samalla oleelliseksi muodostuu kertyvän tiedon hyötykäyttö. Tulevat menestysyritykset ja jopa valtiot ovat muokanneet toimintaansa eri lähteistä saatavan datan avulla. Esimerkiksi päätökset perustuvat entistä enemmän saatuun tietoon. Tämä tarkoittaa myös sitä, että tiedon yhä tehokkaammasta hyödyntämisestä tulee globaalissa kilpailussa täysin välttämätöntä.
Tiedon varastoinnista on tullut selkeästi halvempaa ja helpompaa (mm. pilvi), lisäksi prosessointitehon kasvaessa analyysimenetelmät ovat kehittyneet, nykyään voidaan analysoida valtavia tietoaineistoja sekä yhdistellä eri muodoissa olevaa dataa (tuoda järjestys epäjärjestykseen). Samalla sensoriteknologia on kehittynyt ja halventunut merkittävästi. Nämä ovat big data-ilmiön mahdollistajia.
Big Datan voi käsittää myös tietynlaisena tiedon paradigmanmuutoksena. Siirrytään yrityksissä ja hallinnossa tekemään päätöksiä suoraan ”mitattuun” tietoon perustuen. Tutkimuksessa ei välttämättä tarvitse samalla tavalla muodostaa teoriaa, kun voidaan käydä valtavia tietomassoja läpi ilman ennakko-oletuksia ja ns. ”löytää” malleja, yhteyksiä
Tässä strategiassa big dataa on lähdetty lähestymään mahdollisen neljännen V:n, arvon eli valuen kautta. Strategiassa ei ole keskitytty pelkästään massiivisten, jopa supertietokoneita analyysiin vaativiin reaaliaikaisiin tietomassoihin. Sen sijaan omaksuttu näkökulma on astetta käytännöllisempi. Strategiassa on paikoin keskitytty myös käsittelymenetelmällisesti yksinkertaisempaan dataan ja esimerkiksi erilaisten tietoaineistojen yhdistelyyn. Ajatuksena on ollut tunnistaa ja löytää Suomen kannalta oleellisia alueita, joilla kerättävä tieto, uudet tiedonkäsittelymenetelmät ja laajempi tiedon hyödyntäminen voivat tuoda arvoa.
Lähtökohtana on laaja yhteistyö; data-aineistojen sijaitessa usein erilaisten organisaatioiden ja instituutioiden huomassa korostuu myös laajan yhteistyön tarve, niin hallinnon, yritysten kuin esimerkiksi järjestöjen kesken. Tätä on korostettu myös jo aiemmin big dataan keskittyneen strategian tai ohjelman laatineissa maissa.
Big Data-strategioita maailmalla
Big data-ilmiön tarkastelemiseen on monessa maassa havahduttu kansallisella tasolla. Eri maissa alan kehitykseen sekä muun muassa säästöjen ja kilpailukyvyn kannalta big data on nähty yhtenä oleellisimmista kehityskuluista. Niinpä monissa maissa alalle laitetut panostukset ovat mittavia. Big data-kehityksen kärjessä kulkeminen nähty äärimmäisen tärkeänä. Big data-maailmassa kilpailu on todella kovaa ja investoinnit alalle suuria.
Esimerkiksi Saksassa ja Ranskassa big data nähdään tiiviisti teollisuuden kilpailukyvyn avaintekijänä. Maat ovat huomioneet laajasti big datan teollisuuspolitiikassaan. Ranskassa big data kuuluu seitsemän tärkeimmän tulevaisuuden teknologian joukkoon. Strategioissa nähdään big datan tuovan hallinnolle pidemmällä tähtäimellä merkittäviä kehitys- ja säästömahdollisuuksia. Esimerkiksi alan kärkimaassa Yhdysvalloissa on taas panostettu pelkästään hallinnossa big data-kehitykselle satoja miljoonia dollareita. Big data-alalla toimivien yritysten suhteen maalla taas on selkeä etumatka esimerkiksi Eurooppaan verrattuna.
TÄRKEIMMÄT alueet esille. Nostaa edelläkävijyyttä esille nillä aloilla, joilla sitä löydettävissä (sovellusalueosion kautta??). Toisaalta missä ollaan selkeästi perässä/helposti saatavat hyödyt, kiinni kurominen näillä aloilla (minimi).
UUDET MENETELMÄT esille. --> vaatii uutta koulutusta, tutkimus, asiantuntemus. Niin suurta dataa)
MÄÄRÄN/HYÖDYN erottaminen tarkemmin
JULKISEN PUOLEN mahdollisuudet, mm. toimintasuunnitelmiin big data-kehitys mukaan.
KV asema, pakko toimia, kriisiajatus tarkemmin. (suomi jo muutaman vuoden perässä, tämä esiin)
POST-IT-era, optimointi, tehokkuus.
Erilaiset vaatimukset datan käytön/hallinnan yms. suhteen. (terveys vs. IOT)
AVOIN DATA esille johdantoon, Suomi etujoukoissa.
TEKNOLOGiA vs Hyödyntäminen
Edellytykset:
Datatietoisuus
Nykyaikaisen analytiikan ja big datan omaksuminen osaksi jokapäiväistä työtä on keskeinen askel kohti tiedolla johtamisen yrityskulttuuria. Uuden teknologian ja prosessointikapasiteetin kustannusrakenteiden jatkuva kehitys vaatii omien kyvykkyyksien säännöllistä uudelleentarkastelua. Se mikä datan tarkastelussa vuosi sitten oli mahdotonta tai kannattamatonta, voi tänään olla varsin perusteltua ja liiketoiminnallisesti kannattavaksi todistettavaa. Samalla budjetilla voidaan ensi vuonna jälleen tarkastella laajempaa datamassaa, etsien tarkempia signaaleja, uusia toimintamahdollisuuksia ja aiemmin tunnistamattomia optimointikohteita. Tämä sykli toistuu yhä uudelleen ja organisaatioiden onkin opittava kyseenalaistamaan vanhat datan tarkastelun rajat ja kiinnittämään tarkemmin huomiota uusien lähteiden syntyyn. On tultava datatietoiseksi.
Perinteisesti organisaatiot ovat tottuneet tarkastelemaan oman liiketoimintansa tuottamaa dataa. Ja siitäkin erityisesti esivalittua osajoukkoa, liiketoiminnan ydintietoa. Tämä tieto on kerättynä erilaisissa perusjärjestelmissä (ERP, CRM, CMS) ja sekä datan tuntemus että sen analysointiin käytettyjen välineiden osaaminen on vahvaa. Big datan huomiointi tässä kontekstissa tarkoittaa datan keräämisen laajuuden tarkastelua. Jos perusjärjestelmien lokitasot, tapahtumien kirjaaminen tai tapahtumien sisällön laajuus on aiemmin rajoitettu tallennus- ja prosessointikapasiteetin kustannusten perusteella, voidaan näitä arvioida uudelleen nykyisen kustannusrakenteen ja kapasiteetin myötä. Ydinliiketoimintaa on myös syytä tarkastella säännöllisesti uudelleen tiedonkeräämisen potentiaalin näkökulmasta. Onko aiempi analytiikka tai toiminnan tarkastelu nostanut esiin asioita, joissa datan kerääminen ei ole riittävällä tasolla? Voitaisiinko tuota tunnistettua, kiinnostavaa dataa kerätä tuomalla järjestelmiin uusia ominaisuuksia tai toimintaympäristöön esimerkiksi erilaisia sensoreita? Näihin mahdollisuuksiin tarttuminen kartuttaa oman liiketoiminnan tuottamaa datavarantoa entisestään ja saattaa nostaa big datan teknologioiden omaksumisen varsin ajankohtaiseksi.
Datatietoinen organisaatio ei kuitenkaan rajoita tiedonjanoaan ainoastaan omien järjestelmien keräämään dataan, vaan katsoo ympäröivää ekosysteemiä laajemmin. Datan mahdollisuuksia on syytä arvioida kumppaniverkoston kanssa, tunnistaen synergioita, datan vaihdon mahdollisuuksia tai jopa uuden liiketoiminnan perustamisen potentiaalia datavarantojen yhdistämisen myötä.
Data rinnastetaan useissa puheissa nykyisin luonnonvaroihin, joten sille syntyy luonnollisesti myös arvo kauppatavarana. Tämän ilmiön myötä datan kerääminen ja koostaminen on synnyttänyt ja synnyttää edelleen uusia toimijoita markkinoille. Näiden datakauppiaiden toiminta puolestaan esiintyy joko yksittäisinä palveluina tai koostettuna datan markkinapaikoille. Kysyntä ja tarjonta määrittävät ennen pitkää erilaisen datan arvon, aivan kuten muillakin luonnonvaroilla. Nykyaikainen, datatietoinen organisaatio huomioi myös nämä kaupalliset datavarannot arvioidessaan liiketoimintansa datavetoista kehitystä.
Kolmas näkökulma saatavilla olevaan dataan on avoin data. Sekä EU-tason että kansallinen lainsäädäntö ohjaa erityisesti julkishallinnon dataa voimakkaasti kohti avoimuutta. Tulevaisuudessa kansallisin varoin kerättyä, varsin arvokasta dataa on paljon saatavilla ja hyödynnettävissä edelleen liiketoiminnan kehityksessä. Avoimen datan kulttuurin kehitys vetää mukanaan myös yksityisiä ja kaupallisia toimijoita, joiden intresseissä on avata dataansa julkisuus- ja goodwill-tarkoituksissa sekä vauhdittaakseen oman erityisosaamisalueensa kehitystä. Organisaatioiden onkin syytä ottaa mukaan kokonaisvaltaiseen data-strategiaansa myös avoin data ja sen erilaiset mahdollisuudet. Hyötyjä on tunnistettavissa sekä avoimen datan kuluttajana että tuottajana.
Kansallisessa big data -strategiassa avoimen datan kehitys on yksi keskeisistä teemoista. Nykyaikainen suhtautuminen datan avaamiseen, lainsäädännön kehitykseen reagointinopeus ja tiedon jakamisen kulttuurin kehitys luovat myös kansallista pääomaa ja auttavat Suomea toimimaan esimerkkimaana. Kokemukset avoimen datan päätöksistä, käytännön toteutuksista ja vaikutuksista liiketoimintakenttään ovat lähitulevaisuudessa haluttua pääomaa. Parhaiden käytäntöjen tuotteistaminen voi luoda myös hyvää tukea suomalaisen osaamisen vientiin ja vauhdittaa osaltaan talouskasvua.
TIEDOLLA JOHTAMINEN, tiedosta hyödyn saaminen. Määrittely otsikolle: "kun riittävä massa dataa, saadaan informaatiota ulos, datan säilyttäminen/analysointi arvokasta. (arvoaspekti) Muutama esimerkki säilyttämisen yms. mahdollisuuksista. Hyöty ei välttämättä näy heti, huomioon myös. (potentiaali) Use caset tähän myös. TIETOISUUS BIG DATAN MAHDOLLISUUKSISTA?. Tuodaan negatiivisemmat puolet, etiketti/ toisen suunnan mahdollisuudet.
Kokeilut/t&krahoituksen suuntaaminen
Big data-kokeiluille tulisi saada riittäviä resursseja. Erilaiset mallit, sovellukset. yms. ovat useimmiten äärimmäisen nopeasti skaalattavissa ylöspäin. Niinpä yksittäisestä toimivasta kokeilusta syntyvä palvelu/teknologia/tuote voi olla nopeastikin täysosuma. T&K-rahaa tulisi kohdentaa big dataan liittyville kokeiluille ja tutkimukselle. Lisäksi muun muassa EU:n Horisontti 2020-ohjelman mahdollisuudet tulee käyttää täysimääräisesti hyväksi.
KOKEILU:
Kansalaisen oma mobiilisovellus
Tällä hetkellä mobiilialan yritykset, pienet ja suuret yhtälailla, seuraavat käyttäjän toimia monella eri tavalla. Osa seurannasta tehdään uutisoinnin mukaan ilman käyttäjän suostumusta ja osa käyttäjän suostumuksella. Käyttäjän toimien seuraaminen mobiililaitteilla on tehokas tapa kerätä rikasta tietoa käyttäjän tekemisistä. Yhteiskunta voisi ottaa käyttäjien seurannan tietoisesti käyttöön, tietenkin loppukäyttäjien luvalla ja käyttötarkoitukset perustellen. Mobiilisovellus voi kerätä tietoa aktiivisesti sensoreiden ja erilaisten mobiililaitteen tapahtumien avulla. Lisäksi sovellus voi kerätä tietoa kysymyksin ja käyttäjän itsensä syöttämänä. Sovellus voidaan myös yhdistää sosiaalisen median kanaviin.
Kerättyä tietoa voidaan hyödyntää yhteiskunnan palveluiden kehittämiseen ja suuntaamiseen tehokkaammin. Kun tiedetään kansalaisista tarpeeksi, voidaan havaita piileviä syy-seuraussuhteita ja ennakoida esimerkiksi terveyskeskusten kuormitusta.
Mobiilisovelluksen käyttäjä voisi taas saada henkilökohtaistettua tietoa omista riskeistään ja erilaisia ennusteita, joita kerätystä datasta nousee; esimerkiksi tietynlainen mobiilikäyttäytyminen voi johtaa käyttäjän stressitasojen nousuun ja heijastua terveyteen pitkällä aikavälillä.
Mobiilisovellusta voitaisiin kokeilla ensin pienimuotoisesti, jotta saadaan selville käyttäjien mielipiteet ja heidän hyväksyntänsä sovelluksesta, joka voidaan kokea herkästi myös "isoveli valvoo" -tyyppisenä sovelluksena.
Haastetta ketterien kokeilujen toteuttamiselle asettaa se, että suurten tietovarantojen haltijat ja niitä kerryttävät tahot ovat usein suuria eivätkä aina niin ketteriä organisaatioita. Toisaalta data-analytiikan alueelle on syntynyt ja syntymässä uusia pieniä yrityksiä, jotka voisivat tarjota tehokkaampia menetelmiä big datan hyödyntämiseen ja uuden liiketoiminnan synnyttämiseen. Myös T&K&I -rahoitusta suuntaamalla olisi mahdollista saattaa erilaisia big-data -toimijoita yhteisiin projekteihin ja hakemaan yhdessä ratkaisuja todellisiin asiakastarpeisiin.
KOKEILUJEN kuvausta, kaikki eivät johda uuteen liiketoimintaan. Tärkeätä kuitenkin muuttaa myös ilmapiiriä "start-up"-henkisempään suuntaan. Sama myös TKI-rahoitukseen?
T&K-rahoituksella ohjaaminen ketterämpään suuntaan, yhteistyö erilaisten yritysten kesken.
Big data-keskus, joka toisi yrityksiä yhteen?
Datan markkinat, uudet mahdollisuudet sitä kautta?
Yhteistyö kv. vetureiden kautta? Esmes suomalainen pk-yritys ja saksalainen autoteollisuuden toimija.
Ilman investointeja mahdotonta saada etumatkaa kiinni? Vaatii julkishallinnolta tutkimusvarojen kohdentamista.
Isommille kannuste antaa dataa käyttöön,jakamisesta liiketoimintamalli samalla. (bitcoin-malli)
Yritysten yhteistyö ja datan vaihto
Big datan prosessointi on erityisen haasteellista. Dataa saattaa olla niin paljon ja sitä voi syntyä niin suurella nopeudella, että sitä ei voi siirtää fyysisesti toisen organisaation käsiteltäväksi. Tällaisissa tilanteissa tiedon analysointia varten täytyy siirtää prosessoivaa koodia toisen organisaation sisälle. Tämä on ongelma, joka vaatii sekä teknistä että tietoturvallista ratkaisua. Samalla täytyy varmistua siitä, kuinka toinen osapuoli voi luottaa ulkopuoliseen ohjelmakoodiin. Yksi ratkaisu tähän voisi olla yhteiskunnan luoma luotettu dataoperaattori, joka huolehtii datan analysointikoodista ja resurssoinnista yhteistyössä osapuolten kanssa.
Laajemmaksi otsikoksi datamarkkinat etc.
yhdistää datan saatavuuteen ja avoimuuteen
Venture capital- tyhjiöön suuria yrityksiä + osin julkiset toimijat, Tekes? Tekes pääomasijoitus oy.
Start up-kenttä big data kehityksessä. AaltoES yms.
Avoimen datan case studyt? Osoittamaan mahdollisuuksia/hyötyä.
Yritysten mukaan houkutteleminen, motivointi yms.?
Koulutus
Big datan hyödyntämisen kannalta koulutus on avainasemassa. Tällä hetkellä muun muassa erilaisten analyysimenetelmien osaajista on pulaa. Samoin tarvitaan yritysjohtajia, jotka ymmärtävät data-analyysin mahdollisuudet päätöksenteon tukena ja yritysten kilpailukyvyn turvaajina. Tulevaisuudessa osaajilta vaaditaan yhä enemmän, jolloin koulutuspuutteet voivat muodostua merkittäväksi esteeksi big datan laajemmassa hyödyntämisessä.
Koulutuspuutteisiin tulee vastata jokaisella koulutustasolla peruskoulusta lähtien sekä myös yritysten taholla esimerkiksi täydennyskoulutuksien muodossa. Perustana olevia matemaattisia, tilastotieteellisiä sekä ohjelmointitaitoja tulisi painottaa opetussuunnitelmissa jo hyvin varhain, jotta tulevat osaamistarpeet tulisivat paremmin katettua pitkällä tähtäimellä.
Tämä ei kuitenkaan vastaa välittömiin tarpeisiin. Suomessa on käynnistymässä sekä ammattikorkeakouluissa että yliopistoissa useita big dataan ja data-analytiikkaan liittyviä koulutusohjelmia. Ammattikorkeakoulutasolla esimerkiksi Haaga-Helia tarjoaa big dataan liittyviä kursseja xxx-koulutusohjelmassaan. Yliopistotasolla esimerkiksi Aalto-yliopiston kaikkien kuuden koulun maisteriopiskeljoiden on syksystä 2014 lähtien mahdollista suorittaa sivuaineen laajuinen "Analytics and Data Science" -kokonaisuus. Tämä kokonaisuus täydentää mm. jo olemassaolevia Koneoppimisen ja tiedonlouhinnan sekä Tieto- ja palvelujohtamisen maisteriohjelmia, jotka tarjoavat valmiuksia data-analyysiin. Kaikkien suomalaisten korkeakoulujen, jotka eivät vielä ole havahtuneet big datan vaikutuksiin, tulisi huomioida kehitys ja pikaisesti saada datalähtöisyys ja data-analyysi näkymään eri alojen koulutuksessa. Näissä koulutusohjelmissa voitaisiin tehdä yritysten kanssa tiivistä yhteistyötä, jotta tulevat varsin akuutit tarpeet saadaan edes osittain katettua myös suoraan käytännön taidoilla varustetuilla valmistuneilla. Erilaisilla harjoittelu- ja tutustumismahdollisuuksilla on oma tärkeä osansa. Data-analytiikkaan koulutettaville tulisi tarjota mahdollisuuksia opiskelun aikana erilaisiin harjoitteluihin. Näitä voisi yritysten lisäksi tarjota myös julkishallinnossa, mikä osaltaan auttaisi siirtymistä datalähtöisempään toimintatapaan.
Lisäksi alueella tulisi lisätä monialaista koulutusta. Datalta täytyy osata kysyä oikeita kysymyksiä, joten erilaisten taitojen ja erilaisen osaamisen yhdistäminen on välttämätöntä. Niinpä data-analytiikkaa ja datan "ymmärtämistä" tulisi näkyä melkein alan kuin alan koulutuksessa, aina kauppatieteellisestä yhteiskunta- ja sosiaalitieteisiin. Pelkkä tekninen osaaminen ei riitä, vaan tarvitaan ymmärrystä substanssialoista sekä kykyä yhdistellä asioita ja aloja luovasti. Monella alalla käytettävissä olevan tiedon hyödyntäminen toisi huomattavaa lisäarvoa. On tärkeää kouluttaa osaajia myös yksityisyyden ja tietosuojan alueilla, sillä EU:ssa valmisteilla oleva lainsäädäntö saattaa tuoda yrityksille merkittäviä sanktioita (mahdollisesti 5% liikevaihdosta) henkilötietojen virheellisestä käytöstä. Nykyinen lainsäädäntö antaa yrityksille mahdollisuuden käyttää dataa vain siihen tarkoitukseen kun se on alunperin kerätty, mikä luonnollisesti rajoittaa datan käyttöä huomattavasti.
Koulutuksen kokonaistilanne korkeakoulutuksesta, nykytilanne vs. tuleva tarve. Reaaliaikainen tieto koulutusmääristä yms.
Keskiasteelle jo tiettyjen työkalujen perusopetusta
Miten tämän hetken osaajat (matematiikka, tietokannat) voidaan tunnistaa ja nostaa alan huippuosaajiksi. Täydennyskoulutuksia yms.
Yritys/oppilaitosyhteistyö. Erilaiset mallit, harjoittelut, opinnäytetyöt, yms.
Data scientist Kuvauksen tyypillisistä taidoista/rooleista/tehtävistä, kts. komission + e-skills UK-selvitykset yms. Miten saada innostumaan tarvittavista taidoista, kynnyksen laskeminen. Eri sektorit, palaset huomioon. Lisäksi poikkitieteellisyys, tiimit etc. Kotimaiset + kv. ammattinimikkeet, miten suhtautuvat toisiinsa, missä ryhmissä suurin tarve. Erilaiset roolit tiimeissä, ei aina absoluuttinen yksittäinen huippuosaaja.
AMK-koulutus"putki", koodareita yms. käytännön osaajia. Onko riittävästi tarjolla?
Opetushenkilöstö, tarvittava opetuksen taso + määrä ei tällä hetkellä suoraan mahdollinen(osaratkaisuna esim. verkkomateriaalit).
Jatkuvan koulutuksen/tietotaidon ylläpitäminen. (Mooc yms)
Ulkomaisten huippupuhujien/kouluttajien tuominen Suomeen (inspirointi) Systematisoitu jatkokoulutusohjelma. Huippujen saaminen myös Suomeen, ei aina toisinpäin.
"kummitoiminta", big data näkökulmasta
soveltava osaaminen yrityksissä
- käsitelty jo edellä ,
- eli käytännönläheisesti ja tarvelähtöisesti, että pysytään esim USA:n tahdissa
- näkemys kokonaistarpeesta - viittaukset ulkomaisiin selvityksiin
- suhteutetaan bkt:een
tutkimus
- soveltava tärkeintä
- yrityksillä ei aina tut toimintaa jossa riski
- teollisuusyhteistyötä ei arvosteta,
Soveltava osaaminen yrityksissä
Tutkimus
Infrastruktuuri
Suomen jokaisen organisaation päätöksenteon tulisi muuttua tietoon perustuvaksi (data driven) sen sijaan että päätökset tehtäisiin mutu-pohjaisesti. Maailmalla on tietopohjaisesta päätöksenteosta esimerkkinä mm. amerikkalainen autonvalmistaja Ford, joka selvisi autoteollisuuden kriisistä siirtymällä data-driven päätöksentekoon.
Tällainen tietoon perustuva päätöksenteko vaatii tuekseen toimivan tiedonkeruun ja analysoinnin. Sama tiedonkeruu ja -analysointi palvelee myös open data -aloitteita. Julkisen hallinnon organisaatioissa voidaan nimetä datavastaava, jonka tehtäviin kuuluu datan keruun ja analysoinnin järjestäminen. Yksityisiä yrityksiä ja muita yhteisöjä varten voidaan järjestää valtiovallan taholta maksullista tai maksutonta neuvontaa.
Datan käytettävyys ja avoimuus
Lainsäädäntö ja sääntely
Turvallisuus ja tietosuoja
Oman tiedon hallinta
Kansalaisten tulee voida vaikuttaa siihen, mihin ja miten heidän tietojaan käytetään. Kerättyä tietoa tulisi halutessaan voida hyödyntää myös eteenpäin. Tiettyjä tietoja luovuttamalla voisi saada esimerkiksi parempaa ja yksillöllisempää tai halvempia palveluita. Samalla tämä saattaisi mahdollistaa uudenlaisten palveluiden kehittämisen. Useimmiten jo nyt pyydettäessä luovutettavien tietojen laajempi hyödynnettävyys olisi myös tietoja keräävien yritysten intresseissä. Niin sanottu Mydata-kehitys voisi tarjota yhden mahdollisen tavan omien tietojen hyödyntämiseen ja hallitsemiseen. Ratkaistaviin kysymyksiin kuuluu muun muassa, missä tietoa säilytetään (aggregaattipalvelut, joihin haluamiaan tietoja voi kerätä ml. QS-tiedot?) sekä missä muodossa tietoa tulisi luovuttaa. Samalla yksittäisen kansalaisen (asiakkaan) kannalta omien tietojen hallinta ja hyödyntäminen mahdollistaa mm. säästöjä, juuri itsensä kannalta sopivien palveluiden "räätälöinnin" sekä luottamuksen lisäämisen tietoja kerääviä yrityksiä kohtaan.
Osallistaminen
Demokraattista osallitumisen mahdollisuuksia sekä kansalaisten äänen kuulumista esimerkiksi päätöksentekoon voidaan lisätä big datan avulla.Teknologia ja uudet tiedon analysointimenetelmät tulisi valjastaa tukemaan myös demokratian ja kansalaislähtöisyyden kehitystä. Tietoa, mielipiteitä ja Tämä olisi esimerkillistä ja rohkeaa, kokemukset voisivat olla myös vientikelpoisia.
Case: Poliittisen ym. päätöksenteon tueksi saataisiin kansalaisten mielipidedataa eri lähteitä yhdistelemällä. +Kuumia aiheita voitaisiin nostaa nopeammin käsiteltäväksi +Ei voimakkaasti vastustettuja päätöksiä prosessista ulos, tai vähintään hyvin perustein varusteltuna +Päätöksenteko vaikuttaisi ajankohtaisemmalta, paremmin kansan kysymyksiin vastaavalta Hyödynnettävyys ja esteet: +Dataa on jo paljon, sosiaalinen media, erilaiset kyselyt -Datan luotettavuus ja eri lähteiden painottaminen olisi haastavaa ja altista muutokselle. Mikä olisi oleellista ja tärkeää?
Samalla osallistaminen voi olla toimiva menetelmä myös uusien datalähtöisten palveluiden kehittämisessä. Käyttäjien havaintoja tai heiltä saatua tietoa voi hyödyntää toiminnan parantamisessa ja osittain erilaisten mallien synnyttämisessä. Esimerkkinä tästä voisi olla vaikka reittisuosituksia yms. antava liikennesovellus, joka yhdistelisi sekä käyttäjien dataa että esimerkiksi reaaliaikaista liikennedataa saavuttaakseen mahdollisimman tarkat ennusteet sekä paremman palvelun.
Osallistamista sekä käyttäjien havaintojen keräämistä ja hyödyntämistä tulisi soveltaa myös hallinnon palautteen keräämisessä ja toiminnan suunnittelemisessa yhä enemmän.
Tekniset käytännöt ja standardit
Eri organisaatioihin kertyvä data täytyy pystyä ottamaan tehokkaasti käyttöön siellä missä sitä tarvitaan; tätä tarkoitusta varten tarvitaan yhteisiä sopimuksia tai standardeja, kuinka dataa tallennetaan, jaellaan ja prosessoidaan.
Yhteisen teknisen alustan kehittäminen avoimen lähdekoodin hengessä on tehokas tapa viedä asiaa eteenpäin. Näin vältetään useiden suljettujen kaupallisten järjestelmien pirstaloiva vaikutus eri datalähteiden tehokkaaseen hyödyntämiseen. Sopivalla lisensointipolitiikalla yritysten liiketoiminta yhteisen alustan päälle on mahdollista ja samalla rakennetaan uutta ekosysteemiä Suomeen big datan ympärille. Tällainen alusta luo potentiaalisesti uuden vientivaltin.
Sovellusalueet ja niiden potentiaali Suomessa
Terveys
- Mahdollistajat: Uusia teknologioita syntyy, Suomessa osaamista (Polar mm.) , quantified self(itsemittaus). Tartuntatautien leviämisen seuranta/valmistautuminen erilaisia aineistoja yhdistämällä, mm sosiaalinen media. Yksilöllisen hoidon järjestäminen. Suomessa huippuluokan geenitutkimusta. Kansallinen DNA-tietopankki
- Haasteet: Tietoaineistojen käyttöön saaminen, yksityisyyden suoja.
- Hyöty: Julkishallinnon säästöt, terveydenhuollon laadun parantuminen, yksittäisen kansalaisen terveysriskien ennustaminen/hälyyttäminen, sairauksien ehkäisy.
- Use case: Epid research oy:n diabetestutkimus.IBM, project Artemis. 23andme. OECD:n big data for health. DARPA, data mining for Cancer Research. Taltioni.
Julkinen hallinto
Suomea viime vuosina koetelleet finanssi/pankkikriisi, globaalin kilpailutilanteen muutos työn siirtyessä halvemman kustannustason maihin sekä nopean teknologiakehityksen myötä tapahtuneet kotimaisten toimialojen murrokset ovat aikamme globaalitalouden ilmiöitä, jotka asettavat suuria haasteita ja uudistamistarpeita Suomen valmiiksi ylivelkaantuneelle julkiselle sektorille. Em. ilmiöiden seuraukset Suomelle ovat näkyneet mm. vientiteollisuuden paikoittaisena kilpailukyvyn romahtamisena, työttömyyden kasvamisena ja jo ennestään velkaantuneen julkisen talouden kestävyysvajeen lisääntymisenä. Edessä oleva suurten suomalaisten ikäluokkien eläköityminen tulee rasittamaan julkisen talouden kustannusrakenteita entisestään.
Hallitus on pyrkinyt torjumaan kestävyysvajetta ja tasapainottamaan julkista taloutta sopeutustoimenpiteillä ja 29.11.2013 voimaantulleen rakennepoliittisen ohjelman konkreettisilla toimenpiteillä, jotka kohdistuvat moniin eri osa-alueisiin kuten terveydenhuoltoon (kts. Terveydenhuolto), kuntauudistukseen, työurien pidennykseen, rakenteelliseen ja nuorisotyöttömyyden torjuntaan, työ- ja kouluttautumismahdollisuuksien lisäämiseen. Rakenteellisten muutosten mahdollistamien kustannussäästöjen lisäksi tuottavuuden lisääminen niin kustannus- kuin palvelutehokkuutta parantamalla on keskeisiä julkisen hallinnon tavoitteita.
Oikein kohdistetuilla Big Data-ratkaisujen hyödyntämisellä on mahdollista saavuttaa tuottavuusparannuksia erillisillä julkishallinnon osa-alueilla ja siten auttaa yhteiskuntaa omalta osaltaan torjumaan em. kestävyysvajetta. Julkishallinnon datalähtöisemmällä johtamisella ja kansalaistyytyväisyyteen perustuvalla mittaamisella on lisäksi mahdollista luoda tuottavuuden maksimointiin tähtääviä yleisiä parhaita käytäntöjä. Parhaimmiksi todistetuilla tuottavuudenparantamiskäytännöillä saavutetut tuottavuus- ja kansalaispalveluhyödyt on mahdollista tämän jälkeen kopioida ja sovittaa muuallekin julkishallintoon, joko maantieteellisesti tai toimintatarkoitukseltaan erillisiin organisaatioihin (esim. erilliset virastot, joilla on kuitenkin samankaltaisia prosesseja) tai esim. saman organisaation muihin yksiköihin.
Big Data -ratkaisujen potentiaalisia hyödyntämismahdollisuuksia suomalaisessa julkishallinnossa kannatta erityisesti lisäselvittää seuraavilla rakennepoliittisen ohjelman kohde-alueilla:
Pekka: Tämän listan mahdollisia ratkaisukohteita tulen kirjoittamaan puhtaaksi (mm. hyödyntämällä ao. pohjamateriaalia), kun on sovittu sopivasta rajauksesta muihin kappaleisiin (esim. koulutus, terveydenhuolto), kuvausten yksityiskohtaisuudesta (esittely, linkitys suomen tilanteeseen, esimerkki maailmalta mahdollista vaikuttavuutta varten). Palataan tähän palaverissa.
- Mahdollistajat: Valtava määrä kerättyä tietoa. Harmaan talouden ja talousrikosten seuranta, paljastaminen ja ennakointi yhdistämällä virallista dataa ja sosiaalisen median ym. aineistoja. Päätösten tarkempi seuranta ja mm. visualisointi. Kansantalouden kokonaissimulaatiomalli sekä yritysten että julkisen sektorin käyttöön.
- Haasteet: Tiedon avaaminen yleiseen käyttöön. Julkisten ja muiden aineistojen yhdisteleminen. Rekistereiden käyttö.
- Hyöty: Säästöt, tehokkuuden lisääntyminen, helpompi ja nopeampi asiointi. Päätösten vaikutusten parempi arviointi, Kansainvälisen rikollisuuden ja sen liikkeiden seuranta. E-demokratia ja osallistaminen.
- Use case: National Institute on Money in State Politics.
Big datan käytöllä hallinnossa on todella merkittävä tuottavuudenparannus- ja säästöpotentiaali. Tavoiteltavia hyötyjä ovat muun muassa:
- Kansalaisten henkilökohtaisempi ja laadukkaampi palvelu (kansalaistyytyväisyys ja luottamus)
- Julkishallinnon rahoitusvirtojen ja rakenteen parempi läpinäkyvyys (niin yleisellä kuin esim. kuntatasolla)
- Julkishallinnon yksiköiden suorituskyvyn ja päätöksenteon mittaaminen (mahdollistaa yksiköiden/virastojen/kuntien keskinäisen vertailun ja suorituskyvyn kannustimet)
- Erilainen toiminnan tehokkuuden mittaaminen: Julkishallinnon yksiköiden tekemien ulkoisten hankintojen tuloksellisuuden mittaaminen (hankintaprosessien parantaminen, toimittajien datalähtöinen kilpailuttaminen)
- Julkishallinnon sisäisten prosessien tehokkuuden parempi mittaaminen ja optimointi, parhaat käytännöt prosessien tehostamisessa osin uudelleenkäytettävissä muissa yksiköissä (esim. eri virastot)
- Julkishallinnon tehokkaampi ja hienojakoisempi palautteenkeruu niin palveluita käyttäviltä kansalaisilta, julkisten yksiköiden työntekijöiltä kuin johtavilta elimiltä
- Kansalaisille näkyvien hakemus- ja tiedonsyöttöprosessien automatisointi byrokratian ja käsittelyvirheiden vähentämiseksi, kansalaisille mahdollisuus päivittää tietojaan
Use Caseja: Työvoimahallinto: Tukiväärinkäytösten torjunta, koulutustarve- ja työmarkkinaennusteet, työttömien avointen työpaikkojen segmentointi ja samankaltaisuusanalyysi, työllistämispalveluiden yksilöllisempi räätälöinti + Verohallinto: Petosten ja harmaan talouden torjunta + Yksityisen sektorin innovaatiopotentiaalin valjastaminen julkishallinnon palvelukseen (avoin data- ja palvelualusta kolmansien osapuolien (esim. PK-yritykset...) palveluinnovaatioille) + Toimivien julkishallinnon tietoja hyödyntävien palvelukonseptien paketointi ja vientimahdollisuudet muihin maihin vastaaviin käyttökonteksteihin Hyödynnettävyys ja esteet:
Nykyään julkishallinnon keräämä tieto pääsääntöisesti rakenteisessa teksti- tai numeromuodossa, jolloin hyödyntäminen olisi varsin yksinkertaista.
Ongelmian puolestaan muun muassa organisaatiokulttuurin haasteet, puuttuvat kannustinjärjestelmät muutoksille, liian jäykkä lainsäädäntö tai muut ihmislähtöiset esteet datan avaamisessa ja yhdistämisesssä.- Muutoksien kannalta välttämättömän datalähtöisen muutosjohtamisen ja/tai teknisen/analyyttisen osaamisen heikko saatavuus Hyödyntämisessä on myös joitain teknisiä arkkitehtuurihaasteita lähtökohtaisesti siiloutuneen ja epäyhteensopivan datan yhdistämisessä
Älykkäät verkot
”Infomediary”
Erilaisille tietotulvaa helpottaville työkaluille ja mm. etsintämentelmille on vielä kysyntää esimerkiksi tutkimuksen parissa. Suomessa tehdään alaan liittyvää tutkimusta. Tietotyö sinällään lisääntyy jatkuvasti.
Hyötyjä ja potentiaalia, jota ala voisi oikeilla panostuksilla tarjota, ovat muun muassa:
- tietotulvan parempi hallinta
- löydetään relevantimpaa tietoa vuorovaikutteisen (oppivan) ja visuaalisen järjestelmän avulla
- Käyttäjälle näytetään perusteet miksi juuri tietyt tiedot näytetään, ja annetaan myös mahdollisuus vaikuttaa näihin perusteisiin; näin käyttäjä voi aidosti ohjata tiedon hakemista ja jalostamista
- tietotyön laatu ja tehokkuus paranevat
- menetelmässä yhdistetään ihmisen luovuus ja ja tietokoneen kyky käsitellä massiivisia ja monimuotoisia tietoaineistoja kontrollin säilyessä ihmisellä.
- tiedonhaun tehostuessa tietotyöntekijöiden aikaa vapautuu päättelyyn, luovaan ajatteluun ja yhteistyöhön.
- testeissä uudenlaisetn tiedonhakujärjestelmän prototyyppi on todettu Googlen scholar.google.comia tehokkaammaksi - tällä hetkellä tiedonhakujärjestelmän prototyyppiin on indeksoitu vain tieteellisiä artikkeleita (valikoiduista tietokannoista, yli 60 milj.); tavoitteena on kuitenkin laajentaa konseptia muunkinlaisen tiedon hakuun
Suomessa on erittäin korkealaatuista ja monitieteellistä tutkimusta alueella (HIIT:istä 7 tutkimusryhmää ja Työterveyslaitoksen Aivot työssä -tutkimusryhmä, www.reknow.fi / Tietotyön vallankumous). Panostuksia alalle olisi saatavissa: Tietotyön vallankumous on TEKESin toinen strateginen tutkimusavaus syksyllä 2013.
Tutkimus
- Mahdollistajat: Uudet tutkimusmenetelmien kehitys. Esim. tekstuaalisten dokumenttien käsittelymenetelmät, mobiilidatan ja sosiaalisen median sekä trendidatan tuomat uudet tutkimusmahdollisuudet.
- Haasteet: Monitieteisyys, tietoaineistojen saatavuus. Eri alojen osaajista koostuvat tutkimustiimit?
- Hyöty: Uudet löydöt historian tutkimuksessa uusilla analyysitavoilla.
Liikenne
- Mahdollistajat: Liikenteen ohjaus , reaaliaikaisen datan lisääntyminen. Reittien ennustaminen. Logistiikan optimointi tavarakuljetuksissa.
- Haasteet: esim. julkiset aikatauluaineistot pirstaloituneina eri puolilla, yhteen saattaminen.
- Hyöty: Turvallisuuden parantaminen, ruuhkien vähentäminen, päästöjen vähentäminen. Matkustamisen helpottuminen. Toimitusaikojen lyhentyminen.
- Use case: Tukholman kaupunki + KHT institute of technology + IBM. US Xpress
Big datan avulla voidaan tavoitella ja saavuttaa monia hyötyjä liikenteen alalla.
- Liikenneturvallisuus
- Liikenteen ja liikkumisen tehostuminen
- Ekologisempi liikenne
- Joukkoliikenteen ja kevyen liikenteen tehostamiseen liittyville ekologisille ratkaisuille on erityistä tarvetta.
- Liikenteen ongelmat ovat globaaleja ja siinä on mahdollista kehittää vientituotteita, esim. liikennekuvan parantaminen, liikenteen analysointi, lyhyen aikavälin liikenne-ennusteiden parantaminen, liikennesuunnittelu ja siihen liittyvät analyysit
Big data on hyödynnettävyys liikennealalla on varsin suuri, Suomella olisi mahdollisuus profiloitua liikenteen kokeiluympäristönä. Tätä jo osin LVM:n liikennepuolella tehdäänkin. Suomessa on myös tehty tutkimusta uudenlaisista liikennejärjestelmistä, esimerkiksi Yhdistelmäliikenne, Ytrips Oy ja Shosta Sulosen tutkimukset Aalto-yliopistossa.
- - Suomen liikenne on pienimuotoista esim. Kiinaan verrattuna
- + Samalla tosin Suomea on helpompi hyödyntää laboratoriotyyppisenä ympäristönä
- + Suomessa ollaan edelläkävijöiden joukossa (ei ainoita) avoimen liikennedatan käytössä
- + Nykyisiä ratkaisuita voidaan parantaa nimenomaan "big data" -tyyppisin ratkaisuin
Suomella on paljon alaan liittyviä mahdollisuuksia ja potentiialia Suomessa ollaan viime aikoina oltu aktiivisia ja alalla on tutkimusryhmiä, joilla on sekä kansallisia että kansainvälisiä yhteyksiä. Toimintapotentiaali on näin ollen hyvä. Liikennealalla liikkuu raha, joten mahdollisuus kansainvälisenkin tason toimintaan on olemassa, jos toimeen tartutaan ennakkoluulottomasti.
Case: Tieliikennepalveluiden markkinapaikka, liikenne palveluna. Aikataulut, yhteydet, tilausautot, taksit, vuokraus yms. Kaikki liikennepalvelut saataisiin yhdestä paikasta. Osittain tähän suuntaan ollaan menossa. Tämä voisi olla virtuaalisesti yksi paikka. Taustalla raksuttaisi varmasti on useampia lähteitä ja palveluja.
Olisi hyödynnettävissä, kunhan yhteistä tahtoa olisi riittävästi Saavutettaisiin kustannussäästöjä ja julkisen liikenteen tehokkaampaa käyttöä Esteenä muun muassa toimijoiden välinen kilpailutilanne.
Voisi kuvitella, että jos jossain niin Suomessa tällainen olisi saavutettavissa Hyödyt esim. 15% enemmän julkisten liikennepalvelujen käytöllä olisi merkittävä etu koko maalle.
Huolto ja muut ennakoivat etäpalvelut (TI)
Huolto ja ennakoivat etäpalvelut ovat yksi osa-alue laajemmassa kokonaisuudessa, josta usein käytetään termiä Teollinen Internet (TI). Tällä tarkoitetaan sulautettujen ja älykkäiden laitteiden ja järjestelmien, niistä jatkuvasti kertyvän datan ja siihen pohjautuvan data-analytiikan sekä ihmisten työn tehokasta yhdistämistä liiketoimintaprosesseissa. Tämä mahdollistaa sen, että tuotanto- ja muut resurssit, tieto, esineet ja ihmiset muodostavat reaaliaikaisesti verkottuneen kokonaisuuden. Sovellusalueita ovat mm. valmistavan teollisuuden prosessit ja niiden optimointi, ennakoiva huolto, energian käytön hallinta, käyttöomaisuuden hallinta ja ennakoiva huolto. Vähintään yhtä suuret hyödyntämismahdollisuudet ovat myös varsinaisen teollisuuden ulkopuolisessa elinkeinolämässä, kuten esim. terveydenhuollossa, kaupan ja logistiikan alueella, rakentamisessa ja kiinteistöjen hoidossa sekä kunnnallisten ja muiden julkisten palvelujen tuottamisessa (energia, vesi, jätevesi...). Yhteistä kaikille sovellusalueille on se, että tavalla tai toisella on olemassa automatisoitu linkki fyysisen maailman ja digitaalisen maailman välillä. Usein tuo linkki syntyy joukosta antureita tai tägejä, joilla voidaan saada tietoa esineiden tai ihmisten tilasta, olinpaikasta ja muista tekijöistä. Kun tätä tietoa yhdistetään ja analysoidaan yhdessä kertyneen historiatiedon sekä muiden tietovarantojen kanssa, voidaan tehostaa merkittävästi nykyisiä toimintatapoja ja -prosesseja sekä luoda myös aivan uusia palveluja ja liiketoimintaa.
- Mahdollistajat: etähuolto, huollon automatisointi, laitteiden itseanalyysi, vikojen ennustaminen (Konecranes) Optimointi yhteistä koko alalle.
- Haasteet: Laajamittaista hyödyntämistä tai esimerkkejä siitä ei vielä olemassa.
- Hyöty: sopii hyvin erilaisille aloille, säästöt, halpatyökorjauksen sijaan korkeamman vaatimustason työtä, Kustannushyödyt, mahdolliset alaan liittyvät (vienti) innovaatiot.
- Use case: Ennakoiva huolto, Kone, GE. Outokumpu.
Suomella olisi mahdollisuuksia muun muassa palveluliiketoiminnan synnyttämisessä teollisen internetin avustuksella ja -ympärille. Palvelu ja huolto yhdistettynä etähuoltoon, automatisointiin, ennakoivaan huoltoon. Merkittävä osa ongelmanratkaisuista ja korjauksista voidaan automatisoida. Tämä toiminta sopii eri teollisuusalueille: Metalliteollisuus, konepajat (esim. Konecranes), tietoliikenne. Kaikki vähänkin arvokkaammat laitteet tai toiminnallisuudet pystyvät itse analysointiin ja ne voidaan testata/analysoida/korjata etäältä. Usein vikaantuminen voidaan jo ennakoida. Tällä saadaan merkittäviä säästöjä ja kompetenssi siirretään halpatyösuunnasta korkeamman kompetenssin vaatimuksiin.
Eri toimialoilla samoja tai samantapaisia tarpeita. Vaatii osaamista ja kombinaatiota erilaisista asioista: Kompetenssi, Anturit, Etäyhteys, Big Data käsittely.
Suomessa on alaa silmällä pitäen hyvä koulutustaso ja kompetenssi, myös toimintaa ja intressi on jo osittain olemassa. Etäinen sijainti markkinoilta ja päämyyntialueilta luonnollista Suomesta. Sopivia teollisuusaloja, joihin big data-lähtöinen palveluliiketoiminta sovellettaviss muun muassa metalli, koneteollisuus sekä tietoliikenne.
Cleantech
Digitalisaatio esim. Cleantech-osaamiseemme liitettynä mahdollistaa uusia innovointi- ja vientimahdollisuuksia mm. jättimäisille ja kasvaville Aasian markkinoille. Cleantechin yleinen merkitys on vahvassa kasvussa resurssiniukassa maailmassa, ei välttämättä aina omana ympäristötekniikan alanaan vaan kaikkeen muuhun liiketoimintaan sulautettuna.
Myös Cleantech-kehitystä silmälläpitäen tarvitaan uusi platform-ajattelua hyödyntävä yhteistyön malli, jolla pienet yritykset voisivat suoraviivaisemmin toimia toimia isojen teollisuusyritysten innovaatiopartnereina ja sitä kauttaa tuottaa runsaasti ja tehokkaasti yksinkertaisia konsepteja/palveluita suuryritysten teknologian (alustat, laitteet) tai datan ympärille
Nopean kansainvälistymisen (ja toki rahoituksen) haasteet käännettävä vahvuuksiksi uusilla vientikelpoisilla innovaatioilla ja palveluilla - Em. cleantechin innovoinnista ja vahvuuksista huolimatta Suomella ei välttämättä juurikaan ole alueelta omia kotimaisia käyttöreferenssejä. Ratkaisuja täytyisi kokeilla rohkeasti ensin myös kotimaassa. Osittain haasteena ovat myös teollisen internetin standardien (ja osin teknologioiden) kypsymättömyys, vaikka tulevaisuuden potentiaalia on paljon.
Markkinointi ja mainonta
Gartnerin mukaan 50% Big Dataan käytettävistä investoinneista menee markkinointiin. Markkinointi on muuttumassa teknologiavetoiseksi. Gartnerin mukaan Chief Marketing Officerit käyttävät vuonna 2017 enemmän rahaa IT:hen kuin Chief Information Officerit.
Big Datan tyypillisimmät käyttötapaukset markkinoinnin ja mainonnan alueella liittyvät kuluttajakokemuksen parantamiseen, sisällön personointiin ja viestinnän kohdentamiseen.
Avaa tähän eri aiheita liittyen Big Dataan ja seuraaviin aiheisiin:
- Consumer Experience Management
- Real-time Bidding
- native advertising
- mobile & video advertising
- location-based advertising
- micro-targeting
- real-time personalization
Läpileikkaavia teemoja
Mydata
Quantified self
Quantified Self –liikkeen juuret ovat Kaliforniassa ja erityisesti Wired-lehden ympärillä. Liikkeen keskeisenä ajatuksena on yksilöllisen mittaustiedon hyötykäyttö terveyden ja hyvinvoinnin edistämisessä. Viime vuosien aikana liike on levinnyt eri puolille maailmaa, ja saanut uusia muotoja. Kyse ei ole enää yksinomaan superterveydestä haaveilevien teknointoilijoiden liike vaan mittaamista istutetaan yhä uusille elämänalueille. Big data ja QS –näkökulmilla on paljon yhteistä, koska QS on yksi mahdollinen big datan tuottaja. Digitaalisten itsenmittausaineistojen arkistointiin tarvitaan uusia ratkaisuja. Tiedon hallinta on turvattu, kun yksilö omistaa tietonsa ja antaa sille käyttöoikeuden halutessaan. Kun itsenmittaajat haluavat jakaa aineistoja myös muille, tiedon käyttö on turvattava tavalla, joka hyödyttää sekä tiedon jakajaa että hyödyntäjää. Itsenmittauksen ympärillä on paljon uusia aloitteita, joita motivoi myös terveydenhuollon toimialamuutos. Suomessa itsemittausteknologioita kehittäneitä, kansainvälisillä markkinoilla toimivia yrityksiä on useita, muun muassa Firstbeat, Suunto ja Polar. Lisäksi alalla on lukuisia lupaavia start up -yrityksiä. Mittalaitteiden avulla ihmiset saavat uudenlaista tietoa itsestään. Itsehoito on aiempaa helpompaa, kun ihmiset voivat mitata kotona verenpainettaan tai seurata unen laatuaan. Tämä voi muuttaa vähitellen terveydenhuollon painopistettä ja lääkärien työtä. Lääkärit voivat keskittyä tiukemmin nimenomaan erikoistuneeseen sairauksien hoitoon, kun sairauksien ennaltaehkäisyyn on uudenlaisia vaihtoehtoja. Toisaalta QS haastaa myös käsityksiä terveydenhallinnasta ylittämällä olemassa olevan terveystoimialan. Itsenmittaajat ovat osoittaneet, että esimerkiksi ajankäyttödata voi olla terveysdataa. Esimerkiksi riippuvuuksia voi tarkastella ajankäytön avulla. Kiinnostavaa on myös terveydentila suhteessa ympäristöntilaan. Voiko ilmanlaatusta ennakoida tulevaisuudessa keuhkoahtaumapotilaan kohtauksen? QS-näkökulma on alkanut levitä myös muille toimialoille, esimerkiksi oman talouden hallintaan tai koulutukseen. Mittatietoa voi käyttää esimerkiksi omaehtoisen oppimisen seurantaan tai tekemään näkyväksi opettajien pärjäämistä eri luokkien kanssa.
Joukkoistaminen ja osallistaminen
Tiedon etsintä
Tietomäärien valtava lisääntyminen luo päivittäisiin työtehtäviin lisähaasteita myös kaikille tietotyöntekijöille. Esimerkiksi tiedonetsintä on alue, jota paremmin tukemalla voidaan saavuttaa merkittäviä kustannussäästöjä. Tutkimusten mukaan loppukäyttäjät etsivät tietoa varsin yksinkertaisilla hakusanoilla ja menetelmillä, eivätkä he useinkaan tarkastele tuloksista kuin 10-20 ylintä listan tulosta (Markey 2007, Twenty-five years of end-user searching, Part 1: Research findings, JASIST, 58(8, 1123-1130). Lisäksi yleisin hakukone Google perustaa hakutuloksensa algoritmiin, joka painottaa suosittuja/linkitettyjä sivuja, joka saattaa joissain tapauksissa vain voimistaa näiden suositummuutta ja vahvistaa vanhoja käsityksiä. Yksinkertaisissa hauissa tämä toimii, mutta tilanteisiin, joissa etsijä haluaa hankkia ymmärrystä uudesta alueesta (eksploratiivisella haulla), Suomessa/HIIT-instituutissa on kehitetty uudenlainen visuaalinen etsintäliittymä SciNet, jossa käyttäjä voi interaktiivisesti ohjata hakutuloksia niihin suuntaan jotka kiinnostavat häntä eniten. Tehtyjen tutkimusten mukaan käyttäjien suorituskyky tiedonhauissa on jopa kaksinkertaistunut tällä uudella käyttöliittymällä. HIITin tutkijaprofessori Kasken mukaan hakukoneen taustalla olevat algoritmit ja perusohjelmistot on tarkoitus julkaista avoimena lähdekoodina vapaasti esimerkiksi startupien hyödynnettäväksi. Kehitetty koneoppimiseen perustuva menetelmä soveltuu tiedekirjallisuuden etsinnän lisäksi mille tahansa alueelle, esimerkiksi sosiaalisen median aineistoille. (Mutanen, A. 2014. Hyvän & pahan tiedon puu. Suomalainen SciNet näyttää senkin, minkä Google salaa, Tiede, Maaliskuu, 50-55)
Ympäristö/lokaatiotieto (sensorit, sensoritieto)
Asioiden ja esineiden Internet (Internet of Things, Industrial Internet) on tekemässä läpimurtoaan parin seuraavan vuoden kuluessa. Jokainen verkkoon kytketty laite tai sensori tuottaa jatkuvasti mittaustietoa edelleen jalostettavaksi. Tällä tavalla syntyvän tiedon määrä on valtava ja hyödyntämismahdollisuudet lähes rajattomat. Yksi keskeinen ongelma tämän tiedon käyttöönotossa liittyy tiedon julkaisemiseen ja omistamiseen; kuinka sensoritiedon omistajat voivat julkaista tietoa niin, etteivät paljasta liikaa itsestään. Esimerkiksi talon huoneiden lämpötilatiedot ja energiankulutus yhdistettynä muihin tietokantoihin, kuten säätilaan, voisi antaa arvokasta tietoa energiayhtiöille ja kuluttajille. Toisaalta sama tieto voi mahdollistaa asunnon käyttöön liittyviä tietoja, jotka taas eivät ole julkisia ja saattavat loukata yksityisyyttä.
Esineiden internet on yksi näkökulma Teolliseen Internetiin, yksi sen keskeinen mahdollistava tekijä. Tämä kappale kannattaa yhdistää TI-osion yhdeksi osaksi.
Toimenpiteet
Yhteistyö eri alojen välillä
Yleisesti jaetaan näkemys tarpeesta hakea datan avulla synergioita eri aloilta. Löydettävä siten toimia, joilla erityisesti yritysten horisontaalista ja vertikaalista verkottumista voidaan edesauttaa siten, että (big ja avointa) dataa jaettaisiin sopivalla alustalla/rajapinnoilla yhteiseen käyttöön ja yhdisteltäväksi uudella tavalla.
Yrityksillä (erityisesti suurilla) on hyödyntämätöntä dataa, mutta ei osaamista/resursseja/ideaa käyttää tätä. Vaatii toimien suuntaaminen: 1. kannustetaan/tuetaan yrityksiä avaamaan rajapintoja dataansa 2. yhteiset kehitysalustat datan jakamiseksi, joista jalostuu uusia lisäarvopalveluja
Haasteena, etteivät yritykset halua jakaa dataansa (”varallisuus”-ajattelu)? Onko parempi ettei siitä saada mitään arvoa kun ei käytetä ja kilpailijat menevät ohi? Asenne jakamistalouteen? Hyödyn/tulonjakomallien puute?
Big datan potentiaalista kertoo jo se, että perusteilla on big data labseja ja tutkimuskeskuksia ympäri Eurooppaa. Suomen on mentävä mukaan kehitykseen, jotta uskottavuutta, yhteistyötä, kokeiluja, tutkimusta, yritysten sovellusosaaminen ja kehitys vauhdittuisi. Osaavien ihmisten välisten yhteyksien rakentaminen katsotaan nyt olennaiseksi ja hyvien käytäntöjen jakaminen eri toimijoiden välillä. Verkostotoiminnan tavoitteet oltava kuitenkin selkeitä: toiminnan on tuettava yritysten ja ihmisten suorituskykyä tuloksia seurattavissa olevalla tavalla.
Selvitetään tarvetta Big data-hubille/labille, erityisesti isojen ja pk-yritysten yhteisille datahankkeille ja datan vaihdolle o esimerkkinä yritysten tuotantodatan ja alan osaajien saattaminen yhteen. (smart data innovation lab, Saksan malli, Erityisalueina labissa industry 4.0, energy, smart cities ja personlised medicine. o esimerkkinä Singapore: social analytics-konsortio kehittää tämän alan työkaluja yhdessä + yritysten yhteistyökonsortio o esimerkkinä GE tarjoaa fasiliteetit pk-yrityksille
Start-uppien bd resurssikeskus. (välineitä ja pääsy aineistoihin etc.) esim. AaltoES kumppanina
Luodaan kansallinen data-analytiikan keskusten verkosto (tutkimuslaitos/yliopistoyhteistyö), josta myös teknologiasiirtoa yrityksiin (menetelmät, työkalut, osaaminen)
Osallistutaan ja jaetaan kansallisesti näkemyksiä EU:n Big/NESSI data foorumin toimiin (saadaan ääni kuulumaan ja verkostoidutaan) o EU Big data PPP ekosysteemin ajatus: olemassa olevaan infrastruktuuriin perustuva ekosysteemi, jossa luodaan myös yhteistyön malleja, fasilitoidaan datan siirtoa (data exchange) ja tarkastellaan samalla miten liiketoiminta/(asiakas) johtaminen muuttuu, kokeiluja big data aineistoilla, jonka avulla kehitetään osaamista, tutkimuksen hyödyntäminen ja työkalujen siirto (research transfer community)
Kehitetään joukkoistamiseen perustuvia malleja, joista parhaillaan syntyy uudentyyppisiä laajoja ekosysteemejä. Verkottuneet käyttäjät (connected users) ovat nyt big data kehityksen keskiössä, sillä se tarkoittaa useilla sektoreilla tiedon hyödyntämisen nopeutumista. Esim. liikenteessä käyttäjiltä kerättyä tietoa yhdistetään liikenteen hallintaan.
Koulutus
Osaamisen kehittäminen on olennaisin big dataa edistävä ja samalla kehitystä rajoittava tekijä. Tarvitaan sekä teknistä että toimialaspesifistä osaamisen kehittämistä. Osaamisessa tärkeää erilaisten datamuotojen käsittely ja jalostaminen (“blended human and algoritmic data processing). Datatieteilijältä odotettavat taidot (kuvailua edellytyksissä?) ovat poikkitieteellisiä, joten tiimien (osaajapoolit) rakentaminen voisi olla yhtenä ratkaisuna osaajapulaan?
Tutkintoperusteisen ja käytännönläheisen opiskelun kehittäminen ovat molemmat tarpeen. Osaamisen kehittäminen (EU näkemys): 1. tutkintojen kehittäminen (Curriculum, Bolognan prosessi, Grand Coalition of skills), 2. täydennyskoulutus, 3. kokeilut ja kurssit (training centers). Tavoitteena on luoda Euroopassa yliopistojen verkosto datataitojen osalta.
Vaikutetaan siihen, että peruskoulun opetussuunnitelmiin sisältyy ohjelmointiin liittyvää opetusta vuonna 2016. + open source teknologian levittäminen peruskouluun.
Opettajankoulutuksen kehittäminen (big data opetustaidot)
Ohjelmointiopintojen houkuttelevaksi tekeminen ja promoaminen
Koordinoidaan/paketoidaan/yhdistetään kansallisesti big data koulutusohjelmia (jo käynnistyneet, suunnitteilla olevat). Alan yritykset, professorit ja asiantuntijat muodostavat näkemyksen tarvittavista vähimmäistaidoista eri rooleissa (roolien kuvaus edellytyksissä?), jotka tulevat mukaan tutkintoihin (ammattikorkea, yliopisto, täydennyskoulutus)
Osallistutaan EU-laajuisen bd yliopistoverkoston luomiseen
Soveltava koulutus yrityksissä
Soveltavan koulutuksen malleja kehitettävä big data asiantuntijaksi kasvamiseksi: yrityksissä erilaiset harjoittelujaksot, kokeilut, projektit, täydennyskurssit yms.
Ohjelmointi/tietojenkäsittely/bisnesprosessien opiskelijat yrityksiin bd harjoitteluun, projekteihin, opinnäytetyöt (vrt. Aallossa diplomityöparit)
Tarvekartoitus: kuinka paljon ja millaista osaamista yritykset tarvitsevat (big data yritysklusteri/foorumi)
Kokeilut ja rahoitus
Kansallista tukea ja verkostoa EU-tukiohjelmien hyödyntämiseen vahvistetaan erityisesti big data painotuksella (Horizon verkosto, Tekes, kehittäjäorganisaatiot) Erityisesti hallitut kokeilut joihin liittyy esim. mobiilipaikantaminen
Disruptio datan vaikutuksesta tulevat voimakkaasti myös liiketoimintamalleihin: kokeilevat kehityshankkeet hyödyn ja tulonjaonmallien kehittämiseksi (vrt. myös yritysten yhteistyön aktivointitoimet)
Pääomaehtoisen rahoituksen saatavuuden edistäminen (miten yksityiset pääomasijoittajat mukaan? + Tekes pääomasijoitus Oy -> konsortiot)
Mydata
MyData selvityksen malleja testataan valituilla alueilla kehityksen vauhdittamiseksi ja uusien tietomallien yleistymiseksi eri alojen yritysten avulla. Pitkällä aikavälillä luodaan alustaa MyDatalle, johon yksilö voi omaa tietoaan kerätä ja haluamallaan tavalla jakaa sekä hyödyntää.
Yhteistyö Iso-Britannian MiData-labn kanssa Midata-kehityksen vahvistamiseksi
Datan saatavuus
Avoimet rajapinnat ovat myös big datan hyödyntämisen mahdollistajia, joten open API kehitystyötä yrityksissä vahvistettava sekä luotava tapoja yhdistää julkista avointa dataa ja yritysten dataa (kannusteet yrityksille avata? mitä tarjoaa?)
Henkilötietojen osalta tarvitaan kansallinen anonymisoinnin järjestelmä
Datan hyödyntämiseen ratkaisuja etsiviä ja kehittäviä henkilöitä myös hallintoon, esimerkiksi kumppanikoodarimallin mukaisesti, College-to-govt harjoitteluohjelmat tms.
Yhteentoimivuuden kehittäminen esim. datan jakamisen standardit esimerkiksi kaupungit
Datan käyttöä tukevat (”curation”) toimet?
Kansallisen dataportaalin hyödyntäminen big data kanavana? (Avoimen tiedon ohjelma. VM) Miten sopii big datan kuvaukseen?
Velvoitetaan (VM) virastoja tunnistamaan selvät alueet, joilla voisi saada big datalla hyötyjä. Tuetaan virastojen pilottiprojekteja (Avoimen tiedon ohjelma/Kehykset).
Sääntely
Sääntelyn kehittämisen perusperiaatteena tässä on se, ettei ole markkinoille tulon esteitä, kannusteita datan saatavuuteen ja jakamiseen sekä yleisesti huomioidaan bd spesifien edellytykset säädösvalmistelussa. Onko bd edellytyksissä (framework conditions) erityispiirteitä/tarpeita?
Tehdään selvitys big datan käyttöön vaikuttavista laeista
Varmistetaan, että EU:n tietosuoja-asetus mahdollistaa big data kehityksen yksityisyydensuojaa vaarantamatta
Big data ”etiketti”
Datatietoisuus
Big datan hyödyntäminen kaikilla sektoreilla nyt olennaista, joten miten lisätään tietoisuutta ja ensimmäisiä askeleita kohti datan tunnistamista, kokeilua ja kehitystä. Big data teknologiakehitys evoluutiota, mutta bisnesprosessien kehitys käy läpi nyt revoluutiota, joten toimet erityisesti ymmärtämään liiketoiminnan muutosta.
”Datalähettiläät”: big data- tietoutta ja osaamista yritysten ja hallinnon käyttöön. (mm kansainväliset vierailijaluennot ja osaajavaihto)
Luodaan alan yrityksiä, tutkijoita ja asiantuntijoita kokoava avoin Big data-klusteri sekä toimintaa tämän ympärille (Tekes, Teknologiateollisuus, Tekniikan Akateemiset, yritykset tms. taho).
Suomen jokaisen organisaation päätöksenteon tulisi muuttua tietoon perustuvaksi (data driven) sen sijaan että päätökset tehtäisiin mutu-pohjaisesti. Maailmalla on tietopohjaisesta päätöksenteosta esimerkkinä mm. amerikkalainen autonvalmistaja Ford, joka selvisi autoteollisuuden kriisistä siirtymällä data-driven päätöksentekoon.
Tällainen tietoon perustuva päätöksenteko vaatii tuekseen toimivan tiedonkeruun ja analysoinnin. Sama tiedonkeruu ja -analysointi palvelee myös open data -aloitteita.
"Julkisen hallinnon organisaatioissa voidaan nimetä datavastaava, jonka tehtäviin kuuluu datan keruun ja analysoinnin järjestäminen. Yksityisiä yrityksiä ja muita yhteisöjä varten voidaan järjestää valtiovallan taholta maksullista tai maksutonta neuvontaa."
Teknologiat ja standardit
Kehitystarpeita: datan varastoinnin tekniset standardit, datan välittämisen/integroinnin (data exchange) tavat. Teknologiakohtaisia ekosysteemejä on syntymässä. Datan harmonisoinnin tarpeet, jotta luodaan yhteen toimivuutta
Huom. datastandardeja (esim INSPIRE) on jo olemassa, joten näiden hyödyntäminen. Miten soveltuvat big dataan?
Tunnistetaan keskeiset standardointiprosessit joissa tulee olla mukana sekä organisoidutaan toimimaan näissä
Standardien luominen erityisesti datan varastointiin (storage) ja siirtoon (exchange) kehittää datan käsittelyn tekniikoita, työskentelymetodeja ja tehokkaita algoritmeja.
Tietosuoja ja yksityisyys on myös teknologinen kehityskysymys (privacy technologies) Panostetaan tieto/yksityisyydensuojan ratkaisujen teknologiakehitykseen (Tekes?)
Infrastruktuuri
Varmistetaan, että perusedellytykset kunnossa (viestintä- ja tiedonsiirtoyhteydet, pilvikapasiteetti yms. mitä big data infrassa tarpeen niin yksittäisen toimijan kuin yhteishankkeiden/toiminnan kannalta)
Infrakehityksen koordinaatio tarpeen, jotta tehokuutta ja yhteentoimivuutta?
Jaettujen infrojen kehittäminen(shared computing infrastructure) Yhteisiä datan hallintasysteemejä (ylläpito ja laadunvarmistus) Arvioinnin kehittämien erilaisista analyysimenetelmistä Datapalvelujen ekosysteemin luonti (open cloud Massachusettsin tapaan ja datapalvelujen ”biotope” esim. jakelupiste, kauppapaikka ja julkaisukirjastot sekä datasovellusten edistäjä (incubator) eli ovat perustaneet ODIn UKn tapaan)
Sidosryhmien toiminta verkostona (network stakeholders) – Keskeisten kansallisten toimijoiden tunnistaminen ja organisointimallin luominen infran kehittämiseen?
Kokeilulaboratorio, jossa voidaan testata teknologioita ilman omaa mittavaa panostusta
TOIMEENPANO Strategian toimeenpano: Luodaan roadmap toimien vastuista, etenemisjärjestyksestä ja aikatauluista. Vahvistetaan strategian toimeenpano valtioneuvoston periaatepäätöksellä tai hallitusohjelmassa. Ryhdytään toimiin!
Vaikutukset
Katso myös
Viitteet