Data-avaruudet ovat osa datatalouden laajempaa kokonaisuutta. Data-avaruus on toimijoiden tai järjestelmien verkosto, joka on luotu datan jakamista ja vaihtoa varten, ja joka toimii yhteisesti sovittujen periaatteiden ja pelisääntöjen pohjalta. Tällaisia datan jakamista ja hyödyntämistä edistäviä data-avaruuksia kehitetään muun muassa liikenteen, terveyden, energiasektorin, maatalouden ja julkisen sektorin toimialoilla. Data-avaruuksien avulla on tarkoitus rakentaa yhteentoimivuutta myös eri sektoreiden välillä. Data-avaruus mahdollistaa toimialan sisäiset ja toimialojen väliset datavirrat noudattaen reilun datan jakamisen periaatteita, datan monikäytön, tiedonhallintakokonaisuuksien räätälöinnin loppukäyttäjäkohtaisesti, liiketoimintaekosysteemit ja tarjolla olevien teknologioiden ja palvelujen helpon löytämisen ja käyttöönoton.

Data-avaruuksien yleiset periaatteet mahdollistavat tiedon käytön yli toimialojen, organisaatioiden ja maantieteellisten rajojen ja ovat avainasemassa tulevaisuuden globaalin digitaalisen talouden innovatiivisissa datapohjaisissa prosesseissa, tuotteissa ja palveluissa. Data-avaruudet ovat hallittuja dataekosysteemejä, joissa luotettavat kumppanit soveltavat yhteisiä korkeita standardeja ja sääntöjä tiedon tallentamiseen ja jakamiseen. Tietoja ei tallenneta keskitetysti, vaan ne sijaitsevat hajautetusti tiedon omistajilla ja jaetaan vain tarpeen mukaan. Sekä organisaatioilla että ihmisillä on itsemääräämisoikeus tietojensa käyttöön (datasuvereniteetti) ja ne itse myöntävät pääsyn ja käyttöoikeudet tuottamiinsa tietoihin. Data-avaruuksien luominen edellyttää ylätason koordinointia, koska kaikkien osallistujien on hyväksyttävä standardit, politiikat ja säännöt.

Data-avaruus on kokonaisuus, joka sisältää mahdollistavia teknologioita, kuten Datanhallinta-asetuksen mukaiset datanvälityspalvelut. Datanvälityspalvelun tarjoaja on ns. ”dataoperaattori”, joka toimii vastaavasti kuin teleoperaattorit. Datanvälityspalvelu ei saa hyödyntää siirtämäänsä dataa omiin tarkoituksiinsa, mutta voi kuitenkin hyödyntää toiminnassa syntyvää metadataa, eli datan “taustatietoja”, edistääkseen datatalouden kehittymistä. Sen rooli on myös edistää luottamusta datatalouteen varmistamalla suostumukseen perustuva datan välitys ja käyttöoikeus (ns. suostumuksen hallinta).


Data-avaruus on Data-avaruus ei ole
Data-avaruus on työkalu ekosysteemeille, jonka avulla ekosysteemitoimijat voivat siirtää dataa luotettavasti ja turvallisesti. Data-avaruus ei ole sama asia kuin ekosysteemi eli toimijoiden yhteistyöverkosto.
Data-avaruuksissa datan oikeuksien haltijat päättävät kuka heidän dataansa saa käyttää ja millä ehdoin. Data-avaruus helpottaa myös datan käytöstä saatavan arvon jakamista eri toimijoiden kesken. Data-avaruuteen osallistuminen ei pakota datan avaamiseen tai kontrolloimattomaan jakamiseen ilman korvausta.
Data-avaruuden määrittää sen sääntökirja, jota kaikki osallistujat noudattavat. Data-avaruutta ei määritä sen tekninen toteutus. Sama tekninen infrastruktuuri voi tukea useita eri data-avaruuksia.
Data-avaruus on hajautettu digitaalinen järjestelmä. Data-avaruus ei ole yhden tahon hallinnoima data-alusta.
Data-avaruus on skaalautuva datan jakamisen ratkaisu, mihin on sopimuksellisesti ja teknisesti helppo liittää mukaan uusia osallistujia ja uusia käyttötapauksia. Data-avaruus ei ole vain kahden tai muutaman toimijan räätälöity ratkaisu datan jakamiseen tiettyä tarkoitusta varten.
Data-avaruus tukee yleensä useita käyttö- tapauksia, tekee niiden toteuttamisesta kustannustehokasta ja mahdollistaa verkosto- vaikutukset, kun käyttötapauksiin liittyy osin samoja toimijoita ja samoja datalähteitä. Data-avaruus ei ole yhtä kuin käyttötapaus.
Data-avaruus mahdollistaa oikeudellisen varmuuden datan käsittelyyn. Data-avaruus ei ole pelkästään tekninen ratkaisu datan siirtämiseen.

Data-avaruuden keskeiset piirteet. Lähde: © Sitra 2024, Sitran selvityksiä 240, Suomalaisten data-avaruuksien tilannekuva – Edelläkävijöiden opit datatalouden infrastruktuurin kehittämiseen.