Big data ja kulttuuripolitiikka – teknologiaa, analyysiä ja mytologiaa*

Mitä big data on ja mitä se merkitsee kulttuuripolitiikan näkökulmasta? 

Big datalla viitataan äärimmäiseen suureen ja nopeasti karttuvaan tiedon määrään, jonka kerääminen, tallennus ja analyysi vaativat uusia, perinteisistä menetelmistä poikkeavia käsittelytapoja. Internetiin kerääntyy dataa jatkuvasti esim. digitaalisten palveluiden ja verkkokaupan käytöstä, sosiaalisesta mediasta, digitaalisista arkistoista ja rekistereistä sekä yritysten liiketoimintaan liittyvistä ohjaus- ja raportointijärjestelmistä. Big dataa on kerätty esimerkiksi Roskilden festivaaleilla, jossa on testattu mobiililaitteissa syntyvän datan käyttöä ja analyysia festivaalin järjestelyjen tehostamisessa, ohjelmiston suunnittelussa ja siten kävijöiden festivaalikokemuksen parantamisessa.

Big data kuvaa yksityiskohtaisesti ihmisten jokapäiväistä elämää ja sillä on siksi voimakkaita kulttuurisia, poliittisia ja taloudellisia merkityksiä ja vaikutuksia.  Yhtä paljon kuin tiedon määrää kuvaavana terminä, big dataa käytetään tiedon hyödyntämistä kuvaavana käsitteenä. Big data merkitsee parhaimmillaan myös tiedon demokratisoitumista. Big data sisältää avointa dataa ja avoin data on usein big dataa. Kulttuuripolitiikan kannalta potentiaalisesti mielenkiintoista - joskaan ei välttämättä ainakaan kokonaisuudessaan avointa – dataa pitävät hallussaan esimerkiksi sosiaalisen median yhtiöt ja lippukaupat.

Dataa on siis saatavilla, mutta mitä sillä tehdään? Big datan hyödyllisyyttä on korostettu erityisesti päätöksenteon pohjana jatkuvasti muuttuvassa toimintaympäristössä. Se voi monipuolistaa ja tarkentaa myös kulttuuripolittiisen päätöksenteon tueksi tuotettavaa tietoa. Reaaliaikainen tieto vaatii kuitenkin uusia lähestymistapoja mittaamiseen, analyyttisiä välineitä ja taitoja, sekä päätöksentekomalleja. Datatietoisuutta. Brittitutkijoiden mukaan (Counting What Counts, 2013) kulttuurisektorilla vallitsee tällä hetkellä vain rajallinen strateginen ymmärrys tiedon roolista ja merkityksestä. Kulttuuriorganisaatioiden tulisi olla yksinkertaisesti tietoisempia hallussaan olevista aineistoista, vaikka se ei olisi erityisesti isoa dataa.

The Guardian -lehdessä henkilökohtainen data (omadata, mydata) nostettiin vuoden yhdeksi 2016 taiteen, kulttuurin, luovuuden ja teknologian trendiksi. Omadatan näkökulma korostaa henkilökohtaista dataa hallussaan pitävien organisaatioiden vastuuta ja läpinäkyvyyttä. Myös tavallisille ihmisille, digitaalisten jälkien jättäjille, tulisi tarjota enemmän mahdollisuuksia hallita itseään koskevien tietojen käyttöä. Henkilökohtainen data voi mahdollistaa erilaisten sisältöjen kehittämisen myös kulttuuripalvelujen tarjonnassa, mieluiten yhdessä käyttäjien kanssa. 

Big data korostaa asiakkaan näkökulmaa. Kulttuurin kentällä ja kulttuuripoliittisessa päätöksenteossa sitä voidaan hyödyntää paitsi yleisön segmentoimisessa sekä palveluiden kehittämisessä ja suuntaamisessa, myös tiedon jakamisen, läpinäkyvyyden ja käytettävyyden lisäämisessä sekä johtamisen tukena. Big data voi vaikuttaa myös taiteellista sisältöä koskevaan päätöksentekoon – kuten Roskildessa. Tätä aihetta tulisi ehdottomasti tutkia tulevaisuudessa tarkemmin.

Big data on dataa siinä missä muukin data ja siihen liittyy vahvuuksia ja heikkouksia sekä erilaisia arvoja. Big datan mytologiaa luovat sille asetetut odotukset yhteiskunnallisten haasteiden ratkaisussa. Laajojen datamassojen sovellusmahdollisuudet nähdään periaatteessa rajattomina. Suuria, eri lähteistä ja eri tilanteissa syntyviä data-aineistoja yhdistämällä voidaan uudella tavalla tunnistaa asioiden ja ihmisten välisiä suhteita, yhteyksiä ja trendejä. Kun ihmisten käyttäytymistä ymmärretään paremmin, myös laadullisten vaikutusten arvioiminen ja tulevaisuuden ennustaminen voi tulla helpommaksi. Suomessa esim. Liikenne- ja viestintäministeriö (Big data -strategia, 2013) näkee big datan merkityksen julkishallinnon päätöksiä ohjaavien mittareiden kehittämisessä merkittäväksi. Sen mukaan big datan avulla voidaan laatia aiempaa edistyneempiä ja ennakoivia mittareita ja mahdollistaa myös hienojakoisten signaalien löytyminen organisaatioiden tietomassoista mittareiden kehittämisen tueksi. 

Big datan heikkouksia ovat erityisesti sen luotettavuus ja totuudenmukaisuus. Missä määrin big data todella kuvastaa todellisuutta? Big datan oleellisuus ja arvo riippuvat aina käyttäjästä, kontekstista ja ajasta. Tutkijoiden haasteena myös on, mitä saatavilla olevasta datasta osataan tai halutaan kysyä. Merkitykselliset vastaukset vaativat mielekkäitä kysymyksiä.

Tärkeää on ymmärtää kysymykset tiedon hallinnasta ja tietoon liittyvistä oikeuksista. Minkälaista tietoa milläkin taholla on hallussaan, miten ja mihin sitä käytetään ja mitkä ovat datan käyttöoikeudet? Kenellä on resursseja (teknologiaa, osaamista, rahaa) hyödyntää big dataa? Tiedon hallinta - etenkin standardien puuttuessa ja kaupallisten intressien ristipaineessa - on vallankäyttöä ja erilaiset resurssit vaikuttavat siihen, minkälaisia tutkimustapoja ja näkökulmia (myös vääristymiä) big data ja sen analyysi tuottaa. Aina jää jäljelle elementtejä, joita data ei tavoita.

Big datasta puhuttaessa täytyy myös muistaa, että datan ei tarvitse olla suurta ollakseen merkittävää. Kaikkea ei voi mitata eikä mallintaa. Laadullisten aineistojen merkitys korostuu tietomassojen vastapainona. Kulttuuripolitiikan kannalta nimenomaan perinteisten ja uusien aineistojen yhdistäminen on big datan suurin mahdollisuus. Erityisesti big datan analyysiin tarvittavan osaamisen puuttuminen kuitenkin hidastaa käsitteen konkretisoitumista ja jalkautumista kulttuuripolitiikan käyttöön. Siksi pyrimme myös Cuporessa kehittymään tällä saralla.

*)Otsikko on lainattu artikkelista Boyd & Crawford 2012, Critical Question for Big Data: Provocations for a Cultural, Technological and Scholarly Phenomenon. Julkaisussa Information, Communication & Society 15:5, 662-679.

 

Anna Kanerva

Tutkija, FM, YTM
Tämä sähköpostiosoite on suojattu spamboteilta. Tarvitset JavaScript-tuen nähdäksesi sen.
Anna Kanerva