MIKÄ ON MONIÄÄNISYYSMITTARI?

Moniäänisyysmittari on työkalu, joka analysoi mediatalojen sisältödataa kuten uutisarkistoja tai verkkotekstejä. Se tunnistaa teksteistä erilaisia toimijoita ja heihin liittyviä tietoja (sukupuoli, titteli, puoluekanta) ja kertoo yksinkertaisin luetteloin ja graafisin esityksin, keitä mediassa on haastateltu. Mittari on mediatalojen sisäisessä käytössä, eli jokainen käyttäjätaho saa tietoja vain omasta uutisaineistostaan.

Mittarista on olemassa Uutisraivaaja 2019 -mediainnovaatiokilpailussa kehitetty demoversio. Tällä hetkellä mittarista nähdään esimerkiksi, ketä mediassa on haastateltu esimerkiksi teemasta ”NATO”; miten haastateltavien sukupuolet jakautuvat, mitkä puolueet pääsevät aiheessa ääneen ja millaisin tittelein haastatellut esiintyvät. Samoin voidaan selvittää vaikkapa, keitä tutkijoita haastatellaan mediassa eniten tai missä määrin esimerkiksi koulutukseen liittyvissä aiheissa pääsevät ääneen opettajat, rehtorit, sivistystoimenjohtajat, tutkijat tai ministerit.

MITÄ TEKNOLOGIAA MITTARI HYÖDYNTÄÄ?

Moniäänisyysmittari perustuu NLP-kieliteknologiaan (Natural Language Processing). Mittarin demoversion tekstintunnistus perustuu libvoikon morfologiseen analyysiin, väestörekisterikeskuksen etu- ja sukunimilistaan sekä käsin kirjoitettuihin jäsennyssääntöihin.

MITÄ MITTARILLA SAA SELVILLE?

Palvelu tunnistaa datasta haastateltavat; heidän nimensä, nimiin liittyvät tittelit sekä nimiin liittyvät puoluekannat silloin, kun ne on tekstissä mainittu. Lisäksi mittari tunnistaa myös henkilöiden sukupuolen etunimien perusteella. Lisäksi mittarissa on uutistekstien sisältöihin liittyvä hakuominaisuus. Hakuja voidaan tehdä yhdellä hakuehdolla koko aineistoon (esim. ketkä ovat haastatelluimmat henkilöt koko media-arkistossa tai miten haastateltavien sukupuolet jakautuvat) tai eri hakuehtoja yhdistellen (esim. miten eri puolueita edustavat haastateltavat jakautuvat maahanmuuttoaiheisissa jutuissa vuonna 2016). Mittarin hakuominaisuudet ovat monilta osin kesken, samoin tulosten luotettavuuden validointiprosessi.

JOURNALISTISEN SISÄLLÖN MITTAAMISESTA

Mediankäyttäjien lukutottumuksia ja käyttäytymistä seurataan tarkkaan. Digitaalisten jakelukanavien ansiosta mediatalot tietävät hyvin tarkkaan, mitä yleisö kuluttaa, mitkä jutut sitouttavat ja minkä parissa kulutetaan aikaa. Tieto yleisön käyttäytymisestä auttaa myös erilaisten suosittelualgoritmien rakentamisessa. On esitetty, että samanlainen digiloikka pitäisi tehdä journalismin sisällön analysoinnissa kokonaisuutena (suomenlehdisto.fi). Yhteiskunnan moniarvoistuessa etenkin journalismin moninaisuudesta ja moniäänisyydestä on tullut sekä poliittisesti että median itseymmärryksessä tärkeä tavoite. Journalistisen sisällön automatisoitu analysointi on ollut kuitenkin hankalaa.

Viestintäministeriön tilaamassa tutkimuksessa vuodelta 2018 todettiin, että saatavilla olevat median moninaisuutta kuvaavat mittarit kertovat eniten medialähteiden määrästä ja median omistajien ja sisällöntarjoajien moninaisuudesta sekä, yllä mainitusta syystä, median käytön monipuolisuudesta. Sen sijaan sisällöllisen moniarvoisuuden mittaamiseen ei löydetty olemassa olevaa dataa, vaan päädyttiin ehdottamaan laadullisia, rajattuun aineistoon perustuvia mittareita. Sama ongelma on vaivannut EU-lähtöistä Media Pluralism Monitoria, jonka tehtävänä on arvioida median moninaisuuteen kohdistuvia riskejä maakohtaisesti. MPM-arviointia on kehitetty ja tehty vuodesta 2012-14 lähtien (Suomessa v:sta 2015) ja sen journalistiseen sisältöön kohdistuvia indikaattoreita on jouduttu useaan kertaan karsimaan saatavilla olevien tietojen puuttuessa.

Journalistisen datan lisääntyessä erilaisia avauksia on kuitenkin nähty. Hyvänä esimerkkinä on mediassa esiintyvien ihmisten binääriseen sukupuolten tasa-arvoon liittyvä kehityskulku. Perinteikkäin tekijä tällä kentällä on Global Media Monitoring Project (GMMP), jota on tehty vuodesta 1995. Tutkimuksessa monitoroidaan maailmanlaajuisesti naisten ja miesten osuutta uutisissa esiintyvistä henkilöistä. Tutkijat tekevät arvioinnin käsin tarkasti rajatuista aineistoista. Muutama vuosi sitten ruotsalainen Prognosis automatisoi tämän laskennan Tasa-arvobotillaan, joka kertoo päivittäin naisten ja miesten nimien osuudet eri medioiden verkkouutisissa. Ensimmäiset medioiden omaan käyttöön otetut sukupuolimittarit olivat uutisten arvoisia vuonna 2018 (hs.fi). Edistyneempiä sukupuolimittareita edustaa esimerkiksi kanadalainen Gender Gap Tracker -projekti, joka on tekniikaltaan samantyyppinen kuin Moniäänisyysmittari.

Moniäänisyysmittarin ideana on ollut selvittää, kuka pääsee ääneen journalismissa. Ajatuksena on, että kun median haastateltavavalinnat tehdään näkyväksi, niitä on helpompi kehittää. Tällöin ei riitä, että tiedossa on pelkästään naisten ja miesten osuudet haastateltavista. Yhtä merkittävää tai jopa tärkeämpää on tietää, ketkä asiantuntijat kutsutaan selittämään mitäkin aiheita, mitkä tahot yhteiskunnasta pääsevät eniten ääneen tai mitkä puolueet saavat sanansijaa missäkin aiheissa. Olennaista on myös erottaa, mikä on haastateltavan sanojen painoarvo: vilahtaako henkilö jutussa vain ohimennen vai saako hän toimia jutun pääasiallisena lähteenä.

Nämä kysymykset ovat osin laadullisia, ja ne ovatkin olleet pitkään journalismintutkimuksen peruskauraa. Koneelliseen analyysiin perustuvan mittarin kyky vastata tällaisiin kysymyksiin on rajallinen. Silti Moniäänisyysmittari tarjoaa tutkimuksellekin jotain ainutlaatuista. Big dataa haarukoiva mittari automatisoi perustason analyysityön, mikä ennen tehtiin käsin tutkijoiden työpöydillä, ja vapauttaa näin aikaa laadulliseen analyysiin. Moniäänisyysmittarin ominaisuus on, että linkki yksittäisiin juttuihin säilyy, jolloin analyysiä voi lopulta tehdä vaikka yksittäisten ilmaisujen tasolla. Tulkintojen ja johtopäätösten tekeminen jää edelleen tutkijoiden ja median ammattilaisten tehtäväksi.

matleena.ylikoski (at) tuni.fi