Filmi- ja meediablogi

Andres Karjus: "Kõik inimesed ei pea olema andmeteadlased, aga on oluline teada, mis selles valdkonnas on võimalik ja mis ei ole"

TLÜ CUDANi (kultuuriandmete analüüsi keskuse) teadur Andres Karjus avab, mida ta nüüdismeedia õppekava meediauuringute mooduli üliõpilastele loeb ning kuidas õpitakse ülikoolis meediaandmetega ringi käima.

nüüdismeedia meediauuringute moodul

palun ütle sissejuhatuseks lühidalt – millega CUDANi keskus tegeleb? 

Me oleme kultuuriandmete analüüsi labor. See tähendab, et kõik meie projektid on seotud erinevate kultuuri aspektidega: keeleandmed kõige laiemas mõttes, samuti meediaandmed, kunsti- ja kunstielu peegeldavad andmed, avaandmed nende kõige erinevates vormides. Meie projektid on interdistsiplinaarsed ja sünnivad koostöös väga erinevate erialade ekspertidega. Mina näiteks olen hariduselt keeleteadlane, aga ma teen koostööd kunstiajaloolastega kes tegelevad suurte kunstikogude uurimisega, ajaloolastega kes uurivad ajalooarhiive, sotsiaalteadlastega kes uurivad meediaarhiividesse talletatud andmeid, filmifestivalide tegevust peegeldavaid andmestikke. CUDAN on selline koht mis toob kokku inimesed kes töötavad andmetega erinevates eluvaldkondades. 

Sina koos teiste CUDANi teadlastega loed nüüdismeedia magistrantidele kursuseid "Kultuuriandmete analüüs I ja II". Miks on Sinu arvates oluline õpetada andmetöötlust inimestele kes töötavad meediavaldkonnas? 

Me elame maailmas kus andmeid tuleb aina juurde. Mistahes elualade inimesed peaksid oskama natukenegi meetodeid mille abil teha tänapäevaseid sotsiaaluuringuid ja analüüse selleks et tunda ära ja defineerida oma valdkonnas esinevaid probleeme. Ja mis ka oluline - teha nende kohta õigeid järeldusi. Järjest rohkem läheb vaja oskust näha n-ö suurt pilti mida on andmeanalüüsi abil väga mugav kirjeldada. 

Meie kursustel on osalenud väga erinevaid inimesi, kes kõik juba töötavad või on peale lõpetamist asunud tööle eri meediaorganisatsioonides. Näiteks: meediaorganisatsioonidele on väga oluline teadmine sellest kuidas nende sisu tarbitakse ja millistel platvormidel on selle jagamine kõige kõige tõhusam. Samuti teadmine sellest, millist sisu toota, millised on auditooriumi ootused televisioonile ja ka erinevatele ristmeedialistele platvormidele kus erinevat teksti-, foto ja videosisu pakutakse. Kultuuriandmetena tuleb käsitada ka erinevaid turundusega seotud andmeid, olgu siis tegemist online-meedia auditooriumi uurimisega, teatri, kino või hoopis mõne turundusliku sotsiaalmeedia sisu puudutava aspektiga. 

Kas meediaandmetega töötamine eeldab mingit spetsiifilist programmeerimisoskust? 

Meie kultuuriandmete analüüsi kursus on näide sellest, et igaüks saab hakkama. See kursus koosneb kahest poolest. Esimeses osas õpetame erinevaid tehnilisi oskusi millega probleeme lahendada: kahte programmeerimiskeelt, Pythonit ja R-i. Mõlemad saavad väikse sissejuhatuse, minu poolt ennekõike seda mis käsitleb R-i. Ja siis veel mitmeid selliseid võrdlemisi spetsiifilisi programme, et inimesed saaksid aimu kuidas midagi millega on võimalik teha. Ja oleks ka mingi valik, et kas, kas ma teen selle või teise asjaga. 

Kultuuriandmete analüüs II loetakse teisel sügissemestril. Siis toimub juba töö gruppides. Tudengid rakendavad kevadsemestril õpitud tehnilisi oskusi mingite konkreetsete probleemide lahendamisel. Grupid valivad konkreetse andmestiku, meetodi, defineerivad probleemi ja meie juhendamisel siis pakuvad erinevaid lahendusi. See ei tähenda, et meie tudengitest saavad programmeerijad, aga nad oskavad teha lihstamaid operatsioone ja visualiseerimisi, neil ei ole hirmu andmetöötluse ees ja nad teavad et statistiliste mudelite abil on võimalik vastata paljudele küsimustele. 

Oluline on ka rõhutada, et andmeanalüüsi oskused on vajalikud mitte ainult statistilises mõttes, vaid ka andmete tõlgendamiseks mistahes valdkonnas. Majanduses, kultuuri- ja meediauuringutes, sotsioloogias ja politoloogias. Tänapäevane ühiskondlike protsesside mudeldamine on andmepõhine ja kõige olulisem on osata küsida õigeid küsimusi.

Milline on meediaandmete analüüsis peituv majanduslik potentsiaal? 

Andmeanalüüsi abil on võimalik aru saada, millist sisu inimesed soovivad ja mis neid huvitab. Ja ka sellest, mis on hetkel ühiskonna ja avalikkuse jaoks oluline väärtus mille kajastamine aitab ühiskonda edasi. 

Kas sul on ka mõni näide mõnest Eesti meediamajast mis on saadud inspiratsiooni andmeanalüüsist ja rakendanud seda oma programmi tootmisele?

Jah, meil on näide koostööst Ekspress Meediaga, kellel oli huvi meedia tasakaalustatuse vastu. See on asi mida saaks teha nii käsitsi, et loed hästi palju artikli läbi ja siis üritad seda kuidagi kokku võtta. Meie pakkusime välja, et seda võiks teha andmeanalüüsi ja masinõppe toel. Esialgsed tulemused näitasid, et meediaandmete masinanalüüs võiks toimida isegi poliitiliste vaadete tasakaalu mõõtmise vahendina. 

Ekspress Meedia sai sellest uuringust sissevaate sellesse, millest nende enda tekstid koosnevad. Antud juhul tegelesime ühe konkreetse poliitilise teemaga milleks oli migratsioon, sisseränne ja pagulaskriis. Me hindasime masinanalüüsi abil selle valdkonna kajastamist mitme aasta vältel ja näitasime et selline lähenemine on võimalik ja töötab päris hästi. 

Kas võib väita, et masinanalüüsi mudelite rakendamine meediaandmetele on tulevikuvaldkond millest ei saa ümber, eriti kui planeerida tulevikku meediavaldkonnas?

Jah, andmeanalüüsi abil on võimalik teha huvitavaid ja ka majanduslikult kasulikke asju. Ehk siis meediavaldkonnas töötav inimene – isegi kui ta ise neid uuringuid läbi ei vii – peaks nende võimalustega kursis olema. Kõik inimesed ei pea olema andmeteadlased, aga on oluline teada, mis on võimalik ja mis ei ole. Tunda ära, milline probleem on näiteks masinanalüüsiga lahendatav ja millisele probleemile on vaja leida teistsugust lahendust ja siis leida vastavat ekspertsust omav isik, kes esitatud küsimustele vastuseid otsib.