Digiblogi

Tallinna Ülikoolis toimus rahvusvaheline digihumanitaaria konverents

Tallinna Ülikoolis toimus oktoobri alguses rahvusvaheline digihumanitaaria konverents Shifts in language and culture: computational approaches to variation and change (October 5-7, 2022), mille korraldas Eesti Digitaalhumanitaaria Selts.

DH
DTI keeletehnoloogia töörühm oli esindatud ettekande ja kahe töötoaga.
Ettekanne

Kais Allkivi-Metsoja, Kaisa Norak, Karina Kert, Silvia Maine, Pille Eslon. Error Classification and Annotation of Learner Language for Developing Estonian Grammar Correction.

Ettekanne oli pühendatud eesti keele grammatikakorrektori arendamisele (riikliku keeletehnoloogia programmi projekt TKA21200 Eestikeelse teksti automaatkorrektuur 2021–2023). Tutvustati selleks loodud andmebaasi, kus A2–C1 taseme keelevigade märgendamisel (erinevalt inglise keele jaoks välja töötatud programmist ERRANT) kasutatakse M2 formaati ja eesti keelega kohandatud veakategooriaid. Ettekanne võeti huviga vastu. Osa veamärgendusega andmebaasist ja selle töötlemiseks kasutatud kood on kättesaadavad aadressil 

Töötoad
Esimene töötuba: Jaagup Kippar & R animatsioonid

Kirja pani end tosin andmepõhiste animatsioonide koostamise huvilist. Öeldakse, et pilt ütleb vahel enam kui tuhat sõna ning pildiseeria toob esile selle, mis üksikult jooniselt ei pruugi välja paista. Selle tõestamiseks tutvustati töötoas R-ikolme levinumat programmi.

Shiny – koostati veebirakendus, kus kasutaja sai valida tähtede arvu sõnas ning selle põhjal kuvada joonisel täis- ja sulghäälikute arvu. Kui tähtede arv automaatselt kasvama panna, tekkis pildiseeria (vt https://jaagupkippar.shinyapps.io/textwords/).

Graafikapakett ggplot2 – pakub lisavõimalusi (nt gganimate) kuvamaks ühtlaseid üleminekuid joonise ühest asendist teise. Näiteks, kuidas keeleoskuse tasemest johtuvalt muutub eesti keele õppijate tekstides eri sõnaliikide kasutus.

Traditsiooniline animatsiooni tekitamise moodus on pildiseeria. Selleks tuleb joonised ükshaaval kokku panna ja tervikuks liita. Kui esimese kahe paketi puhul saab piirduda ühe joonise ja ühe parameetri muutmisega, siis pildiseeria koostamisel võib sobivates kohtades vahele panna selgitavad tekstid ning sama nähtust ilmestada järgemööda mitme muutuva joonisega.

Teine töötuba: Jaagup Kippar, Harli Kodasma, Kaisa Norak, Kais Allkivi- Metsoja & ELLE sõnaanlüsaator

Tutvustati DTI keeletehnoloogia töörühma arendatavat keeleõppe ja keeleuurimisekeskkonda ELLE (toetab TLÜ uuringufond). Näidati veebirakendusi, mis võimaldavad saada ülevaate teksti sõnavarast ja grammatikast ning lasta automaatselt hinnata omakirjutatud teksti. Keskenduti sõnaanalüsaatori kasutusvõimalustele, kuna sel tööriistal on olemas ka ingliskeelne kasutajaliides. Rakenduse abil saab tekstisõnu silbitada, vaadata sõna algvormi ja tekstis kasutatud grammatilisi vorme, kuvada teksti kohta silpide, algvormide ja grammatiliste vormide statistikat. Praktilise ülesandena analüüsiti eesti keele A2-taseme eksami lugemisülesande teksti, uudisartiklit, raadiosaate teksti ning kahe autori, Karl Ristikivi ja Heiti Talviku luuletusi. Võrreldi, kuidas uudiste sõnasagedus annab kiire ülevaate uudise sisust; sõnaliikide ja grammatiliste vormide alusel kõrvutati kirjalikku uudisteksti raadiosaates suuliselt edastatud tekstist; silpide alusel võrreldi Ristikivi ja Talviku luule kõla. Töötoas osalejad andsid rakenduse kohta kasulikku tagasisidet.