TLÜ blogi

Saame tuttavaks: Digitehnoloogiate instituudi doktorant Kais Allkivi-Metsoja

ERR-i ja Teaduste Akadeemia konkursil „3 minuti loeng“ osaleb kolm TLÜ doktoranti, nende seas ka Kais Allkivi-Metsoja. Loe lähemalt, millega ta tegeleb.

Foto: Hans Metsoja

Loe Kais Allkivi-Metsoja artiklit „Eesti keele õppija saab lasta arvutil oma keeleoskust hinnata“ Novaatorist siin

"Eesti keele õppijal tekib võimalus saada oma kirjaliku keeleoskuse kohta veebipõhist tagasisidet – ajast ja kohast sõltumata."

Nooremteadur Kais Allkivi-Metsoja

Kirjelda palun oma uuringu vajalikkust ja oodatavaid tulemusi.
Minu uurimus annab uutmoodi ülevaate sellest, kuidas eesti keele kui teise keele õppijad keeleoskuse eri tasemetel ennast väljendavad, ja aitab arendada keeleõppurite kirjutisi hindavat tarkvara.

Kasutan A2–C1 taseme kirjalike tekstide võrdlemiseks automaatset keeleanalüüsi. See võimaldab vaadelda suurt hulka keelelisi tunnuseid, mis iseloomustavad tekstide sõnavara- ja grammatikakasutust, õigekirja ning üldist keerukust (sõnade ja lausete pikkust). Statistiliste andmete põhjal koostan ennustusmudelid, mille alusel saab määrata, millisele keeleoskustasemele õppija kirjatöö kõige tõenäolisemalt vastab.

Euroopa ühtne keeleoskustasemete skaala lähtub suhtlusolukordadest, kus erineva vilumusega keelekasutajad peaksid toime tulema, kuid igas keeles on ühe või teise taseme suhtluseesmärkide saavutamiseks vaja isemoodi sõnavara- ja grammatikavahendeid. Nii tuleb välja selgitada ka eesti keelele eriomased tasemete tunnused. See aitab eesti keelt teise keelena õpetades paremini arvesse võtta, et õppija saaks just õigel hetkel enda käsutusse tarviliku keelevahendite arsenali. Siiani on eesti keele õppurite keelekasutust uuritud enamasti ühe-kahe keeleoskustaseme kaupa, keskendudes vähestele keeletunnustele.

Milliseid uuringuid oled teinud või alles plaanid teha?

Olen analüüsinud eesti keele tasemeeksamitel kirjutatud loovtekste. Eestis hinnatakse riiklikult nelja keeleoskustaset, mida võib nõuda eri ametipostidel: A2, B1, B2 ja C1. Igalt tasemelt olen vaadelnud 120 kirjutist – kokku 480 algselt käsikirjalist teksti, mis on autentsel kujul ümber trükitud. Kasutasin keeletarkvara, mis määrab tekstides sõnade algvormid, tuvastab sõnaliigid ning käänd- ja tegusõnade grammatilised vormid. Uurisin ligi 150 tunnuse alusel, kuidas muutub sõnavara, sõnaliikide ja -vormide kasutus tasemelt tasemele.

"Sõnavara- ja grammatikatunnused lubavad enam kui 90% täpsusega määrata, mis keeleoskustasemele eksamikirjutis vastab."

Kais Allkivi-Metsoja

Seniste tekstianalüüsi tulemuste põhjal olen koos keeletehnoloogia uurimisrühma kolleegidega loonud tasemehindamise demorakenduse. See annab eraldi hinnangu teksti grammatika, sõnavara ja üldkeerukuse kohta ning koondhinnangu. Need neli prognoosimudelit rühmitasid testimisel õigesti 91%–97% eksamikirjutistest.

Eksamitööde põhjal ei saa aga teha üldistusi keeleõppijate kirjaliku eneseväljenduse kohta tervikuna. Näiteks võib range ajapiiranguta ja abivahendite toel valminud kodutöö või motivatsioonikiri eksamikirjutisest mitmeti erineda. Plaanin vaadelda ka keeleõppijate eksamiväliselt loodud tekste, mille taset on kogenud eksamihindajad spetsiaalselt hinnanud. Nii saan kindlaks teha, millised tekstide tunnused on keeleoskustasemetele üldomased ja millised sõltuvad kirjutamisolukorrast.

Soovin tekstide võrdluses arvesse võtta ka lauseehituse tunnuseid ja õigekirjavigade esinemist. Oleme uurimisrühmaga peaaegu valmis saanud õigekirjakorrektori, mis parandaks tavaspelleritest tõhusamalt keeleõppijate tüüpilisi apse (näiteks hääldusveast tulenev kirjapilt, täpitähtede ära jätmine).

Kas ette on tulnud ootamatuid tulemusi või muid üllatusi?

Oli meeldiv üllatus, et sõnavara- ja grammatikatunnused lubavad enam kui 90% täpsusega määrata, mis keeleoskustasemele eksamikirjutis vastab. Varasemad katsetused teksti taset automaatselt prognoosida on nii eesti keele kui ka teiste keelte puhul andnud tagasihoidlikumaid tulemusi. Kindlasti on abiks see, et tehisnärvivõrgud võimaldavad senisest täpsemini analüüsida tekste, mis erinevad kirjakeele normist. Teisalt on eksamitekstid üsna ühelaadsed ja mitmekesisema tekstivalimi korral läheb pilt keerukamaks. Võimalik, et eksami- ja muus olukorras kirjutatud tekste peab hindama erinevate statistiliste mudelite abil.

Huvitav on olnud näha, et mitmed muutused õppijate keelekasutuses ei ole ühesuunalised. Näiteks eitav kõne sageneb B2-tasemeni ja C1-tasemel kasutatakse seda taas harvemini. Suur osa grammatilisi tunnuseid on aga seotud kirjutamisülesandega ja võivad ka ühe taseme piires oluliselt varieeruda. Tegusõna 2. pööret, käskivat kõneviisi ja hüüdsõnu tarvitatakse rohkem kirjades, tegusõna 3. pööret jutustustes ja arutlustes. Ka ajavormi- ja käändevalik sõltub ülesandepüstitusest.

Kuidas võib uuringust kasu saada tavaline inimene?

Kõige käegakatsutavam tulemus on see, et eesti keele õppijal tekib võimalus saada oma kirjaliku keeleoskuse kohta veebipõhist tagasisidet – ajast ja kohast sõltumata. Automaatne tekstihindaja on esialgsel kujul abiks eelkõige tasemeeksamiks harjutades. Arendame rakendust edasi, et selle abil saaks kontrollida ka muud tüüpi kirjutisi. Programm hakkab andma ka õigekirja paranduse ja sõnavaliku soovitusi. Nii aitab see õppijal tekste koostada ja jälgida oma keelelist arengut. Rakendus võib olla toeks ka õpetajale, näiteks keelekursuse paigutustestide hindamisel.

Uurimus on laiemaltki kasuks keeleõpperakenduste arendamisel, näiteks tasemekohaste e-ülesannete koostamisel. Loodan väga, et doktoritöö tulemused leiavad kasutust eesti keele õppekavade, õppevara ja õpetajakoolituse materjalide täpsustamisel-täiendamisel.

Kuna riigikeele õpe mõjutab suuresti muukeelsete elanike toimetulekut – võimalusi töötada, õppida ja ühiskonnas aktiivselt kaasa rääkida –, siis võiks uurimistööst kaudselt kasu saada Eesti ühiskond tervikuna. Heal tasemel ja mitmekesine keeleõpe ning keeletehnoloogiate arendamine on ka keele kestlikkuse alustalad.

Millised on Sinu hobid ja tegevused väljaspool teadust?

Õpetan ülikoolis digihumanitaaria kõrvalerialal. Olen ka töötanud rohkem kui kümme aastat ajakirjanikuna. Esimesel doktoriõppe aastal otsustasin, et pean selle peatüki enda elus vähemalt mõneks ajaks sulgema. Kõike ei jõua. Samas on mul taskus suurepärane varukaart.

Armastan ulmekirjandust ja -filme. Praegu on pooleli seriaali „Tähevärav SG-1“ vaatamine. Mängin meelsasti sõpradega lauamänge ja proovin köögis millegi uuega lagedale tulla, kui katsetusteks aega jääb. Varem käisin spordiklubis, eelmisest aastast on selle asemel tulnud jalutuskäigud looduses. Abikaasa kõrval õpin vaikselt maastikul jalgrattaga sõitma.