Teadus

Eesti õppijakeele ressurss, analüüsivahendid ja õpikeskkond ELLE

2022. aasta lõpust alates on avalik eesti keele analüüsi- ja õpikeskkond ELLE, mis on abiks nii eesti keele õppijaile kui ka õpetajatele. Digitehnoloogiate instituudi dotsent Pille Eslon jagab, kuidas ELLE loomiseni jõuti ning milliseid võimalusi rakendus keeleõppes pakub.

Elle lehe avavaade - naine koos arvutiga, kus on lahti ELLE tekstianalüüsija

Tänaseks on mõistetud, et keeleoskus ei seisne ainult keeleteadmiste omandamises, vaid ka võimes kasutada keelt hoidlikult ja samas loominguliselt. Suheldes ei mõelda grammatikale, valitakse sõnu ja otsitakse võimalusi, kuidas neid koos kasutada. Ka TLÜ Digitehnoloogiate instituudi keeletehnoloogia töörühma viljeldava eesti õppija- ja kirjakeele võrdleva uurimise tulemused näitavad, et sõnade kooskasutus pole juhuslik. Esile tulevad piiratud vormivalikuga sõnajärgnevused või mustrid, millele kasutuspõhine keeleõpe rajanebki. Selleks oleme loonud vajaliku keeleressursi, individuaalse ja rühmaõppe e-keskkonna ning automaatse keeleanalüüsi ja teksti keelekasutuse hindamise vahendid. Järgnevalt lühike tagasivaade tehtud tööle.  

Eesti õppijakeele suurima e-ressursi, eesti vahekeele korpuse (EVKK) loomisega alustati Tallinna Ülikoolis 2004. aastal. Kasutajaliides võimaldab leida tekste nii õppijat kui ka teksti ja keeleoskuse taset iseloomustavate tunnuste põhjal.  Mitmesuguseid andmeid saab statistikast,  veaklassifikatsiooni tabel  näitab vigade sagedust ja koosesinemist, avatud on õppijakeele sagedus- ja pöördsõnastik,  keeleanalüüsi leht annab mitmekesist materjali eesti keele oskuse kujunemisest erinevatel keeleoskuse tasemetel. Lingvistiliselt märgendatud tekstide automaatseks töötlemiseks arendas E. Matsak klastrileidja, mis otsib tekstidest sarnaseid sõnajärgnevusi ehk keelekasutusmustreid, rühmitab need ja lisab sageduse andmed.

Kui algselt olid eesti vahekeele korpuse loomisel kesksel kohal veaanalüüs ja vigade klassifikatsioon, siis üsna kiiresti mõistsime, et keele õppimisel ja omandamisel pole veaanalüüsi tulemused määravad. Sellest alates oleme rääkinud EVKK-st kui eesti õppijakeele korpusest ja kavandanud EVKK arendamist eesti keele analüüsi- ja õpikeskkonnaks ELLE.

Kontseptsiooni aruteludel osalesid I. Šmorgun, P. Eslon, J. Kippar,  J. Trainis, K. Allkivi-Metsoja. Uurisime EVKK keeleanalüüsi lehe kasutajasõbralikkust (B. Reidma), töötasime välja uue keskkonna arenduse põhimõtted (M. Tarvas), koostasime uue keeleõppekeskkonna kasutajaprofiili ja struktuuri (K. Norak). ELLE kasutajaliidese väljatöötamisel on osalenud kõik TLÜ Digitehnoloogiate instituudi keeletehnoloogia töörühma liikmed, kuid põhiraskus on langenud arendajatele (M. Tarvas, H. Kodasma, T. Kamarik), kellele on olnud toeks üks naine (K. Allkivi-Metsoja) ning kaks meest (J. Kippar ja T. Toova). Arendustööd on soodustanud korpuslingvistilise uurimistöö (P. Eslon, K. Allkivi-Metsoja) ja õppijakeele rakendusuuringute tulemused (K. Norak, S. Maine, K. Kert).

ELLE on avalik 2022. aasta lõpust (elle.tlu.ee | https://evkk.tlu.ee/vers1 /). ELLE arendusega saab ennast kurssi viia aadressil https://github.com/centre-for-educational-technology/evkk/wiki .

EVKK andmebaasi ülekandele ELLE keskkonda eelnes tekstide puhastamine, arendati olemasolevat tarkvara (nt Klastrileidjast sai mustrileidja, paranes silbitaja töökiirus ja suurenes täpsus). Lisaks on loodud ka uusi rakendusi, mis toetavad andmepõhist keeleõpet. Nii saab õppija olemasoleva keelematerjali põhjal kinnistada õpitut või tuletada reegleid, parandada, lihtsustada ja toimetada nii oma kui teiste  kirjutatud tekste, kontrollida tekstide õigekirja ja hinnata teksti keeleoskuse taset, valida ja koostada keeleoskustasemele vastavat õppevara, analüüsida eri valdkonna tekstide sisu ja keelekasutust.

ELLE platvormil on kasutajale avatud järgmised keeletöötlusvahendid:   

tekstihindaja annab vastuse, millisele keeleoskuse tasemele (A2-B1-B2-C1) tekst oma keerukuselt ja sõnavara rikkuselt vastab, toob esile õigekirjavead ja pakub parandusi

tekstipäring aitab otsida materjali andmebaasist, lähtudes autori ja teksti andmetest; soovi korral saab siin oma tekste loovutada ja sel viisil andmebaasi laiendada

sõnaloend näitab sisestatud teksti või valitud (alam)korpuse sõnasagedust

sõna kontekstis toob esile, kuidas sõnu tekstis koos kasutatakse

naabersõnade otsing leiab sõnad, mis tekstis sageli lähestikku esinevad

mustrileidja aitab otsida kahe-, kolme-, neljasõnalised ja pikemad keelekasutusmustreid, mis tekstis sageli või harva esinevad

sõnaanalüsaatori väljund on silbitatud, algvormistatud ja grammatiliselt liigendatud tekstid.

ELLE tarkvara arendusse on kaasatud TLÜ Digitehnoloogiate instituudi IT-eriala üliõpilased. Eesti keele grammatika- ja õigekirjakorrektori arendamisel tehakse koostööd TÜ keeletehnoloogidega.