See veebileht kasutab küpsiseid kasutaja sessiooni andmete hoidmiseks. Veebilehe kasutamisega nõustute ETISe kasutustingimustega. Loe rohkem
Olen nõus
"Riiklik programm: Eesti keel ja kultuurimälu" projekt EKKM14-319
EKKM14-319 "Eesti murrete ja sugulaskeelte andmebaas II (1.01.2014−31.12.2018)", Liina Lindström, Tartu Ülikool, Humanitaarteaduste ja kunstide valdkond, eesti ja üldkeeleteaduse instituut.
EKKM14-319
Eesti murrete ja sugulaskeelte andmebaas II
1.01.2014
31.12.2018
Teadus- ja arendusprojekt
Riiklik programm: Eesti keel ja kultuurimälu
ETIS klassifikaatorAlamvaldkondCERCS klassifikaatorFrascati Manual’i klassifikaatorProtsent
2. Ühiskonnateadused ja kultuur2.6. Filoloogia ja lingvistikaH350 Keeleteadus6.2. Keeleteadus ja kirjandus100,0
PerioodSumma
01.01.2014−31.12.20146 850,00 EUR
01.01.2015−31.12.201510 000,00 EUR
01.01.2016−31.12.201610 000,00 EUR
01.01.2017−31.12.201712 500,00 EUR
01.01.2018−31.12.201815 000,00 EUR
54 350,00 EUR

Moodul 1.2. Eesti keele uurimiseks ja õppeks vajalike andmebaaside koostamine, allikmaterjalide digiteerimine ja publitseerimine. Projekti põhieesmärk on suurendada märgatavalt murdekorpuse mahtu, seda eriti morfoloogiliselt märgendatud tekstide osas. Projekti lõpuks suureneb korpuse maht märgatavalt: foneetilises transkriptsioonis tekstide maht 2 miljoni tekstisõnani (lisandub ca 0,5 miljonit tekstisõna) ning morfoloogiliselt märgendatud tekstide maht 1,4 miljonini (suureneb 460000 tekstisõna võrra). Tekste lisatakse nii neilt aladelt, mis murdekorpuse varasemas etapis on jäänud katmata, kui ka suurendatakse juba korpuses esindatud kihelkondade mahtu, et võimaldada ka andmete statistilist käsitlemist. Lisaks eesti murretele lisatakse mõnevõrra ka vadja ja liivi tekste, mis on eesti murretega vahetus kontaktis. Enamik morfoloogilisi ja süntaktilisi nähtusi, mis eesti murretes esinevad, on levinud ka neil vahetutel kontaktaladel ning uurijate jaoks on see oluline informatsioon. Töö tulemusena tekib piisavalt suur ning hõlpsalt veebi kaudu kasutatav andmebaas, mida asjahuvilistel on hõlpus kasutada. Murdekorpuse tekstidest on võimalik otsida nii korpuslingvistiliste töövahenditega kui veebipõhiselt (www.murre.ut.ee/murdekorpus), samuti on uurijate kasutuses märgendusprogrammiga Liivike seotud otsivõimalused. Murdekorpuse foneetilises transkriptsioonis tekstid on kättesaadavad eesti murrete ja sugulaskeelte arhiivi kaudu, selle kaudu on võimalik neid tekste ka kuulata. (Vt www.murre.ut.ee/arhiiv) Morfoloogiliselt märgendatud tekstide kasutamiseks arendatakse edasi murdekorpuse veebipõhist otsimootorit. Otsimootorit uuendatakse ning muudetakse kasutajasõbralikumaks, lisaks tekstidest otsimisele lisatakse võimalus ka otsitavat nähtust sisaldavaid tekstilõike kuulata ning andmeid ka kaardina kuvada. Lisaks murdekorpuse täiendamisele ning otsimootorile on kavas pidevalt ajakohastada murdekorpuse kodulehekülge. Kavas on koostada murdeid tutvustav nii kooliõpilastele kui üliõpilastele suunatud populaarteaduslik veebilehekülg, mille peamine eesmärk on tekitada huvi murrete ja eesti keele vastu laiemalt. Veebilehekülg sisaldab informatsiooni murrete kohta, esitab olulisemad murrete erijooned, võimaldab lugeda ja kuulata tekstinäiteid, vaadata videolõike jms.
Projekti eesmärk oli edasi arendada eesti murrete korpust. Eesti murrete korpus sisaldab helisalvestisi eesti murretest, nende litereeringuid, morfoloogilist mäegndust ning metainfot; lisaks sellele ka võrreldavaid materjale liivi ja vadja keelest. Kollektsioon võimaldab uurida eesti murrete ja lähisugukeelte keelelist mitmekesisust ja varieerumist erinevatest aspektidest. Projekti tulemusena suurenes korpuse maht eesti murrete osas 1,84 mln tekstisõnani ning morfoloogiliselt märgendatud tekstide osa 1,3 mln tekstisõnani. Vadja keele osa korpuses on 34000 märgendatud tekstisõna, liivi keele osa 60000 märgendatud tekstisõna. Korpuse on avalikult kättesaadav veebiliidese kaudu www.murre.ut.ee/mkweb.