Eine mehrsprachige Website zur Grammatik der litauischen Sprache

Direct Link:
Collection:
Mokslo publikacijos / Scientific publications
Document Type:
Straipsnis / Article
Language:
Vokiečių kalba / German
Title:
Eine mehrsprachige Website zur Grammatik der litauischen Sprache
Alternative Title:
Daugiakalbė lietuvių kalbos gramatikos informacinė sistema internete
In the Journal:
Acta linguistica Lithuanica. 2017, t. 77, p. 144-166
Summary / Abstract:

LTLietuviu kalbos kompiuterizavimo darbuose galima pastebėti du pagrindinius trukumus: trūksta kartais net ir dažnai vartojamų formų ir pateikiami pertekliniai, lietuvių kalboje neegzistuojantys žodžiai. Kuriant Lietuvių kalbos gramatikos informacinę sistemą (LIGIS) stengiamasi išvengti jų abiejų. Visos formos generuojamos kompiuteriu automatiškai ir vėliau gauti rezultatai peržiūrimi žmogaus, kad būtų atmesti lietuviui tami žodžiai. Lietuvių kalbos gramatikos informacinė sistema apima visus darinius. Šiuo metu duomenų baze sudaro tik šaknies bėg- žodžiai. Jų yra apie 25000. Palyginimui galima pateikti tokius duomenis: morfemikos duomenų bazę sudaro yra apie 75000 įrašų, bet jie surinkti iš visos lietuvių kalbos leksikos. Su šaknimi bėg- ten tėra 118 žodžių. Kuriant Lietuvių kalbos gramatikos informacinę sistemą pagrindinis tikslas buvo pateikti išsamią gramatinę informaciją plačiajai visuomenei. Todėl buvo stengiamasi duomenis atvaizduoti kuo aiškiau ir suprantamiau. Svetainė pritaikyta naudotis ir mobiliuosiuose telefonuose. Vartotojas, pateikęs žodį, gauna trijų tipų informaciją apie jį: Žodžio struktūra (pradinė forma bei pamatiniai žodžiai dariniams), morfologinė informacija (kalbos dalis bei jos morfologinės kategorijos - linksnis, giminė, skaičius, laikas, laipsnis ir t. t.) ir morfeminiai duomenys - žodis išskaidytas morfemomis, nurodant morfemos tipą bei požymius, jei morfema jų turi, pavyzdžiui, priesaga - darybinė / kaitybinė, galūnė - įvardžiuotinė, sutrumpėjusi ir kt. Kiekviena morfema žymima vis kita spalva. Reikia pabrėžti, kad Lietuvių kalbos gramatikos informacinė sistema yra pirmasis tinklapis Lietuvoje, kur vartotojui pateikiama informacija apie morfemos tipą. Be to, apdorojami ir žodžiai su sutrumpėjusiomis galūnėmis, kurios labai paplitusios, ypač šnekamojoje kalboje.Kiekvienam duomenų bazėje esančiam žodžiui vartotojas gali gauti visą kaitybinę lentelę. Kai kuriems žodžiams pateikiama vartojimo pavyzdžių. Kuriant Lietuvių kalbos gramatikos informacinę sistemų siekiama kuo didesnio tikslumo ir patikimumo. Todėl visos lemos (žodžių pradinės formos - vardininkas, bendratis) suvedamos į duomenų bazę rankomis. Kaitybines formas sugeneruoti patikėta kompiuteriui, nes šiame jo darbe nebuvo pastebėta klaidų. Svetainė pateikiama septyniomis kalbomis: lietuvių, anglų, vokiečių, prancūzų, italų, rusų ir japonų. Ateityje planuojama Lietuvių kalbos gramatikos informacinę sistemą jungti su suskaitme-nintais žodynais ir sukurti vokiečių tinklapio CANOONET analogą. [Iš leidinio]Reikšminiai žodžiai: Gramatika; Morfologija Morfeminė informacinė sistema Kompiuterinė lingvistika; Morfeminė informacinė sistema; Kompiuterinė lingvistika; Grammar; Morphology; Morphemic; Information system; Computational linguistics.

ENThe project was started in the Institute of Lithuanian language in 2016. It aims at presenting detailed data about the grammatical features of Lithuanian words. The goal is to make those data freely accessible to any user on the Internet. The preliminary version covering the words with the root "bėg/run" was published in March 2017. The database-contains around 25,000 entries. We are trying to avoid drawbacks that are specific to the works done in the field of computational linguistics. It includes word coverage, grammatical data comprehensiveness, clarity and clearness of presented information etc. Grammatical information about the word in question is presented from three aspects: word structure, morphological data, and morphemic data. It is the first website in Lithuania providing morphemic types. One can get an inflection table for each word the database contains. Usage examples are given for some words. The information on the website is available in seven languages - Lithuanian, English, German, French, Italian, Russian, and Japanese - so foreigners interested in Lithuanian language can use it as well. [From the publication]

ISSN:
1648-4444
Related Publications:
Permalink:
https://www.lituanistika.lt/content/73096
Updated:
2019-06-28 12:28:23
Metrics:
Views: 33    Downloads: 1
Export: