LTMašininis vertimas yra viena iš didžiausių kompiuterinės lingvistikos užduočių. Vertimo rezultatai tuo geresni, kuo siauresnė vertimo duomenų tema. Kitas svarbus kriterijus yra abiejų kalbų artimumas. Kaip paaiškėjo ankstesniuose projektuose, vertimui tarp artimų kalbų (pvz., tarp slavų) nereikia pilnos lingvistinės analizės – užtenka, pavyzdžiui, tik daiktavardžių ir panašių grupių analizės. Tai patvirtino Prahos Karlo universiteto Formaliosios ir taikomosios lingvistikos institute sukurta vertimo tarp slavų kalbų sistema Česílko, kuri jau pritaikyta ir kito tipo kalboms. Straipsnyje pristatysime eksperimentinį šios sistemos modelį, pritaikytą lietuvių kalbai. Aprašysime vartojamas paprastąsias gramatikas, analizuojančias daiktavardžių ir prielinksnių grupes, čekų ir lietuvių kalbų panašumus bei skirtumus, dvikalbį žodyną, pagal kurį verčiamos visos pagrindinės formos ir linksniuojami arba asmenuojami kaitomi žodžiai. Be to, paaiškinsime, kaip įvertinamas vertimo rezultatas. [Iš leidinio]Reikšminiai žodžiai: Kalbų artimumas; Kompiuterinė lingvistika; Mašininis vertimas; Vertimo tikslumas; Čekų kalba; Česilko; Žodynas; Computational linguistics; Czech; Dictionary; Language similarity; Lithuanian; Machine translation; Mashine translation; Quality of translation; Česilko.
ENThe results of machine translation as one of the biggest challenges of today’s computational linguistics depend on many various criteria such as domain specificity and source and target language similarity. Recent projects have shown that machine translation among related languages (e.g., Slavonic) can be performed without a full-fledged analysis; good results can be achieved by analyzing only simpler constituents. One of such projects is the system Česílko developed at Charles University in Prague at the Institute of Formal and Applied Linguistics that has been extended from Slavonic languages to another language family, the Baltic languages. This paper presents the architecture of this system adapted for Lithuanian, describes used partial parser, explains similarities and differences between Czech (source language) and Lithuanian and the structure of the translation dictionary. Moreover the authors explain how they have evaluated the quality of translation. [From the publication]