Artimų kalbų mašininis vertimas

Direct Link:
Collection:
Mokslo publikacijos / Scientific publications
Document Type:
Straipsnis / Article
Language:
Lietuvių kalba / Lithuanian
Title:
Artimų kalbų mašininis vertimas
Alternative Title:
Mechanical translation between contiguous languages
In the Journal:
Kalbų studijos [Studies About Languages]. 2004, Nr. 6, p. 77-81
Summary / Abstract:

LTMašininis vertimas yra viena iš didžiausių kompiuterinės lingvistikos užduočių. Vertimo rezultatai tuo geresni, kuo siauresnė vertimo duomenų tema. Kitas svarbus kriterijus yra abiejų kalbų artimumas. Kaip paaiškėjo ankstesniuose projektuose, vertimui tarp artimų kalbų (pvz., tarp slavų) nereikia pilnos lingvistinės analizės – užtenka, pavyzdžiui, tik daiktavardžių ir panašių grupių analizės. Tai patvirtino Prahos Karlo universiteto Formaliosios ir taikomosios lingvistikos institute sukurta vertimo tarp slavų kalbų sistema Česílko, kuri jau pritaikyta ir kito tipo kalboms. Straipsnyje pristatysime eksperimentinį šios sistemos modelį, pritaikytą lietuvių kalbai. Aprašysime vartojamas paprastąsias gramatikas, analizuojančias daiktavardžių ir prielinksnių grupes, čekų ir lietuvių kalbų panašumus bei skirtumus, dvikalbį žodyną, pagal kurį verčiamos visos pagrindinės formos ir linksniuojami arba asmenuojami kaitomi žodžiai. Be to, paaiškinsime, kaip įvertinamas vertimo rezultatas. [Iš leidinio]Reikšminiai žodžiai: Kalbų artimumas; Kompiuterinė lingvistika; Mašininis vertimas; Vertimo tikslumas; Čekų kalba; Česilko; Žodynas; Computational linguistics; Czech; Dictionary; Language similarity; Lithuanian; Machine translation; Mashine translation; Quality of translation; Česilko.

ENThe results of machine translation as one of the biggest challenges of today’s computational linguistics depend on many various criteria such as domain specificity and source and target language similarity. Recent projects have shown that machine translation among related languages (e.g., Slavonic) can be performed without a full-fledged analysis; good results can be achieved by analyzing only simpler constituents. One of such projects is the system Česílko developed at Charles University in Prague at the Institute of Formal and Applied Linguistics that has been extended from Slavonic languages to another language family, the Baltic languages. This paper presents the architecture of this system adapted for Lithuanian, describes used partial parser, explains similarities and differences between Czech (source language) and Lithuanian and the structure of the translation dictionary. Moreover the authors explain how they have evaluated the quality of translation. [From the publication]

ISSN:
1648-2824; 2029-7203
Related Publications:
Adapting SProUT to processing Baltic and Slavonic languages / Witold Droždžyński, Petr Homola, Jakub Piskorski, Vytautas Zinkevičius. Proceedings of information extraction for Slavonic and other Central and Eastern European languages / edited by Hamish Cunningham ... [et al.]. Sofija: Context, 2003. 1 pdf (8 p.).
Permalink:
https://www.lituanistika.lt/content/29143
Updated:
2018-12-17 11:24:45
Metrics:
Views: 30    Downloads: 5
Export: