Leksinės mašininio vertimo klaidos : beekvivalenčių žodžių vertimas

Direct Link:
Collection:
Mokslo publikacijos / Scientific publications
Document Type:
Straipsnis / Article
Language:
Lietuvių kalba / Lithuanian
Title:
Leksinės mašininio vertimo klaidos: beekvivalenčių žodžių vertimas
Alternative Title:
Lexical machine translation mistakes: translation of non-equivalent words
In the Journal:
Filologija. 2008, Nr. 13, p. 27-38
Summary / Abstract:

LT2008 m. pradžioje pristatytą internetinę anglų-lietuvių kalbų mašininio vertimo programą jau išbandė daug vartotojų, buvo ir esama visokių nuomonių. Straipsnyje pateikiami kai kurie kokybiniai šios programos darbo tyrimo rezultatai, aptariamos svarbesnės problemos. Daugiau dėmesio skirta beekvivalenčių žodžių vertimui. Aptarti terminai realija, lakūna ir beekvivalenčiai žodžiai. Pateikiami argumentai, kodėl pastarasis terminas yra tinkamiausias. Tyrimo rezultatai atskleidė daugialypę automatizuoto beekvivalenčių žodžių vertimo problematiką. Tyrimo pradžioje kelta hipotezė, kad mašininio vertimo kokybė priklauso nuo verčiamo teksto stiliaus, nepasitvirtino. Tam įtakos galėjo turėti programos naudojamas bendro pobūdžio žodynas. Kita vertus, tokius rezultatus reikėtų interpretuoti atsargiai. Gali būti, kad anglų–lietuvių kalbų mašininio vertimo sistema nėra gera ir negali identifikuoti skirtingo stiliaus vertimo skirtumų. Mašininio vertimo leksikos klaidų analizė rodo, kad jas lemia įvardijimo reiškiniai: daugiareikšmiškumas, homonimija, įvardijimas žodžių junginiais ir tam tikrų sąvokų neįvardijimas. Vertimo klaidų atsiranda ir dėl žodyno dydžio, jo struktūros, vertimo principo (dažniausiai pažodinis vertimas). Mašininio vertimo leksikos klaidų analizė parodo tik kryptis, kuriomis turėtų būti gerinama programa. Savaime suprantama, beekvivalenčių žodžių vertimas nėra didžiausia programos problema. Anglų–lietuvių kalbų mašininio vertimo programą reikia tobulinti: išplėsti žodyną, įtraukti daugiau frazių ir pažymų apie žodžio reikšmių vartosenos sritis; sukurti taisykles, leidžiančias atskirti anglų kalbos homonimus ir parinkti jiems tinkamus lietuvių kalbos atitikmenis. [Iš leidinio]Reikšminiai žodžiai: Beekvivalenčiai žodžiai; Daugiareikšmiškumas; Homonimija; Lakūna; Lakūną; Mašininis vertimas; Realija; Homonymy; Lacuna; Machine translation; Non-equivalent words; Polysemy; Realia.

ENThe on-line machine translation programme, which was created by Vytautas Magnus University and introduced at the beginning of 2008, translates texts from English into the Lithuanian language. Many users have already tried this programme. It is natural that it is both praised and criticized. The article presents a quality research of this programme. The main problems of the programme are discussed. More attention is paid to the complicated translation of non-equivalent words. Terms "realia", "lacuna" and "non-equivalent words" are discussed; arguments in favour of the latter term are provided. The research data shows many-sided problems of machine translation of non-equivalent words. The raised hypothesis for the research that machine translation quality depends on the text style was not confirmed. This might have been due to the non-specialized dictionary of the programme. On the other hand, the results of the research should be interpreted with care. It is possible that the English-Lithuanian machine translation programme is not good enough so that style translation differences could be identified. The analysis of lexical machine translation mistakes showed that the mistakes are conditioned by ordinary phenomena of nomination: polysemy, homonymy, nomination by multiword units and the lack of nomination.The size and structure of the dictionary, as well as the model of translation (literal translation), also influence the appearance of translation mistakes. The analysis of the mistakes only shows the directions in which the machine translation programme should be improved. The translation of non-equivalent words is obviously not the major problem of the programme. The English-Lithuanian machine translation programme has to be improved: additional sense and homonym notations should be added; where possible, rules should be provided; the dictionary should be continuously expanded with new words. [From the publication]

ISSN:
1392-561X
Related Publications:
Permalink:
https://www.lituanistika.lt/content/21902
Updated:
2018-12-17 12:21:29
Metrics:
Views: 66    Downloads: 15
Export: