Morfologiškai daugiareikšmių formų atsiradimo priežastys

Direct Link:
Collection:
Mokslo publikacijos / Scientific publications
Document Type:
Straipsnis / Article
Language:
Lietuvių kalba / Lithuanian
Title:
Morfologiškai daugiareikšmių formų atsiradimo priežastys
Alternative Title:
Reasons for the morphologically ambiguous forms
In the Journal:
Bendrinė kalba [Standard Language]. 2023, 96, p. 107-137
Summary / Abstract:

LTNors morfologinis daugiareikšmiškumas yra iš esmės išspręsta problema, net ir patobulinus lietuvių kalbos morfologinius anotatorius, jiems ne visada iš kelių morfologiškai daugiareikšmių formų pavyksta pasirinkti tikėtiniausią. Be to, nereti ir tokie atvejai, kai morfologinis anotatorius neteisingai parenka vieną formą iš kelių galimų. Todėl nutarta išanalizuoti ir suklasifikuoti morfologinio daugiareikšmiškumo atvejus, juos vadinant lietuvių kalbos homoformomis. Tyrimo tikslas - remiantis suklasifikuotomis homoformomis, aptarti galimas jų priežastis. Taikyti kiekybinės analizės, tekstynų lingvistikos, aprašomasis metodai. Aprašant homoformų priežastis, remiamasi Lietuvių kalbos homoformų žodynu. Jį sudaro apie 36 tukst. homoformų, todėl galima apibrėžti homoformų lietuvių kalboje atsiradimo priežastis. Siame straipsnyje homoformos pagal atsiradimo priežastis suklasifikuotos į penkias grupes: 1) teorinės homoformos, atsiradusios dėl kai kurių žodynų sudarymo specifikos; 2) homoformos, atsiradusios dėl prozodinių elementų skirtumų; 3) homoformos, atsiradusios dėl sutampančių skirtingų žodžių; 4) homoformos, nulemtos lietuvių kalbos morfologijos sistemos; 5) tos pačios reikšmės homoformos, atsiradusios dėl priskyrimo skirtingoms paradigmoms.Ši klasifikacija padeda geriau suvokti, kodėl morfologiniams anotatoriams anotuojant atsiranda vienokių ar kitokių morfologinio daugiareikšmiškumo atvejų. Remiantis šia informacija, butų galima patobulinti ir patį "Lietuvių kalbos homoformų žodyną". Suvokiant, kas lemia morfologinį daugiareikšmiškumą, į žodyną būtų galima įtraukti naujų duomenų, pavyzdžiui, galėtų atsirasti pažymos, kurios rodytų daugiareikšmiškumo tikimybę ar kitus duomenis. Esminiai žodžiai: morfologinis daugiareikšmiškumas, automatinė morfologinė analizė, tekstynas, homoformos, žodynas. [Iš leidinio]

ENAlthough the problem of morphological ambiguity in the Lithuanian language has been solved for all practical purposes morphological annotators, even when are improved, are not always capable of choosinge the most probable form from several morphologically polysemous forms. Moreover, such cases are not uncommon when the morphological annotator incorrectly chooses one form from several possible ones. Therefore, a decision was made to conduct a study that would analyze and classify cases of morphological polysemy, hereinafter referred to as homoforms of the Lithuanian language. The aim of the study is to discuss their possible causes based on the classified homoforms through the application of quantitative analysis, textual linguistics, and descriptive. When describing the reasons for homoforms, reference is made to the "Dictionary of Homoforms of the Lithuanian language", prepared by the author of this article and Erika Rimkutė. Since the "Dictionary of Homoforms of the Lithuanian Language" consists of a really large number (about 36,000) of morphologically polysemous words, it becomes possible to define the reasons for the appearance of homoforms in the Lithuanian language. Homoforms can be classified according to the reasons for their appearance as follows: (1) homoforms that are rather theoretical in nature and appeared in the process of the compilation of dictionaries; (2) homoforms resulting from differences in prosodic elements; (3) homoforms resulting from different overlapping words; (4) homoforms that came into existence due to the specifics of the Lithuanian morphology system; (5) homoforms of the same meaning that appeared under different paradigms.These five reasons help us to better understand why automatic annotation often produces a kind orphological ambiguity. Based on this information, it would be possible to improve the "Dictionary of Homoforms of the Lithuanian Language" on its own right. By understanding what determines morphological polysemy, new data could be added to the dictionary, such as notations that indicate the probability of ambiguity or other data. Keywords: morphological ambiguity, automatic morphological analysis, corpus, homoforms, dictionary. [From the publication]

DOI:
10.35321/bkalba.2023.96.06
ISSN:
2351-7204
Related Publications:
Permalink:
https://www.lituanistika.lt/content/106422
Updated:
2024-03-07 20:29:49
Metrics:
Views: 26
Export: