LTStraipsnyje nagrinėjama, kaip kalbininkų vartojami su homonimija susiję terminai ir kaip turėtų būti įvardijamos iš automatinės morfologinės analizės išaiškėjusios morfologiškai daugiareikšmės formos. Kalbiniuose darbuose nustatyta keletas skirtingų to paties termino sampratų. Vienais atvejais homoformos ir morfologiniai / gramatiniai homonimai yra laikomi ta pačia arba skirtingomis homonimijos dalimis. Iš esamų homonimijos apibrėžimų neaišku, ar homoformas sudaro tų pačių ar skirtingų kalbos dalių žodžių formos, fonetiškai vienodos ar ir skirtingos to paties žodžio formos. Vienų kalbininkų tos pačios formos įvardijamos kaip homoformos, kitų – kaip daliniai homonimai; vienur teigiama, kad homoformos vienodai tariamos, kitur – kad gali skirtis tarimu. Netiksliai apibrėžiami kriterijai, kaip skirtinos homoformos, homonimai ir homografai; neaišku, kuo laikomi tarnybinių kalbos dalių sutapimai. Dėl terminijos nevienodumo pasirinktas terminas morfologinis daugiareikšmiškumas, kuris suvokiamas kaip reiškinys, apimantis kaitomas ir nekaitomas formas; skirtingų ir tų pačių kalbos dalių žodžių formas; tam tikromis formomis, prozodiniais elementais besiskinančias ir visiškai sutampančias žodžių formas ar žodžius. Automatiniu būdu morfologiškai anotuotame tekstynėlyje daugiau nei 47 proc. formų yra daugiareikšmės. Joms įvardyti pasirinktas terminas homoformos. Skiriamos kaitomųjų, kaitomųjų ir nekaitomųjų, ir nekaitomųjų kalbos dalių homoformos, kurios gali skirtis prozodiniais elementais. Terminas homoformos apima ir dalį tradiciškai homografais ar daliniais homonimais laikomų formų.Reikšminiai žodžiai: Anotuotas tekstynas; Daugiareikšmiškumas; Homoforma; Homoformos ir homografai; Homografas; Homonimai; Homonimas; Kalbos formalizacija; Morfologinis daugiareikšmiškumas; Natūralios kalbos apdorojimas; Tekstynų lingvistika; Automatically tagged corpus; Corpora linguistics; Homoform; Homoforms and homographs; Homograph; Homonym; Homonyms; Language formalization; Lexical ambiguity; Lithuanian; Morphological ambiguity; Natural language processing.
ENThe article deals with a small part of the corpus of the Lithuanian language, which was automatically tagged. The corpus with morphological tags has shown a high level degree of ambiguity of the language: about 47 percent of word forms are ambiguous. In the Lithuanian linguistics traditionally the greatest attention has been devoted to the lexical homonyms. Other levels of ambiguity have not been analysed. For this reason it was necessary to define the main terms of the morphological ambiguity and to solve the problematic issues of the relevant terminology. It was difficult to define what are the main differences between homographs, homonyms and homoforms. Traditionally in linguistics it is affirmed that homoforms must coincide phonetically, while homographs are pronounced differently. This article shows that some homoforms can differ by the place of accent, the quality of vowels or intonation. Homoforms were analysed instead of homographs or homonyms, because the main attention was devoted to morphological but not phonetic or semantic differences. [text from author]