Lietuvių kalbos žodžio dalių analizės algoritmas

Direct Link:
Collection:
Mokslo publikacijos / Scientific publications
Document Type:
Straipsnis / Article
Language:
Lietuvių kalba / Lithuanian
Title:
Lietuvių kalbos žodžio dalių analizės algoritmas
Alternative Title:
Algorithm for analysis of parts of Lithuanian word
In the Journal:
Jaunųjų mokslininkų darbai. 2011, Nr. 4 (33), p. 123-129
Summary / Abstract:

LTŠiuo metu pasaulyje labai didelę paklausą turi daugiakalbės automatinio (mašininio) vertimo sistemos. Jų veikimas remiasi skirtingų kalbų gramatikos ir leksikos analize bei jų transformacijomis iš vienos kalbos į kitą. Automatinio vertimo sistemų vertimas pakankamai greitas, tačiau ne visada kokybiškas ir tikslus. Lietuvių kalbos gramatika ir leksika sudėtinga ir labai skiriasi nuo kai kurių tarptautiniu mastu vartojamų bendravimo kalbų (pvz., anglų kalbos).Šiame darbe nagrinėjama lietuvių kalbos morfologija ir kuriamas lietuviškų žodžių ir jo dalių analizės algoritmas. Sukurtas algoritmas panaudotas žodžio dalių analizės sistemoje. Atliktas sistemos patikrinimas. Sukurta sistema geriausiai analizuoja daiktavardžius, būdvardžius, prasčiau – veiksmažodžius, įvardžius ir skaitvardžius, o prieveiksmių analizė dažniausiai klaidinga. Ateityje tobulinant algoritmą būtina pirmiausia nustatyti, kuriai kalbos daliai priklauso nagrinėjamas žodis, po to atlikti analizę žodžio dalimis. [Iš leidinio]Reikšminiai žodžiai: Algoritmas; Galūnė; Lietuvių kalbos morfologija; Morfologija; Priesaga; Šaknis; Žodžio analizės algoritmas; Žodžio dalių analizė; Žodžio dalys; Algorithm; Algorithm for analysis of words; Analysis of word parts; Ending; Morphology; Morphology of Lithuanian language; Root; Suffix; Word elements.

ENMultilingual automatic (machine) translation systems are now in great demand in the world. These systems are based on analysis of grammar and lexis of different languages, and their conversions from one language into another. Translations produced by automatic translation systems are obtained fast, but they do not always have quality and accuracy. Lithuanian grammar and lexis are very complex and very different from those of some of the internationally used languages (e.g., English).This morphology of the Lithuanian language was analyzed and the algorithm for analysis of Lithuanian words and their parts was created in this study. The algorithm was used in the system for analysis of Lithuanian word parts. The system was tested. The designed system performs best in analysing nouns and adjectives, worse in analysing verbs, pronouns and numerals, but analysis of adverbs is usually erroneous. When developing the algorithm in future it is necessary for the analysis of word parts to be preceded by identification of part of speech of the word under analysis. [From the publication]

ISSN:
1648-8776
Related Publications:
Permalink:
https://www.lituanistika.lt/content/32620
Updated:
2018-12-17 13:05:40
Metrics:
Views: 373    Downloads: 29
Export: