LTStraipsnyje aprašytas 3000 dažniausių lietuvių kalbos veiksmažodžių junglumo tyrimas vartojant automatinės programos duomenis ir remiantis iš 100 mln. žodžių sudaryto "Dabartinės lietuvių kalbos tekstyno" duomenimis. Automatiškai lietuvių kalbą analizuojanti programa, sukurta Vytauto Didžiojo universiteto Kompiuterinės lingvistikos centre, iš morfologiškai anotuoto tekstyno nustatė, kuriuos linksnius ir prielinksnius valdo dažniausi lietuvių kalbos veiksmažodžiai. Programa nenurodė, ar tirti veiksmažodžiai gali valdyti bendratį - tai nustatyta straipsnyje aprašyto tyrimo metu. Šiame tyrime atsisakyta analizuoti tuos atvejus, kai veiksmažodžiai gali prisijungti vietininką ir prieveiksmius, nes beveik visi veiksmažodžiai gali būti vartojami su minėtomis formomis. Ateityje būtų galima ištirti, kurie veiksmažodžiai prisijungia neasmenuojamąsias veiksmažodžių formas, šalutinius sakinius. Darbe pateikti statistiniai duomenys rodo, kad veiksmažodžių junglumą nustatanti programa veikia netiksliai. Paaiškėjo, kad automatinės programos net 38 proc. linksnių pavartojimo atvejų buvo nurodyta neteisingai ir tik apie 15 proc. gerai nustatytas veiksmažodžiųjunglumas su prielinksniais. Automatinės programos klaidas lemia tai, kad veiksmažodžių valdomi žodžiai gali būti nutolę per kelias pozicijas ir tarp tų žodžių gali būti įsiterpusių kitų veiksmažodžių valdomų žodžių. Palyginus 500 išsamiau analizuotų veiksmažodžių gautus junglumo modelius su N. Sližienės žodyne pateiktais modeliais, paaiškėjo, kad beveik 84 proc. junglumo modelių sutapo. Vadinasi, tekstyne rasta apie 16 proc. daugiau veiksmažodžiųjunglumo modeliųnei N. Sližienės žodyne. [Iš leidinio]Reikšminiai žodžiai: Tekstynų lingvistika; Veiksmažodžių junglumas; Corpus linguistics; Verb combinability; Valentingumas; Junglumas; Veiksmažodžiai; Tekstynas.; Valency; Combinability; Verbs; Corpus.
ENThe article presents a valency analysis of 3000 most frequent Lithuanian verbs that were analysed by using the data of an automatic program and the Corpus of the Contemporary Lithuanian Language containing 100 million words. The program that was created by the Centre of Computational Linguistics at Vytautas Magnus University and that automatically analyses the Lithuanian language, based on the data of the morphologically annotated corpus, determined cases and prepositions that are governed by the most frequent Lithuanian verbs. The analysis revealed that the program did not indicate whether the verbs under analysis can be followed by the infinitive form. The ability of verbs to attach either the locative case or adverbials was not analysed, since almost all verbs can be used with these forms. In the future the research could be expanded by identifying the verbs which attach subordinate clauses or non-finite verb forms. The statistical data presented in this work show that the program does not work accurately. The results show that as much as38 percent of case occurrences with the verbs were indicated incorrectly and only around 15 percent of cases of verb combinability with prepositions were correct. Such automatic program errors are conditioned by the fact that words that are governed by verbs can be several positions away from the verb in a sentence or they can be separated by some words that are governed by other verbs. The comparison of 500 valency models, which were analysed in greater detail, with the models provided in the dictionary by N. Sližienė showed that almost 84 percent of the valency models coincide. Such results imply that almost 16 percent more of verb valency models were found in the corpus than in the dictionary by N. Sližienė. [From the publication]