LTStraipsnyje aprašyta, kaip iš 100 mln. žodžių Vytauto Didžiojo universiteto Kompiuterinės lingvistikos centre sudaryto Dabartinės lietuvių kalbos tekstyno buvo išgautos sintaksinės lietuvių kalbos taisyklės. Nagrinėti pagrindiniai taisyklių specifikavimo parametrai, aprašyta priklausomybių gramatika pagrįstų lietuvių kalbos išgavimo iš metodologija. Lietuvių kalbos sintaksinėms taisyklėms sudaryti buvo panaudoti tokie lingvistiniai resursai: Dabartinės lietuvių kalbos tekstynas, pusiau automatiškai paruoštas morfologiškai anotuotas lietuvių kalbos tekstynas ir morfologinis analizatorius Lemuoklis. Remiantis priklausomybių gramatika svarbu nurodyti, kuris žodis yra valdantysis, o kuris valdomasis, pvz., daiktavardžiai valdo su jais suderintus būdvardiškuosius žodžius; veiksmažodžiai valdo tam tikras gramatines formas. Aprašant sintaksinius junginius, neužtenka vien sintaksinių taisyklių. Reikalingi tokie papildomi parametrai: sintaksinė priklausomybė, įsiterpimas, žodžių tvarka ir prioritetas. Į šiuos parametrus būtina atsižvelgti, norint patikslinti sintaksines taisykles. Taisyklių išgavimas remiasi adaptuotu pattern recognition metodu. Automatiškai išgaunant taisykles reikalingi tokie etapai: tekstinių vienetų atpažinimas, automatinė morfologinė analizė ir klasifikavimas. [Iš leidinio]Reikšminiai žodžiai: Sintaksinė taisyklė; Sintaksinė analizė; Syntactic rule; Syntactic analysis.
ENThe need of an automatic Lithuanian language syntactic analysis was the background of this research. Concerning the processing of the Lithuanian language there are some key works in morphology level, but syntactical analysis is still lagging behind. That is the main reason why we consider formal specifications of Dependency Grammar being important for processing of the Lithuanian language. Our approach is based on corpus-based pattern recognition methods that let us extract and classify Dependency Grammar rules. [From the publication]