LTTekstynas, būdamas terminų šaltiniu, terminografams pravartus dėl daugelio priežasčių: iš tekstyno gaunami patys terminai, jų definicijos, t. y. dalykinė informacija apie pačią sąvoką, bei vartojimo pavyzdžiai, taigi ir vartojimo dažnumas, terminų junglumas ir pan. Terminai, gaunami iš tekstyno, yra sistemiški ir tarpusavyje susiję, mat atskiruose tekstuose yra pateikiami atskirų autorių vartojami terminų rinkiniai, kiekviename iš kurių terminai yra gerai apmąstyti, darniai derantys vienas prie kito. Todėl siekiant, kad gaunami terminai atspindėtų atskiras sistemas, į tekstyną turi būti dedami ištisi tekstai, o ne jų ištraukos, t. y. imtys. Ištisų tekstų tekstynas būtinas ir dėl dalykinės informacijos, kurios būtų netenkama pasitenkinus tekstų dalimis. Straipsnyje aptariamos tekstyno analizės priemonės terminografams: pusiau automatinis terminų atrankos būdas, teksto žodžių bei žodžių formų pasiskirstymas pagal vartojimo dažnumą. Šiuolaikinė terminologija, siekianti surinkti, aprašyti ir sunorminti įvairių mokslo šakų terminus, negali apsieiti be kompiuterinio tekstyno ir su juo susijusių kitų kompiuterinio terminų banko rengimo etapų: bendrojo pobūdžio ar specialios programinės įrangos, leksinės duomenų bazės, etc. Tekstynas turi būti parengtas taip, kad apimtų kuo didesnę tekstų įvairovę ir taip reprezentuotų aprašomosios mokslo šakos kalbą. Vartojant net ir bendrojo pobūdžio, leksikografams skirtą programinę įrangą galima automatiškai gauti žodžių ir žodžių junginių – kandidatų į terminus sąrašus, iš kurių atrenkami žinomi ir nauji terminai.Reikšminiai žodžiai: Duomenų bazės; Statistinė analizė; Tekstynas; Terminas; Terminografija; Terminų sąrašas; Terminų žodynai; Corpus; Databases; List of terms; Statistical analysis; Term; Terminography; Terminological database.
ENThe paper deals with role of a corpus in terminology in general and terminography in particular. It argues for the necessity to use not only corpus but also general purpose and specific tools for the extraction of terminology and compilation of terminological databases. Peculiarities of the terminographer's corpus such as its contents, size and specificity are also discussed. In addition, a wide range of possible general purpose and specific tools for term extraction are presented here. Some of them, based on statistical analyses of a text, were applied for one Lithuanian text on syntax in order to show how different tools can produce different semi-automatic lists of terms. [From the publication]