Terminografija ir tekstynas

Marcinkevičienė, Rūta

Terminografija ir tekstynas

Direct Link:

©InC – Lituanistika

Collection:

Mokslo publikacijos / Scientific publications

Document Type:

Straipsnis / Article

Language:

Lietuvių kalba / Lithuanian

Title:

Terminografija ir tekstynas

Alternative Title:

Terminography and corpus

Authors:

Marcinkevičienė, Rūta

In the Journal:

Terminologija. 2000, 6, p. 5-22

Subject Category:

Terminija / Terminology.

Summary / Abstract:

LTTekstynas, būdamas terminų šaltiniu, terminografams pravartus dėl daugelio priežasčių: iš tekstyno gaunami patys terminai, jų definicijos, t. y. dalykinė informacija apie pačią sąvoką, bei vartojimo pavyzdžiai, taigi ir vartojimo dažnumas, terminų junglumas ir pan. Terminai, gaunami iš tekstyno, yra sistemiški ir tarpusavyje susiję, mat atskiruose tekstuose yra pateikiami atskirų autorių vartojami terminų rinkiniai, kiekviename iš kurių terminai yra gerai apmąstyti, darniai derantys vienas prie kito. Todėl siekiant, kad gaunami terminai atspindėtų atskiras sistemas, į tekstyną turi būti dedami ištisi tekstai, o ne jų ištraukos, t. y. imtys. Ištisų tekstų tekstynas būtinas ir dėl dalykinės informacijos, kurios būtų netenkama pasitenkinus tekstų dalimis. Straipsnyje aptariamos tekstyno analizės priemonės terminografams: pusiau automatinis terminų atrankos būdas, teksto žodžių bei žodžių formų pasiskirstymas pagal vartojimo dažnumą. Šiuolaikinė terminologija, siekianti surinkti, aprašyti ir sunorminti įvairių mokslo šakų terminus, negali apsieiti be kompiuterinio tekstyno ir su juo susijusių kitų kompiuterinio terminų banko rengimo etapų: bendrojo pobūdžio ar specialios programinės įrangos, leksinės duomenų bazės, etc. Tekstynas turi būti parengtas taip, kad apimtų kuo didesnę tekstų įvairovę ir taip reprezentuotų aprašomosios mokslo šakos kalbą. Vartojant net ir bendrojo pobūdžio, leksikografams skirtą programinę įrangą galima automatiškai gauti žodžių ir žodžių junginių – kandidatų į terminus sąrašus, iš kurių atrenkami žinomi ir nauji terminai.Reikšminiai žodžiai: Duomenų bazės; Statistinė analizė; Tekstynas; Terminas; Terminografija; Terminų sąrašas; Terminų žodynai; Corpus; Databases; List of terms; Statistical analysis; Term; Terminography; Terminological database.

ENThe paper deals with role of a corpus in terminology in general and terminography in particular. It argues for the necessity to use not only corpus but also general purpose and specific tools for the extraction of terminology and compilation of terminological databases. Peculiarities of the terminographer's corpus such as its contents, size and specificity are also discussed. In addition, a wide range of possible general purpose and specific tools for term extraction are presented here. Some of them, based on statistical analyses of a text, were applied for one Lithuanian text on syntax in order to show how different tools can produce different semi-automatic lists of terms. [From the publication]

ISSN:

1392-267X

Subject:

Kalbotyra / Linguistics

Related Publications:

Corpus-driven analysis of multi-word terms including the word ‘risk’ in English, French and Lithuanian / Oksana Smirnova, Sigita Rackevičienė. Terminologija. 2018, 25, p. 86-106.
Deskriptyviosios terminologijos tyrimų rezultatų panaudojimas terminologijos praktikoje / Jolanta Kovalevskaitė, Agnė Bielinskienė. Terminologija. 2015, 22, p. 149-168.
"Lemuoklis" - morfologinei analizei / Vytautas Zinkevičius. Darbai ir dienos. 2000, t. 24, p. 245-274.
Lietuvių kalbos terminų automatinio nustatymo galimybės / Erika Rimkutė. Kalbų studijos. 2010, Nr. 16, p. 71-78.
Lietuvių teisės terminija 1918-1940 metais: pagrindinių kodeksų terminai / Alvydas Umbrasas. Vilnius : Lietuvių kalbos institutas, 2010. 341 p.
Lithuanian-English cybersecurity termbase: principles of data collection and structuring / Sigita Rackevičienė, Andrius Utka, Agnė Bielinskienė, Liudmila Mockienė. Rasprave: Časopis Instituta za hrvatski jezik i jezikoslovlje. 2023, vol. 49, no. 2, p. 439-461.
Sudėtiniai naujųjų skolinių atitikmenys / Jurgita Girčienė. Kalbotyra. 2002, t. 51 (1), p. 19-32.
Tekstynų lingvistika: teorija ir praktika / Rūta Marcinkevičienė. Darbai ir dienos. 2000, t. 24, p. 7-64.

Permalink:

https://www.lituanistika.lt/content/31693

Updated:

2025-02-28 13:50:05

Metrics:

Views: 59 Downloads: 19

Export:

Choose type:

Download

User ID:
User Password: