Tekstynų lingvistika: teorija ir praktika

Marcinkevičienė, Rūta

Tekstynų lingvistika: teorija ir praktika

Direct Link:

Open Access (CC) BY-SA 4.0

Collection:

Mokslo publikacijos / Scientific publications

Document Type:

Straipsnis / Article

Language:

Lietuvių kalba / Lithuanian

Title:

Tekstynų lingvistika: teorija ir praktika

Alternative Title:

Corpus linguistics in theory and practice

Authors:

Marcinkevičienė, Rūta

In the Journal:

Darbai ir dienos [Deeds and Days]. 2000, t. 24, p. 7-64. Tekstynų lingvistika

Subject Category:

Technologijos ir techniniai reglamentai / Technology and technical regulations.

Summary / Abstract:

LTStraipsnyje, siekiant atskleisti tekstynų lingvistikos (TL) savitumą, aptariami kompiuteriniai tekstynai ir jų programinė įranga, taip pat gauti produktai – dažniniai sąrašai ir konkordansai bei jų tyrimo ypatumai, iliustruojami daiktavardžio apatija analize. Straipsnyje taip pat kalbama apie TL statusą, jos slinktį nuo metodologijos link teorijos, sąlytį ir prieštarą kitoms kalbos mokslų teorijoms, TL postuluojamas savąsias teorines nuostatas, jos naudą kitoms humanitarinių ir tiksliųjų mokslų šakoms bei informacinių technologijų praktikai, TL svarbą XXI a. informacinei visuomenei. Darbo su tekstynų ypatumai yra nulemti automatinių tekstų lemavimo, anotavimo ir sintaksinės analizės programų rezultatų, taip pat lietuvių kalbos specifikos: fleksinė jos prigimtis reikalauja atsižvelgti į jos žodžių, ypač centrinių, tiriamųjų, formas, o laisva žodžių tvarka sakinyje neleidžia susitelkti tik į kelias kontekstinių partnerių pozicijas tiriamojo žodžio atžvilgiu. Šios savybės smarkiai padidina tiriamųjų kalbos vienetų ir jų kolokatų gramatinę įvairovę bei sintaksinę jų distribuciją, o tai savo ruožtu užmaskuoja leksinius, semantinius, gramatinius bei pragmatinius žodžių vartosenos ypatumus, todėl tekstyno analizės modelį kiekvienam reikia susikurti pačiam. Kalbant apie TL statusą, laikomasi nuostatos, kad tekstynų lingvistika yra iš esmės deskriptyvioji kalbotyra, kuriai naudojamos naujos technologijos. TL rūpi tie patys dalykai kaip ir visai kalbotyrai: kalbos ir atskirų jos vienetų prigimtis, struktūra, funkcijos, vartosena, kalbos išmokimas, jos reiškinių įvairovė ir raida.Reikšminiai žodžiai: Dabartinės lietuvių kalbos tekstynas; Informacinės technologijos; Kalbotyros šaka; Konkordansas; Lingvistika; Sąrašas; Tekstas; Tekstynai; Tekstynų lingvistika; Tekstynų tipai; Branch of linguistic; Concordance; Corpus; Corpus linguistics; Corpus of present day Lithuanian; Information technology; Linguistics; List; Text; Types of corpora.

ENThe paper, in purpose of revealing the peculiarity of corpus linguistics (CL), discusses computer corpora and software as well as their products: frequency lists, concordances and specificities of studying them under analysis of the noun "apatija" (apathy). The article also talks about the CL status, its shift from methodology towards theory, contact and contradiction to other theories of linguistics, theoretical approaches postulated by CL, its benefit for other branches of the humanities and exact sciences as well as for practice of information technology, and the importance of the CL for the information society of the 21st century. Characteristics of managing corpus are determined by automatic outcomes of text lemmatizing, annotation and syntactic analysis programmes, as well as the Lithuanian language specifics: its inflectional nature requires to take into consideration its words, especially centric and exploratory ones, and forms, but free word order in the sentence does not allow to focus on just a few positions of contextual partners in relation to the investigated word. These characteristics dramatically increase grammatical variety of investigated units of language and their collocations, as well as their syntactical distribution, which in turn masks lexical, semantic, grammatical and pragmatic peculiarities words' usage, thus the corpus analysis model needs to be created individually. Considering CL status, there is presumption that corpus linguistics is basically descriptor linguistics, which uses the new technologies. The concerns of CL are the same as for overall linguistics: nature of language and its individual units, structure, functions, usage, language acquisition, its variety of expressions and development.

ISSN:

1392-0588; 2335-8769

Subject:

Kalbotyra / Linguistics

Related Publications:

A Comparison of approaches for sentiment classification on Lithuanian internet comments / Jurgita Kapočiūtė-Dzikienė, Algis Krupavičius, Tomas Krilavičius. Proceedings of the 4th biennial international workshop on Balto-Slavic natural language processing. Stroudsburg (PA): Association for Computational Linguistics, 2013. P. 2-11.
Apibendrinamieji daiktavardžiai / Viltė Drūlienė. Darbai ir dienos. 2012, t. 58, p. 93-116.
Ar vis dar aktualus Didžiųjų kalbos klaidų sąrašas? Vertinių atvejis / Erika Rimkutė. Bendrinė kalba. 2014, 87, p. 1-13.
Bendravimas internetu: kalbėjimas rašant / Asta Ryklienė. Darbai ir dienos. 2000, t. 24, p. 99-107.
Bendrinės lietuvių kalbos daiktavardžių ir būdvardžių kirčiavimo struktūrinis modelis, algoritmas ir realizacija / Giedrius Norkevičius, Asta Kazlauskienė, Gailius Raškinis. Kalbų studijos. 2004, Nr. 6, p. 72-76.
"Bendrinės lietuvių kalbos leksikos duomenų bazė" - paskirtis ir struktūra / Daiva Murmulaitytė. Leksikografija ir leksikologija. D. 1, Aiškinamųjų bendrinės kalbos žodynų aktualijos / sudarytoja Ritutė Petrokienė. Vilnius: Lietuvių kalbos institutas, 2006. P. 247-295.
Būdvardžio vartojimo skirtumai sakytinės kalbos registruose / Laura Kamandulytė, Marija Tuškevičiūtė. Darbai ir dienos. 2008, t. 50, p. 91-108.
Computer linguistics and pragmatics / Giedrė Klimovienė, Juozas Korsakas. Nation and language: modern aspects of socio-linguistic development : proceedings of the 4rd international conference : October 21-22, 2010. 2010, p. 26-30.
Dabartinės lietuvių kalbos gramatinių formų vartosena morfologiškai anotuotame tekstyne / Erika Rimkutė. Lituanistica. 2006, Nr. 2, p. 34-55.
Dabartinės lietuvių kalbos tekstynas - 10 metų kaupimo ir naudojimo patirtis / Jolanta Kovalevskaitė. Prace bałtystyczne: język, literatura, kultura. 2006, 3, p. 231-239.
Dabartinės lietuvių kalbos vartosenos variantai / Rita Miliūnaitė. Vilnius : Lietuvių kalbos institutas, 2009. 246 p.
Dabartinės rašomosios lietuvių kalbos dažninis žodynas ir jo bazė / Laima Grumadienė. Acta linguistica Lithuanica. 2002, t. 46, p. 19-37.
Daiktavardžio kirčiuočių dažnumas / Asta Kazlauskienė. Darbai ir dienos. 2000, t. 24, p. 83-88.
Daiktavardžių konotacijos tyrimas tekstynų lingvistikos metodu / Rūta Marcinkevičienė. Lituanistica. 2001, Nr.3, p. 46-57.
Dar kartą apie iliatyvą / Erika Rimkutė. Kalbos kultūra. 2004, 77, p. 124-128.
Dvi antonimų poros: mirtis-gimimas, mirtis-gyvenimas / Irma Macijauskaitė. Darbai ir dienos. 2000, t. 24, p. 121-142.
Dvikalbiai žodynai Lietuvoje: megastruktūros, makrostruktūros ir mikrostruktūros ypatumai / Danguolė Melnikienė ; Vilniaus universitetas. Vilnius : Vilniaus universiteto leidykla, 2009. 263 p.
Dvi kariuomenės - dvejopi tyrimai / Jonas Vaičenonis. Darbai ir dienos. 2000, t. 24, p. 183-190.
Fotografijos leksika – žodynai žodynėliai ar duomenų bazė? / Daiva Murmulaitytė. Leksikografija ir leksikologija. D. 4 / redaktorių kolegija: Sturla Berg-Olsen, Ritutė Petrokienė (sudarytoja) ... [et al.]. Vilnius: Lietuvių kalbos institutas, 2014. P. 261-287.
Frazė "ne tas žodis" tekste / Kazimieras Župerka. Filologija. 2010, Nr. 15, p. 167-176.
Geometrijos modulio teksto analizė matematikos terminų vartojimo aspektu / Danutė Kaklauskienė, Algimantas Ambraziejus Laurutis. Studijos šiuolaikinėje visuomenėje. 2011, Nr. 2(1), p. 82-85.
Gramatinė morfologinių samplaikų klasifikacija / Erika Rimkutė. Kalbų studijos. 2009, Nr. 14, p. 32-38.
Homoformos dabartinės lietuvių kalbos tekstyne / Erika Rimkutė. Lituanistica. 2002, Nr. 2, p. 86-101.
Identity analysis based on the methodology of corpus linguistics / Laura Kamandulytė. Regioninės studijos. 2006, 2, p. 259-266.
Kalbinė įranga ir jos galimybės / Andrius Utka. Darbai ir dienos. 2000, t. 24, p. 275-285.
Kalbotyros terminai publicistikoje / Kazimieras Župerka. Darbai ir dienos. 2000, t. 24, p. 175-182.
Kauno vardo konotacija: (vardažodžių semantika) / Rūta Marcinkevičienė. Kauno istorijos metraštis. 2000, 2, p. 137-146.
Kriminalistinė lingvistika. Metodologiniai pagrindai ir jų taikymas atliekant ekspertizę / Renata Ryngevič. Vilnius : MRU Leidybos centras, 2006. 263 p.
Krizės metaforos Lietuvos ir Vokietijos viešajame diskurse / Nedas Jurgaitis. Filologija. 2013, Nr. 18, p. 86-92.
Labai dažnų lietuvių kalbos žodžių ir žodžių formų ypatybės / Andrius Utka. Lituanistica. 2005, Nr. 1, p. 48-55.
Leksikografija / Evalda Jakaitienė. Vilnius : Mokslo ir enciklopedijų leidybos institutas, 2005. 324 p.
"Lemuoklis" - morfologinei analizei / Vytautas Zinkevičius. Darbai ir dienos. 2000, t. 24, p. 245-274.
Lietuvių kalbos sintaksė / Vitas Labutis. Vilnius : Vilniaus universiteto leidykla, 2002. 392 p.
Lietuvių mokslo kalbos tekstynas / Aurelija Usonienė, Jonė Grigaliūnienė, Birutė Ryvitytė, Linas Butėnas, Erika Jasionytė. Baltistica. 2008, t. 43, Nr. 1, p. 101-114.
Lietuvos lenkų vaizdinys pirmuoju Lietuvos nepriklausomybės dešimtmečiu (Dabartinės lietuvių kalbos tekstyno pagrindu) / Veslava Čižik-Prokaševa. Prace bałtystyczne: język, literatura, kultura. 2023, 8, p. 9-26.
Linksniai šnekamojoje kalboje / Ineta Savickienė. Darbai ir dienos. 2000, t. 24, p. 89-98.
Lithuanian language processing using digital technologies / Jurgita Mikelionienė. Tiltai. 2005, Nr. 2 (31), p. 91-96.
Mokomasis lietuvių kalbos vartosenos leksikonas – nauja tekstyno pagrindu parengta leksinė bazė / Jolanta Kovalevskaitė, Erika Rimkutė. Darnioji daugiakalbystė 2022, 20, p. 154-193.
Mokslo populiarinimo diskursas: laikraščio "Mokslo Lietuva" analizė teksto funkcijų aspektu / Teresė Aleknavičiūtė. Kalba ir kontekstai. 2011, t. 4, d. 1, p. 83-89.
Morfologinio daugiareikšmiškumo tipologija / Erika Rimkutė. Lituanistica. 2003, Nr.4, p. 60-78.
Morfologinių samplaikų atpažinimas ir klasifikavimas / Erika Rimkutė, Giedrė Jarašiūnaitė, Petr Homola. Lituanistica. 2005, Nr. 2, p. 58-75.
Morfologinių samplaikų struktūros ypatumai: kelių kalbų palyginimas / Erika Rimkutė, Jolanta Kovalevskaitė. Darbai ir dienos. 2008, t. 50, p. 119-156.
Naujas bendrinės lietuvių leksikos tyrimo įrankis / Daiva Murmulaitytė. Baltu filoloģija. 2006, t. 15, Nr. 1/2, p. 41-56.
Naujoji lietuvių kalbos leksika (1991-1996 m kompiuterinio periodikos tekstyno pagrindu) : disertacija / Jurgita Mikelionienė. Kaunas, 2000. 195 lap.
Onimų reikšmės tyrimai tekstynų lingvistikos metodu / Laura Kamandulytė. Lituanistica. 2006, Nr. 1, p. 38-47.
Palyginamieji tekstynai - šaltinis tarptautinių žodžių vartosenai tirti / Rūta Marcinkevičienė. Kalbotyra. 2002, t. 51 (3), p. 81-93.
Palyginamojo tekstyno kūrimo principai, problemos ir panaudojimo galimybės / Jurgita Mikelionienė. Kalbų studijos. 2002, Nr. 3, p. 55-59.
Pietų Aukštaitijos regiono toponimai, kilę iš asmenų pavadinimų / Ilona Mickienė, Rita Baranauskienė. Respectus philologicus. 2019, Nr. 36 (41), p. 60-72.
Pokario Lietuvos partizanas publicistiniame diskurse / Aurelija Gritėnienė. Acta linguistica Lithuanica. 2018, t. 79, p. 177-211.
Priešdėlinių lietuvių kalbos veiksmažodžių leksikalizacija / Laima Jancaitė. Bendrinė kalba. 2020, 93, 1 pdf (27 p.).
Priklausomybių gramatika pagrįstų lietuvių kalbos sintaksinių taisyklių išgavimas iš "Dabartinės lietuvių kalbos tekstyno" / Gintarė Grigonytė, Erika Rimkutė. 10-osios tarpuniversitetines magistrantų ir doktorantų konferencijos "Informacinės technologijos '05'" pranešimų medžiaga. Kaunas: Technologija, 2005. P. 65-67.
Priklausomybių gramatika pagrįstų lietuvių klabos sintaksinių taisyklių išgavimas iš dabartinės lietuvių kalbos tekstyno / Gintarė Grigonytė, Erika Rimkutė. Informacinės technologijos : X tarpuniversitetinė magistrantų ir doktorantų konferencija : konferencijos pranešimų medžiaga / atsakingas redaktorius Arūnas Vrubliauskas. Kaunas: Technologija, 2005. P. 65-67.
Publicistinio ir šnekamojo stiliaus sandūra dabartinėje spaudoje / Aurelija Leonavičienė. Kalbos kultūra. 2007, 80, p. 85-96.
Retrospektyvus Lietuvos sakytinės žiniasklaidos tekstynas: rengimo metodologija ir patirtis / Laima Nevinskaitė. Taikomoji kalbotyra. 2013, 2 1 html.
Rusų kariai "Dabartinės lietuvių kalbos tekstyne" / Aurelija Gritėnienė. Folia Philologica. 2021, 1, p. 10-19.
Savita lietuviškoji BKB konstrukcija / Violeta Kalėdaitė. Darbai ir dienos. 2000, t. 24, p. 75-81.
Statistiniai, loginiai ir kompiuterių mokymosi metodai lietuvių kalbos morfologiniam daugiareikšmiškumui riboti / Erika Rimkutė, Gintarė Grigonytė. Informacinės technologijos, 2006 : konferencijos pranešimų medžiaga, [2006 m. sausio mėn. 25-26 d.]. T. 1 / redakcinė kolegija: Rimantas Barauskas ... [et al.] ; sudarytojas Aleksandras Targamadzė. Kaunas: Technologija, 2006. p. 104-108.
Šiuolaikiniai metodai kalbos naujovėms tirti / Jurgita Mikelionienė. Darbai ir dienos. 2000, t. 24, p. 65-73.
Šiuolaikiniai tekstynai ir pagrindinės jų kūrimo tendencijos / Olegas Poliakovas. Viešojo diskurso retorika ir lingvistika / redaktorių kolegija: pirmininkas Aleksandras Krasnovas ... [et al.]. Vilnius: Vilniaus universiteto leidykla, 2008. P. 19-35.
Taikomosios kalbotyros raida / Meilutė Ramonienė. Lietuvių kalba. 2023, Priedas, P. 83-101.
Tekstynai ir vertimai. Tekstynų naudojimas verčiant – vis dar akademinė prabanga? / Jonė Grigaliūnienė. Vertimo studijos. 2019, t. 12, p. 22-35.
Tekstynų lingvistikos ir valentingumo teorijos derinimo galimybės tiriant veiksmažodžius / Eglė Gudavičienė. Innovation and tradition in contemporary language studies : selected papers of the international conference at the University of Vilnius, Lithuania, 17-19 September 2004 / editorial board: Nijolė Bražėnienė (chair) ... [et al.]. Vilnius: Vilnius University Press, 2005. P. 57-64.
Teksto apimties ir matematinių terminų vartojimo dinamika vidurinės mokyklos matematikos vadovėliuose / Danutė Kaklauskienė. Jaunųjų mokslininkų darbai. 2009, Nr. 4 (25), p. 150-155.
Terminografija ir tekstynas / Rūta Marcinkevičienė. Terminologija. 2000, 6, p. 5-22.
The Conduit metaphor in English and Lithuanian: a corpus-based approach / Jūratė Vaičenonienė. Darbai ir dienos. 2000, t. 24, p. 143-167.
Tradicinė frazeologija ir kiti stabilūs žodžių junginiai / Rūta Marcinkevičienė. Lituanistica. 2001, Nr. 4, p. 81-98.
Trys Lietuvos menininkės tarp Kauno ir Paryžiaus: moters ir kūrėjos identiteto problema XX a. I pusėje / Rasa Andriušytė-Žukienė. Acta Academiae Artium Vilnensis 2011, t. 62, p. 53-64.
Vartosenos modelių analizė mokomojoje leksikografijoje: žvalgomasis tyrimas lietuvių kalbos veiksmažodžių pavyzdžiu / Jolanta Kovalevskaitė, Laima Jancaitė. Taikomoji kalbotyra. 2019, 12, p. 124-154.
Vidinės keturių priebalsių grupės ir jų dažnumas lietuvių kalboje / Agnė Bielinskienė. Lituanistica. 2002, Nr. 3, p. 74-87.
Viešumo ir privatumo sankirtos: tiesioginė kalba politinėje spaudoje / Aurelija Leonavičienė. Darbai ir dienos. 2004, t. 38, p. 149-166.

Permalink:

https://www.lituanistika.lt/content/37789

Updated:

2025-02-21 14:53:38

Metrics:

Views: 639 Downloads: 227

Export:

Choose type:

Download

User ID:
User Password: