Lietuvių kalbos diskurso žymikliai ir jų ryšiai daugiakalbiame tekstyne

Collection:
Mokslo publikacijos / Scientific publications
Document Type:
Straipsnis / Article
Language:
Lietuvių kalba / Lithuanian
Title:
Lietuvių kalbos diskurso žymikliai ir jų ryšiai daugiakalbiame tekstyne
Alternative Title:
Lithuanian discourse markers and their relations in a multilingual corpus
In the Journal:
Darnioji daugiakalbystė [Sustainable Multilingualism]. 2023, 22, p. 258-272
Summary / Abstract:

LTDiskurso ryšiais anotuotų tekstynų kūrimas ir tyrimai yra gana nauja sritis, todėl Lietuvos mokslininkai siekia papildyti esamus tekstynų resursus ir ieško būdų, kaip būtų galima tyrinėti diskurso ryšius siejant ir lyginant juos su kitomis kalbomis, nes tam tikrais atvejais skirtingose kalbose diskurso ryšiai realizuojami skirtingomis kalbinėmis priemonėmis. Šio straipsnio tikslas – remiantis užsienio mokslininkų patirtimi pristatyti lietuvių kalbos diskurso žymiklių ir ryšių anotavimą daugiakalbiame tekstyne ir aptarti diskurso žymiklių vertimo tyrimų gaires, verčiant iš anglų kalbos į lietuvių kalbą. Todėl pirmiausia aptariamos diskurso ryšių ir juos išreiškiančių diskurso žymiklių raiškos galimybės lietuvių ir anglų kalbose, atskleidžiami galimi vertėjų pasirinkimai atsižvelgiant į diskurso ryšius vertime ir skirtingų kalbinių priemonių vartojimą pusiau paruoštoje monologinėje kalboje. Straipsnyje pristatomas lygiagretusis daugiakalbis tekstynas TEDMBD (angl. Multilingual discourse-annotated corpus), kuris yra anotuotas diskurso lygmeniu, laikantis PDTB (angl. Penn Discourse Treebank) diskurso anotavimo tikslų ir principų. Straipsnyje išsamiai aptariama PDTB diskurso žymiklių anotavimo sistema, skaitytojas supažindinamas su diskurso ryšių reikšmių hierarchija, anotavimo principais ir PDTB schemos taikymo įžvalgomis. Taip pat aprašomi lietuviškosios tekstyno dalies anotavimo principai, pritaikyti laikantis PDTB diskurso anotavimo taisyklių; aptariami pirmieji rezultatai, susiję su diskurso ryšių raiška ir diskurso žymiklių vartojimu.Straipsnyje taip pat pristatomos pirmosios tyrimų gairės, kaip galima palyginti diskurso ryšiais anotuotus lietuviškus ir angliškus tekstus, siekiant suprasti vertimo tendencijas diskurso lygmeniu. Pagrindinės sąvokos: diskurso žymikliai; diskurso ryšiai; daugiakalbis tekstynas; anotavimas; PDTB diskurso ryšių hierarchija. [Iš leidinio]

ENThe development and research of discourse-annotated corpora is a relatively new field, therefore Lithuanian researchers seek to supplement the existing corpora resources and look for ways to study discourse relations by linking and comparing them with their counterparts in other languages because in different languages discourse relations are realized by different linguistic means. The aim of the article is to present the developing available corpora resources drawing on the experience of foreign scholars and to discuss guidelines for translation research at the discourse level. Therefore, the article first deals with the possibilities of expressing discourse relations by using discourse markers as their linguistic realization in different languages, discussing possible choices of translators, taking into account discourse realtions in translation and the use of different linguistic means. The article presents the parallel multilingual corpus TED-MBD (Multilingual discourse-annotated corpus), which is annotated at the discourse level, in accordance with the objectives and principles of PDTB (Penn Discourse Treebank) discourse annotation. The article discusses in detail the annotation system of PDTB discourse markers, the reader is introduced to the hierarchy of senses of discourse relations, the principles of annotation and insights into the application of the PDTB scheme. It also describes the annotation principles of the Lithuanian part of the corpus in accordance with the PDTB discourse annotation rules; the first results related to the expression of discourse relations and the use of discourse markers are discussed.The article also presents the first research guidelines on how to compare Lithuanian and English discourse-annotated texts in order to understand translation tendencies at the discourse level. Keywords: discourse markers; discourse relations; multilingual corpus; annotation; PDTB sense hierarchy. [From the publication]

DOI:
10.2478/sm-2023-0010
ISSN:
2335-2019; 2335-2027
Related Publications:
Permalink:
https://www.lituanistika.lt/content/101607
Updated:
2023-06-05 22:07:47
Metrics:
Views: 29    Downloads: 4
Export: