Paieškos sistemos Google naudojimo galimybės tiriant kalbos reiškinius komentaruose

Aleksandravičiūtė, Skaistė

Paieškos sistemos Google naudojimo galimybės tiriant kalbos reiškinius komentaruose

Direct Link:

Open Access (CC) BY-NC 4.0

Collection:

Mokslo publikacijos / Scientific publications

Document Type:

Straipsnis / Article

Language:

Lietuvių kalba / Lithuanian

Title:

Paieškos sistemos Google naudojimo galimybės tiriant kalbos reiškinius komentaruose

Alternative Title:

Possibilities of using the search system Google in linguistic research

Authors:

Aleksandravičiūtė, Skaistė

In the Journal:

Kalbos kultūra. 2008, 81, p. 266-282

Subject Category:

Germanų kalbos / Germanic languages; Skoliniai / Loan words.

Summary / Abstract:

LTStraipsnyje aptariami paieškos eilutės sudarymo principai, atsižvelgiant į paieškos sistemos ir lietuvių kalbos ypatumus, lemiančius paieškos sėkmę. Straipsnyje remiamasi 2007–2008 m. atliktu santykinio naujųjų svetimžodžių (toliau – NS) dažnumo tyrimu, kurio pagrindinis tikslas – nustatyti ribas tarp retais, vidutiniškais ir dažnais laikytinų NS. Darbas rėmėsi prielaida, kad atliekant tyrimą nustatyti dažnumo atskaitos taškai vėliau pravers vertinant ir kitų NS paplitimą vartosenoje. Tai galėtų būti naudinga ir kalbos norminimo veikloje, taigi straipsnio tikslas – aprašyti paieškos eilutės sudarymo būdą. Atlikto tyrimo medžiaga – 2005–2006 m. spaudoje ir dokumentuose bei 2007 m. internete rasti NS – iš viso 201. Sudarant paieškos eilutes visų pirma svarbi reprezentatyvių žodžių formų atranka, kuri atliekama remiantis lietuvių kalbos gramatinių kategorijų dažnumo tyrimų rezultatais. Parankiausia į paieškos eilutę įrašyti veiksmažodžio bendratį ir tiesioginės nuosakos asmenuojamąsias veiksmažodžio laikų formas. Dėl skirtingos gramatinių kategorijų distribucijos aprėpties, kurią lemia ribotas Google paieškos eilutės ilgis, netenkama svaraus veiksmažodžių ir vardažodžių lyginimo pagrindo, todėl parankiau yra atskirti vardažodžių ir veiksmažodžių grupes. Neretai paieškos lauką tenka siaurinti dėl rezultatų anglų kalba pertekliaus ir daugiareikšmiškumo problemos lietuvių kalboje. Sutampančias to paties žodžio, bet skirtingų rašybos variantų kaitybos formas patartina palikti tik kurio nors vieno rašybos varianto paieškos eilutėje. Morfologiškai daugiareikšmes skirtingos leksinės reikšmės žodžių formas reikėtų palikti arba šalinti, atsižvelgiant į VDU tekstyno ir DDRLKŽ duomenis.Reikšminiai žodžiai: Paieškos eilutės sudarymo principai; Naujieji svetimžodžiai; New loanwords; Google in linguistic research.

ENThe paper introduces the methodology which can be used to implement Google as a tool for data accumulation and storage and investigating the spread of a linguistic phenomenon in the internet. The method is described in the framework of an investigation aimed at identifying relative frequency count of new loanwords between 2007 and 2008. The first section of the article describes the main principles of filling in the slot of a query: general as well as specific for a particular descriptive research. Rather than entering only the main word form, a proposal has been launched to enter the whole grammatical paradigm of the word or its major part considering that in the Google query slot the maximum number of key words is 32. The second section identifies the ways to narrow down the search domain and reasons why it should be done. This type of research is bound to face a problem of word and word-form ambiguity. The term of ambiguity has been selected to avoid confusion of more specific terms like homonyms, homographs, homophones etc. Moreover, the explication of the above terms often emphasises the phonetic aspect of the word, which for internet search is irrelevant. The above terms are not sufficiently precise for some cases of ambiguity, when, for example, the spelling of one word form coincides with another form of the same word. The method of search is instrumental in collecting various examples of language use as well as in investigating their frequency. Also the method of relative frequency of loanwords could be applied in language standardisation, e.g. in compiling lists of new loanwords which are considered grave mistakes. [From the publication]

ISSN:

0130-2795

Subject:

Kalbotyra / Linguistics

Related Publications:

Dabartinės lietuvių kalbos vartosenos variantai / Rita Miliūnaitė. Vilnius : Lietuvių kalbos institutas, 2009. 246 p.
Elektroninis diskursas: kalbos ypatybės ir stilius : disertacija / Asta Kupčinskaitė-Ryklienė. Vilnius, 2001. 228 lap. iliustr.
Homoformos dabartinės lietuvių kalbos tekstyne / Erika Rimkutė. Lituanistica. 2002, Nr. 2, p. 86-101.
Iliustracinių vartosenos pavyzdžių atranka ir pateikimas "Bendrinės lietuvių kalbos žodyne" / Daiva Murmulaitytė. Kalbos kultūra. 2011, 84, p. 129-149.
Leksikografija / Evalda Jakaitienė. Vilnius : Mokslo ir enciklopedijų leidybos institutas, 2005. 324 p.
Lietuvių kalbos enciklopedija / Vytautas Ambrazas, Aleksas Girdenis, Kazys Morkūnas, Algirdas Sabaliauskas, Vincas Urbutis, Adelė Valeckienė, Aleksandras Vanagas. Vilnius : Mokslo ir enciklopedijų leidybos institutas, 2008. 633 p.
Lietuvių kalbos žargono pavieniai suprieveiksmėję žodžiai ir prieveiksmiai be formantų bei jų adaptacinės ypatybės / Robertas Kudirka. Lietuvių kalba. 2020, 14, 1 pdf (14 p.).
Lietuvių kalbos žargono priesaginių prieveiksmių morfologinė adaptacija: priesagos -ai hibridiniai vediniai iš būdvardžių su priesaga -iškas ir nepriesaginių būdvardžių / Robertas Kudirka. Taikomoji kalbotyra. 2020, 14, p. 21-32.
Lietuvių kalbos žargono suprieveiksmėję žodžių junginiai ir suaugtiniai prieveiksmiai bei jų adaptacinės ypatybės / Robertas Kudirka. Acta linguistica Lithuanica. 2020, t. 83, p. 272-309.
Morfologinio daugiareikšmiškumo ribojimas kompiuteriniame tekstyne : disertacija / Erika Rimkutė. Kaunas, 2006. 203 p.
Morfologinio daugiareikšmiškumo tipologija / Erika Rimkutė. Lituanistica. 2003, Nr.4, p. 60-78.
Morfologiškai daugiareikšmių formų atsiradimo priežastys / Miglė Žemrietė. Bendrinė kalba 2023, 96, p. 107-137.
"Murdyti(s)", "murgdyti(s)", "murkdyti(s)" pateikimas žodynuose ir dabartinė vartosena / Daiva Murmulaitytė. Kalbos kultūra. 2010, 83, p. 151-168.
Naujieji lietuvių kalbos svetimžodžiai: kalbos politika ir vartosena / Loreta Vaicekauskienė. Vilnius : Lietuvių kalbos institutas, 2007. 328 p.
Naujieji pavadinimai pagal lyties skirtumą / Agnė Aleksaitė. Acta linguistica Lithuanica. 2022, t. 87, p. 224-244.
Nauji naujųjų skolinių norminimo klausimai / Loreta Vaicekauskienė. Kalbos kultūra. 2008, 81, p. 65-79.
Žodžių formų vartojimas lietuvių kalbos dalykinio ir publicistinio stilių duomenimis / Vida Žilinskienė. Lituanistica. 2002, Nr. 1, p. 106-117.

Permalink:

https://www.lituanistika.lt/content/20263

Updated:

2025-02-28 13:42:26

Metrics:

Views: 59 Downloads: 8

Export:

Choose type:

Download

User ID:
User Password: