Paieškos sistemos Google naudojimo galimybės tiriant kalbos reiškinius komentaruose

Direct Link:
Collection:
Mokslo publikacijos / Scientific publications
Document Type:
Straipsnis / Article
Language:
Lietuvių kalba / Lithuanian
Title:
Paieškos sistemos Google naudojimo galimybės tiriant kalbos reiškinius komentaruose
Alternative Title:
Possibilities of using the search system Google in linguistic research
In the Journal:
Kalbos kultūra. 2008, 81, p. 266-282
Summary / Abstract:

LTStraipsnyje aptariami paieškos eilutės sudarymo principai, atsižvelgiant į paieškos sistemos ir lietuvių kalbos ypatumus, lemiančius paieškos sėkmę. Straipsnyje remiamasi 2007–2008 m. atliktu santykinio naujųjų svetimžodžių (toliau – NS) dažnumo tyrimu, kurio pagrindinis tikslas – nustatyti ribas tarp retais, vidutiniškais ir dažnais laikytinų NS. Darbas rėmėsi prielaida, kad atliekant tyrimą nustatyti dažnumo atskaitos taškai vėliau pravers vertinant ir kitų NS paplitimą vartosenoje. Tai galėtų būti naudinga ir kalbos norminimo veikloje, taigi straipsnio tikslas – aprašyti paieškos eilutės sudarymo būdą. Atlikto tyrimo medžiaga – 2005–2006 m. spaudoje ir dokumentuose bei 2007 m. internete rasti NS – iš viso 201. Sudarant paieškos eilutes visų pirma svarbi reprezentatyvių žodžių formų atranka, kuri atliekama remiantis lietuvių kalbos gramatinių kategorijų dažnumo tyrimų rezultatais. Parankiausia į paieškos eilutę įrašyti veiksmažodžio bendratį ir tiesioginės nuosakos asmenuojamąsias veiksmažodžio laikų formas. Dėl skirtingos gramatinių kategorijų distribucijos aprėpties, kurią lemia ribotas Google paieškos eilutės ilgis, netenkama svaraus veiksmažodžių ir vardažodžių lyginimo pagrindo, todėl parankiau yra atskirti vardažodžių ir veiksmažodžių grupes. Neretai paieškos lauką tenka siaurinti dėl rezultatų anglų kalba pertekliaus ir daugiareikšmiškumo problemos lietuvių kalboje. Sutampančias to paties žodžio, bet skirtingų rašybos variantų kaitybos formas patartina palikti tik kurio nors vieno rašybos varianto paieškos eilutėje. Morfologiškai daugiareikšmes skirtingos leksinės reikšmės žodžių formas reikėtų palikti arba šalinti, atsižvelgiant į VDU tekstyno ir DDRLKŽ duomenis.Reikšminiai žodžiai: Paieškos eilutės sudarymo principai; Naujieji svetimžodžiai; New loanwords; Google in linguistic research.

ENThe paper introduces the methodology which can be used to implement Google as a tool for data accumulation and storage and investigating the spread of a linguistic phenomenon in the internet. The method is described in the framework of an investigation aimed at identifying relative frequency count of new loanwords between 2007 and 2008. The first section of the article describes the main principles of filling in the slot of a query: general as well as specific for a particular descriptive research. Rather than entering only the main word form, a proposal has been launched to enter the whole grammatical paradigm of the word or its major part considering that in the Google query slot the maximum number of key words is 32. The second section identifies the ways to narrow down the search domain and reasons why it should be done. This type of research is bound to face a problem of word and word-form ambiguity. The term of ambiguity has been selected to avoid confusion of more specific terms like homonyms, homographs, homophones etc. Moreover, the explication of the above terms often emphasises the phonetic aspect of the word, which for internet search is irrelevant. The above terms are not sufficiently precise for some cases of ambiguity, when, for example, the spelling of one word form coincides with another form of the same word. The method of search is instrumental in collecting various examples of language use as well as in investigating their frequency. Also the method of relative frequency of loanwords could be applied in language standardisation, e.g. in compiling lists of new loanwords which are considered grave mistakes. [From the publication]

ISSN:
0130-2795
Related Publications:
Permalink:
https://www.lituanistika.lt/content/20263
Updated:
2020-02-10 15:25:28
Metrics:
Views: 53    Downloads: 8
Export: