LTMonografija priklauso tarpdisciplininei tekstynų ir kompiuterinės lingvistikos sričiai, skirta dažnai drauge vartojamų žodžių junginiams – kolokacijoms – aprašyti. Ir tekstynų, ir kompiuterinė lingvistika yra tarpdalykinė veiklos sritis, kurioje susiduria skirtingų mokslų atstovų – kalbininkų ir informatikų – požiūris į kalbą. Kolokacijos samprata pristatoma stabiliųjų žodžių junginių tyrimo tradicijos Vakarų Europoje ir dabartinės jos ištyrimo būklės kontekste. Apžvelgiamas kolokacijos termino atsiradimas, raida ir šiandienis turinys tekstynų lingvistikoje, įvairių Europos kalbų kolokacijų duomenų bazių ir žodynų rengimo patirtis. Daugiausia dėmesio skiriama labiausiai paplitusiems kolokacijų gavimo iš tekstynų būdams ir priemonėms, atskirai pristatomas naujas statistinių kolokacijų gavimo metodas iš „Dabartinės lietuvių kalbos tekstyno“, aptariamos šiuo metodu gautos kolokacijos, jų transformavimas ir „Lietuvių kalbos daiktavardinių frazių žodyno“ sudarymas. Remiantis sudarytuoju žodynu analizuojamos lietuviškųjų kolokacijų struktūrinės ir semantinės ypatybės, jų ryšys su frazeologija ir laisvaisiais žodžių junginiais, metaforiškumo laipsnis. Žodyną galima panaudoti kuriant mašininio vertimo sistemas, mat kolokacijos – tai frazės, dažnai verčiamos vienodai, tais pačiais kitos kalbos atitikmenimis, kurie irgi yra stabilūs. Monografija skirta lingvistams bei informatikams, besidomintiems mokslo problemomis ir konkrečiu jų taikymu elektroninei leksikografijai, automatinei kalbos analizei, mašininiam vertimui, informacijos gavimui ir bet kokioms kitoms kalbos technologijoms.Reikšminiai žodžiai: Dabartinės lietuvių kalbos tekstynas; Daiktavardinių frazių žodynas; Frazeologizmas; Idioma; Kolokacija; Konkordansai; Leksikografija; Mašininis vertimas; Metafora; Tekstas; Tekstynas; Tekstynų lingvistika; Collocation; Computational linguistic; Concordance; Context; Corpus; Corpus of Contemporary Lithuanian; Dictionary of Nominal Collocational Phrases; Idiom; Lexicography; Machine translation; Metaphor; Phraseological unit.
ENThe monograph deals with an interdisciplinary topic of corpus and computational linguistics, i.e. collocation that is conceived as habitual co-occurrence of lexical items. The notion of collocation is presented in a wider context of the Western history of syntagmatic analysis of word combinations as well as present day perspective. The book discusses the appearance of the term "collocation", the development and status quo of its contents in various schools of linguistic thought, collocational resources in a number of languages of the world. Greater emphasis is given for the presentation and evaluation of the existing methods and statistical tools for the collocation extraction, a new method of extraction, applied for the Corpus of Contemporary Lithuanian, is described in detail. The results of the extraction, i.e. statistical collocations, are overviewed as well as their step-by-step transformation into the dictionary of Nominal Collocational Phrases. The collocations from the dictionary are analyzed from the point of view of structural and semantic features, their relationship with metaphors and idioms. The monograph is meant for linguists and computer science people that are keen on the problems of natural language description and processing and its application for the electronic lexicography, machine translation, information extraction and retrieval or any other related human language technologies. The book can also be used for teaching purposes in post-graduate studies. [From the publication]