LTTam, kad būtų galima plėtoti informacinių technologijų krypties mokslinius tyrimus ir eksperimentinės plėtros darbus siekiant sukurti lietuvių kalbos vertimo priemones, būtina sukaupti didelės apimties autentiškos kalbinės medžiagos išteklių bazę. Minėtini elektroniniai žodynai, bibliotekos, talpyklos, specializuoti duomenų bankai ir įvairūs tekstynai. Lietuvoje kol kas yra vos keletas tekstynų ir kalbos duomenų bei terminų bankų. Daugelis jų tik pradėti kurti. Pirmiausia minėtinas viešai prieinamas internete Dabartinės lietuvių kalbos tekstynas, sukauptas VDU Kompiuterinės lingvistikos centre, kuriami lygiagretieji anglų-lietuvių, čekų-lietuvių tekstynai, o VDU Regionistikos katedroje kuriamas Bendrinės šnekamosios lietuvių kalbos tekstynas. Nuo 2003 m. kuriamas viešas, visiems interneto vartotojams laisvai prieinamas LR terminų bankas. Projekto "Lietuvių mokslo kalbos tekstynas" tikslas - sukaupti didelės apimties, autentišką lietuvių mokslo kalbos duomenų bazę, kuri galėtų būti naudojama objektyviems, šiuolaikiniams akademinio diskurso kiekybinių ir kokybinių parametrų tyrimams, leistų atskleisti tarpdisciplininius ypatumus, žanrų įvairovės charakteristiką, suteiktų informacijos apie esamas ar galimas lietuvių mokslo kalbos savitumo, identiteto formavimo(si) ar nykimo tendencijas ir atskleistų veiksnius, lemiančius aptariamus procesus. Šis tekstynas labai reikalingas akademinio rašymo mokymui ir savarankiškam mokymuisi, nes sukaupta faktinė medžiaga nėra sukurta pavienių tyrėjų, kalbininkų - ji atspindi realią kalbinę situaciją, kolektyvinę intuiciją ir tikrąją vartoseną.Reikšminiai žodžiai: Tekstynas; Mokslo kalba; Teksto žanras.
ENFor the purpose of development of scientific studies of information technologies’ directions and performing experimental development works in order to develop Lithuanian translation means, it is necessary to accumulate a large base of authentic language material resources, such as electronic dictionaries, libraries, repositories, specialized data banks and different collections of texts. In Lithuania there are only several collections of texts and language data and term banks, most of which are only started to be developed. First of all, the Modern Lithuanian Language Corpus, compiled at Computer Linguistics Centre of Vytautas Magnus University, publically accessible on the Internet, should be mentioned, parallel English – Lithuanian, Czech – Lithuanian text collections are being developed and Regional Studies Department of the University is compiling the Common Spoken Lithuanian Language Corpus. Since 2003 the term bank of Lithuania, which will be freely accessible to all the Internet users, is being compiled. The aim of the “Lithuanian Scientific Language Corpus” project is to compile a large authentic Lithuanian scientific language database, which could be used for objective modern studies of quantity and quality parameters of the academic discourse and allow for revealing interdisciplinary peculiarities, genre diversity characteristics, provide information on the existing and potential trends of formation or disappearance of peculiarity and identity of Lithuanian scientific language and reveal the factors, determining the processes. The collection of texts is very necessary for teaching and self-sufficient learning of academic writing, since the collected actual materials were not developed by individual researchers or linguists – they reflect the real linguistic situation, collective intuition and real use.