LTPastaraisiais dešimtmečiais vykstantis masyvus rašytinių istorijos šaltinių skaitmeninimas, jų tekstų optinis atpažinimas (OCR) bei pateikimas internete sukuria naujas istorinio tyrimo galimybes ir iššūkius. Šiame straipsnyje pristatomas skaitmeninės humanitarikos tyrimo modelis yra grindžiamas informacijos organizavimo paradigmos ir skaitmeninėmis technologijomis grįstų metodų taikymu praeities kelionių tyrimuose. Tyrimo modelis buvo sukurtas ir testuotas naudojant projekto „Homo viator: kelionių erdvė ir keliautojų potyriai ankstyvosios modernybės Lietuvoje“ medžiagą. Pagrindinė tyrimo problema yra susijusi su tuo, kad vienas svarbių praeities kelionių pažinimo šaltinių yra egodokumentai (laiškai, dienoraščiai, atsiminimai ir kt.), kuriuose greta kitų konkretaus asmens gyvenime svarbių įvykių aprašomos ir kelionės. Tačiau kelionių aprašymai sudaro tik nedidelę konkretaus egodokumento teksto dalį ir yra netolygiai pasiskirstę skirtinguose egodokumentuose. Todėl, atsižvelgiant į egodokumentų ir jų rinkinių teksto apimtis bei įvairiomis kalbomis publikuotų egodokumentų skaičių, jų – kaip šaltinių – tyrimai tik vienu (kelionių) aspektu reikalauja didelių žmogiškųjų ir laiko resursų. Panašią probleminę situaciją turime ir su kitais senųjų kelionių pažinimo šaltiniais: skaitmeniniu pavidalu (įskaitant OCR) publikuotų dokumentų yra daug, jų tekstai didelės apimties, o teksto fragmentai, susiję su kelionėmis, šalių aprašymais, senųjų kelionių maršrutais, kelionių ir mobilumo infrastruktūra, keliautojų potyriais, yra santykinai nedideli ir išsibarstę visame šaltinio tekste.Straipsnyje aprašomą tyrimo modelį sudaro du žingsniai: (i) šaltinių tekstyno su optiškai atpažintu turiniu (OCR) surinkimas; (ii) empirinių duomenų rinkimas taikant žodynu grįstos kompiuterizuotos kokybinės teksto analizės metodą, realizuojant jį su MaxQDA programa. Tekstyno surinkimas yra atliekamas taikant bendruosius mokslinių publikacijų paieškos internete principus bei metodus. Į tekstyną atrenkami autentiški, publikuoti, tyrimui reikalingi šaltiniai (laiškai, dienoraščiai, atsiminimai ir kt.) bei mokslinės publikacijos apie juos, tokiu būdu suformuojant du tekstyno – šaltinių ir literatūros – blokus. s. Literatūros (mokslinių publikacijų apie šaltinius) blokas naudojamas kaip papildoma medžiaga tikslesnei šaltinių tekstyno atrankai ir interpretavimui. Norint taikyti žodynu grįstos kompiuterizuotos kokybinės teksto analizės metodą svarbiausias elementas yra kokybiškas žodynas, tiksliai apibūdinantis tyrimui aktualius konceptus (kategorijas). Atsižvelgiant į šaltinių specifiką (šaltiniuose ir jų vertimuose vartojamas kalbas) buvo sukurtas daugiakalbis lietuvių–lenkų–anglų–rusų–vokiečių kalbų žodynas.Žodyno struktūrą sudaro šeši su praeities kelionėmis susiję konceptai (kategorijos): (i) kelionė (bendras apibūdinimas), (ii) kelias ir jo infrastruktūra (tiltai, brastos ir kt.), (iii) transporto priemonės, (iv) sustojimo ir nakvynės vietos (miesteliai, kaimai, karčemos, pašto stotys ir kt.), (v) kelyje sutikti žmonės (smuklininkai, plėšikai, vedliai ir kt.), (vi) kelionių maistas. Kiekvienas konceptas yra apibūdinamas reikšminių žodžių ir frazių rinkiniu. Paskutiniame tyrimo etape buvo atliktas tyrimo modelio testavimas. Testavimo metu nustatyta, kad modelis leidžia spręsti paminėtas, projekto įgyvendinimo metu atsiradusias, problemas. Reikšminiai žodžiai: ankstyvosios modernybės laikų kelionės, skaitmeniniai humanitariniai mokslai, tarpdisciplininiai tyrimai, žodynu grįsta kompiuterizuota kokybinė teksto analizė. [Iš leidinio]
ENThe massive digitisation of written historical sources, optical character recognition (OCR) of texts, and their online availability in recent decades have created new opportunities and challenges for historical research. The digital humanities research model presented in this paper is based on the information organisation paradigm and the application of digital technology-based methods in studying ancient travels. The model has been developed and tested using the materials of the project “Homo Viator: Travel Space and Travellers’ Experiences in Early Modern Lithuania”. The main problem of the research is related to the fact that one of the essential sources of information about ancient travel are egodocuments (letters, diaries, memoirs, etc.) that contain journeys described alongside other important life events of a particular person. However, travel descriptions form only a small part of a text of a given egodocument and are unevenly distributed among different egodocuments. Therefore, given the size of the text of the egodocuments and their collections and the number of egodocuments published in different languages, researching them as sources in only one aspect (travel) requires a significant amount of human and time resources. A similar problematic situation exists with other sources of knowledge on ancient travel: a massive number of documents published in digital form (including OCR), their texts are voluminous, and the text fragments related to travel, country descriptions, ancient travel routes, travel and mobility infrastructure, and travellers’ experiences are relatively small and scattered throughout the source text. The research model described in the paper is divided into two steps: (i) collection of the corpus of OCR source texts; (ii) collection of empirical data using a dictionary-based computer-aided [or assisted] qualitative text analysis method implemented with the MaxQDA software.The collection of the source text corpus is carried out by applying the general principles and methods of online search of scientific publications. The corpus comprises authentic, published sources relevant to the study (letters, diaries, memoirs, etc.) and scholarly publications about them, thus forming two blocks of text - sources and literature. The literature block is used as additional material for a more precise selection and interpretation of the source texts. A key element for applying a dictionary-based computer-aided [or assisted] qualitative text analysis method is a high-quality dictionary that accurately describes the concepts (categories) relevant to the research. Considering the specificity of the sources (the languages used in the sources and their translations), a multilingual dictionary (Lithuanian-Polish-English-Russian-German) was compiled. The structure of the dictionary consists of six concepts (categories) related to ancient travel: (i) journey (general description), (ii) road and its infrastructure (bridges, fords, etc.), (iii) means of transportation, (iv) resting and accommodation places (towns, villages, taverns, post offices, etc.), (v) people encountered on the way (inn-keepers, highwaymen, guides, etc.), and (vi) food of the journey. A set of keywords and phrases describes each concept. In the last stage of the study, the research model was tested. The testing showed that the model could solve the above problems that arose during the project. Keywords: travel in Early Modern Period, digital humanities, interdisciplinary research, dictionary-based computer-aided [or assisted] qualitative text analysis. [From the publication]