Automatinis skiemenavimas : problemos ir jų sprendimas

Mokslo publikacijos / Scientific publications
Document Type:
Straipsnis / Article
Lietuvių kalba / Lithuanian
Automatinis skiemenavimas: problemos ir jų sprendimas
Alternative Title:
Automatic detection of syllable boundaries: problems and their solutions
In the Journal:
Kalbų studijos [Studies About Languages]. 2009, Nr. 15, p. 71-76
Summary / Abstract:

LTNatūraliai pasakytame žodyje tarp skiemenų nėra ryškių fonetinių ribų. Kalbai svarbesnis skiemenų skaičius, o ne tikslios ribos tarp jų. To užtenka ir kuriant skiemenavimo įrankį kalbos kompiuterinio apdorojimo reikmėms. Tačiau fundamentiniams skiemens struktūros tyrimams reikia tikslių skiemens ribų. Tam ir buvo kuriama automatinio skiemenavimo programa. Skiemens ribos čia nustatomos remiantis funkcine skiemens teorija: naujas skiemuo pradedamas maksimaliu priebalsių junginiu, kurio modelis galimas žodžio pradžioje. Tačiau ne visada šis modelis (pučiamasis, sprogstamasis arba afrikata, sklandusis priebalsis) gali būti be išlygų taikomas. Straipsnyje aprašomi probleminiai skiemenavimo atvejai ir jų sprendimas: dviejų balsių samplaikos interpretavimas (dvibalsis, hiatas ar papriešakėjęs balsis), priešdėlių nustatymo sunkumai, morfemų sandūra sudurtiniuose žodžiuose. Skiemenavimo programa klaidų nedaro. Jų gali atsirasti dėl labai retų homografų, vienodai rašomų, bet skirtingai tariamų ir skiemenuojamų žodžių. Tokius atvejus reikia atskirai rankiniu būdu peržiūrėti. Aprašytas skiemenavimo algoritmas naudojamas VDU sukurtose automatinio kirčiavimo ir transkribavimo programose bei fonotaktikos ir ritmikos tyrimuose. [Iš leidinio]Reikšminiai žodžiai: Skiemuo; Skiemenavimas; Algoritmas; Priešdėlis; Syllable; Syllabification; Algorithm; Prefix; Skiemuo; Skiemens centras; Priebalsis.; Syllable; Consonant.

ENIt is difficult to perceive syllable boundaries in a naturally uttered word. The number of syllables and not their exact boundaries is the primary factor affecting speech perception. However the detection of exact syllable boundaries is important to carry out fundamental investigations about the syllable structure. An automatic syllabification tool has been developed for this purpose. Syllable boundaries were defined according to the functional theory of a syllable: the syllable should begin with the maximum cluster of consonants given that such cluster (its model) is found at the beginning of other words. The paper describes some problematic cases where phonological model of a syllable cannot be directly applied. The solutions are proposed for disambiguating the juncture of a pair of consonants (diphthong, hiatus, frontalised vowel), accurately detecting word prefixes, for syllabifying composite (two-root) words. The syllabification algorithm is quite accurate. A few errors occur because of homographs that are spelled identically but pronounced and syllabified differently. The algorithm described in this paper is being used as a component to other language processing tools created at VMU: within algorithms for automatic stress assignment and automatic phonetic transcription, and within computer tools for investigating word phonotactics and text rhythmics. [From the publication]

1648-2824; 2029-7203
Related Publications:
2025-02-28 13:42:09
Views: 176    Downloads: 14