Lietuviško balso sintezatorių kokybės vertinimas

Direct Link:
Collection:
Mokslo publikacijos / Scientific publications
Document Type:
Straipsnis / Article
Language:
Lietuvių kalba / Lithuanian
Title:
Lietuviško balso sintezatorių kokybės vertinimas
Alternative Title:
Evaluation of Lithuanian text-to-speech synthesizers
In the Journal:
Kalbų studijos [Studies About Languages]. 2016, Nr. 28, p. 80-91
Summary / Abstract:

LTKitų kalbų balso sintezė iš teksto plačiai naudojama jau kelis dešimtmečius, tuo tarpu kuriant lietuvių kalbos sintezatorius esminis proveržis įvyko tik pastaraisiais metais. Vien 2013–2015 metais pasirodė šeši nauji lietuviški sintetiniai balsai. Todėl atsirado poreikis įvertinti naujai atsiradusius lietuviško balso sintezatorius. Šiame darbe pateikta chronologinė esamų lietuviško balso sintezatorių apžvalga, išsamiau aprašytas naujausiuose sintezatoriuose SINT.AS ir LIEPA pritaikytas vienetų parinkimo algoritmas bei vykdyta diktorių atranka, nes tai turėjo lemiamos reikšmės sintezuoto balso kokybei. Pagrindinės sintetinio balso charakteristikos yra suprantamumas ir priimtinumas, jos vertinamos pasitelkiant žmones-klausytojus ir gautus duomenis apdorojant statistiniais metodais. Taigi šiame darbe tiriami devyni naujausi lietuviški sintetiniai balsai (Regina, Edvardas, Aistė, Vladas, Laima, Marijus, Egidius, Aistis 2 ir Gintaras), bandoma įvertinti, koks iš tikrųjų sintetinių balsų suprantamumas pasiektas, palyginti sintezatorius tarpusavyje pagal įvairias charakteristikas, pateikti patarimų potencialiems sintetinio balso taikymų kūrėjams renkantis sintezatorių balsus ir galiausiai parodyti sintezatorių kūrėjams perspektyviausias tobulinimo kryptis. [Iš leidinio]Reikšminiai žodžiai: Balso sintezė iš teksto; Sintezuoto balso priimtinumas; Sintezuoto balso suprantamumas; Vienetų parinkimo metodas; Acceptability of a synthetic voice; Intelligibility of a synthetic voice; Synthetic voice acceptability; Synthetic voice intelligibility; Text-to-speech synthesis; Unit selection algorithm; Units selection method.

ENText-to-speech synthesis of most popular languages is widely used for several decades, while the Lithuanian text-to-speech synthesis breakthrough occurred only in recent years. Six new Lithuanian synthetic voices appeared in 2013-2015. Therefore, there was a need to evaluate the newly created Lithuanian text-to-speech synthesizers. This paper presents a chronological review of the current Lithuanian text-to-speech synthesizers. Unit selection algorithm that was implemented in recent synthesizers SINT.AS and LIEPA and selection procedure of announcers are described in more detail because they were crucial to the synthesized voice quality. The main characteristics of synthetic voice are intelligibility and acceptability; they are assessed by involving human-listeners and the received data are processed by statistical methods. Thus, this paper will investigate nine recent Lithuanian synthetic voices (Regina, Edvardas, Aistė, Vladas, Laima, Marijus, Egidius, Aistis 2, Gintaras) and evaluate what intelligibility of a synthetic voice is actually achieved, which synthesizer is better when comparing them with each other, to give advice to potential synthetic voice application developers when choosing a synthesizer voices and finally to show synthesizer developers the most promising areas of improvement. [From the publication]

DOI:
10.5755/j01.sal.0.28.15130
ISSN:
1648-2824; 2029-7203
Related Publications:
Permalink:
https://www.lituanistika.lt/content/56639
Updated:
2019-01-17 19:55:49
Metrics:
Views: 95    Downloads: 6
Export: