Lietuviško balso sintezatorių kokybės vertinimas

Kasparaitis, Pijus

doi:https://doi.org/10.5755/j01.sal.0.28.15130

Lietuviško balso sintezatorių kokybės vertinimas

Direct Link:

Open Access (CC) BY 4.0

Collection:

Mokslo publikacijos / Scientific publications

Document Type:

Straipsnis / Article

Language:

Lietuvių kalba / Lithuanian

Title:

Lietuviško balso sintezatorių kokybės vertinimas

Alternative Title:

Evaluation of Lithuanian text-to-speech synthesizers

Authors:

Kasparaitis, Pijus

In the Journal:

Kalbų studijos Studies About Languages, 2016, 28, 80-91

Summary / Abstract:

LTKitų kalbų balso sintezė iš teksto plačiai naudojama jau kelis dešimtmečius, tuo tarpu kuriant lietuvių kalbos sintezatorius esminis proveržis įvyko tik pastaraisiais metais. Vien 2013–2015 metais pasirodė šeši nauji lietuviški sintetiniai balsai. Todėl atsirado poreikis įvertinti naujai atsiradusius lietuviško balso sintezatorius. Šiame darbe pateikta chronologinė esamų lietuviško balso sintezatorių apžvalga, išsamiau aprašytas naujausiuose sintezatoriuose SINT.AS ir LIEPA pritaikytas vienetų parinkimo algoritmas bei vykdyta diktorių atranka, nes tai turėjo lemiamos reikšmės sintezuoto balso kokybei. Pagrindinės sintetinio balso charakteristikos yra suprantamumas ir priimtinumas, jos vertinamos pasitelkiant žmones-klausytojus ir gautus duomenis apdorojant statistiniais metodais. Taigi šiame darbe tiriami devyni naujausi lietuviški sintetiniai balsai (Regina, Edvardas, Aistė, Vladas, Laima, Marijus, Egidius, Aistis 2 ir Gintaras), bandoma įvertinti, koks iš tikrųjų sintetinių balsų suprantamumas pasiektas, palyginti sintezatorius tarpusavyje pagal įvairias charakteristikas, pateikti patarimų potencialiems sintetinio balso taikymų kūrėjams renkantis sintezatorių balsus ir galiausiai parodyti sintezatorių kūrėjams perspektyviausias tobulinimo kryptis.

ENText-to-speech synthesis of most popular languages is widely used for several decades, while the Lithuanian text-to-speech synthesis breakthrough occurred only in recent years. Six new Lithuanian synthetic voices appeared in 2013-2015. Therefore, there was a need to evaluate the newly created Lithuanian text-to-speech synthesizers. This paper presents a chronological review of the current Lithuanian text-to-speech synthesizers. Unit selection algorithm that was implemented in recent synthesizers SINT.AS and LIEPA and selection procedure of announcers are described in more detail because they were crucial to the synthesized voice quality. The main characteristics of synthetic voice are intelligibility and acceptability; they are assessed by involving human-listeners and the received data are processed by statistical methods. Thus, this paper will investigate nine recent Lithuanian synthetic voices (Regina, Edvardas, Aistė, Vladas, Laima, Marijus, Egidius, Aistis 2, Gintaras) and evaluate what intelligibility of a synthetic voice is actually achieved, which synthesizer is better when comparing them with each other, to give advice to potential synthetic voice application developers when choosing a synthesizer voices and finally to show synthesizer developers the most promising areas of improvement.

DOI:

10.5755/j01.sal.0.28.15130

ISSN:

1648-2824; 2029-7203

Subject:

Kalbotyra / Linguistics

Related Publications:

Klitikų paieškos lietuviškame tekste algoritmai. Kalbų studijos 2007, 10, 30-37.
Lietuvių kalbos homografų vienareikšminimas remiantis leksemų ir morfologinių pažymų vartosenos dažniais. Kalbų studijos 2009, 14, 25-31.

Permalink:

https://www.lituanistika.lt/content/56639

Updated:

2025-02-28 13:36:46

Metrics:

Views: 175 Downloads: 6

Export:

Choose type:

Download

User ID:
User Password: