Syntéza řeči

Z Wikipedie, otevřené encyklopedie
Skočit na: Navigace, Hledání
Stephen Hawking je jeden z nejznámějších lidí, kteří ke komunikaci používají syntézu řeči.

Syntéza řeči je umělá tvorba lidské řeči. Počítačové programy používané k tomuto účelu se nazývají „syntetizátory řeči“. Programy „text na řeč“ (text-to-speech, TTS) produkují řeč z textu psaného běžným jazykem; existují i programy, které jako vstup využívají fonetickou transkripci.[1] Řeč může být tvořena spojováním úseků nahrané řeči, které jsou uloženy v databázi. Takovéto databáze mohou obsahovat např. fóny a difóny nebo celá slova. V prvním případě je kvantita možného výsledku upřednostňována před kvalitou, v druhém je to naopak. Některé syntetizátory mohou řeč tvořit simulací charakteristik lidské řeči a vytvářet tak doslova umělou řeč.[2]

Kvalita syntetizátoru řeči se posuzuje podle podobnosti výstupu s lidskou řečí. Schopné programy umožňují lidem se zrakovými vadami nebo poruchami čtení poslouchat psané texty. Mnoho operačních systémů obsahuje syntetizátory řeči od počátku 80. let.

Odkazy[editovat | editovat zdroj]

Reference[editovat | editovat zdroj]

V tomto článku byl použit překlad textu z článku Speech synthesis na anglické Wikipedii.

  1. Jonathan Allen, M. Sharon Hunnicutt, Dennis Klatt, From Text to Speech: The MITalk system. Cambridge University Press: 1987. ISBN 0-521-30641-8
  2. "An articulatory synthesizer for perceptual research"(1981). Journal of the Acoustical Society of America70(2): 321–328. doi:10.1121/1.386780.