Speech Synthesis Markup Language (SSML) (Язык Разметки Синтеза Речи) - представляет собой основанный на XML язык разметки для приложений синтеза речи[1]. Он был рекомендован рабочей группой W3C[2]. SSML часто встраивается в сценарии VoiceXML для интерактивных систем телефонии[3]. Однако, это также может быть использовано независимо от телефонии, например для создания аудиокниг.
SSML основан на языке разметки Java Synthesis Markup Language (JSML), разработанном Sun Microsystems, хотя нынешние рекомендации были разработаны главным образом производителями синтезаторов речи. Он охватывает практически все аспекты синтеза речи, хотя в некоторых областях остались неопределенные аспекты, поэтому каждый производитель принимает иной вариант языка[4]. Кроме того, в отсутствие разметки, синтезатор, как ожидается, должен выполнить своё собственное толкование этого текста. Так SSML не является таким жестким в плане синтаксиса, как язык C, или даже HTML.
Вот пример документа SSML:
<?xml version="1.0"?>
<speak xmlns="http://www.w3.org/2001/10/synthesis"
xmlns:dc="http://purl.org/dc/elements/1.1/"
version="1.0">
<metadata>
<dc:title xml:lang="en">Telephone Menu: Level 1</dc:title>
</metadata>
<p>
<s xml:lang="en-US">
<voice name="David" gender="male" age="25">
For English, press <emphasis>one</emphasis>.
</voice>
</s>
<s xml:lang="es-MX">
<voice name="Miguel" gender="male" age="25">
Para español, oprima el <emphasis>dos</emphasis>.
</voice>
</s>
</p>
</speak>
![Перейти к шаблону «Синтез речи»](https://upload.wikimedia.org/wikipedia/commons/thumb/c/c9/Wikipedia_interwiki_section_gear_icon.svg/14px-Wikipedia_interwiki_section_gear_icon.svg.png) |
---|
Проприетарное ПО |
- Alter/Ego
- BrowseAloud
- Cantor
- CereProc
- CeVIO Creative Studio
- CoolSpeech
- Chipspeech
- DECtalk
- IVONA
- LaLaVoice
- Microsoft Agent
- Microsoft Speech API
- Microsoft text-to-speech voices
- PPG Phonem
- Readspeaker
- Realivox
- Software Automatic Mouth
- Symphonic Choirs
- Synthesizer V
- Talk It!
- Utau
- Voice browser
- Vocaloid
- Voiceroid
|
---|
Свободное ПО | |
---|
Машина |
- Echo 2
- Pattern playback
- Phasor
- RIAS
- Texas Instruments LPC Speech Chips
- TuVox
|
---|
Приложения |
- AOLbyPhone
- DialogOS
- Dr. Sbaitso
- MBROLA
- Microsoft Narrator
- Microsoft Speech Server
- PlainTalk
- Voice font
|
---|
Протоколы | |
---|
Разработчики/ Исследователи | |
---|
Процесс |
- Articulatory synthesis
- Concatenative synthesis
- Currah
- Inverse filter
- PSOLA
- Phase vocoder
- SABLE
- Self-voicing
|
---|
![Перейти к шаблону «Стандарты W3C»](https://upload.wikimedia.org/wikipedia/commons/thumb/c/c9/Wikipedia_interwiki_section_gear_icon.svg/14px-Wikipedia_interwiki_section_gear_icon.svg.png) |
---|
Продукты и стандарты | Рекомендации | |
---|
ООСО | |
---|
Рабочие проекты | |
---|
Руководства |
- Руководящие принципы доступности веб-контента[англ.]
|
---|
Инициативы | |
---|
Выведенные из использования | |
---|
Устаревшие | |
---|
|
---|
Организации | | Рабочие группы | |
---|
Группы сообщества и бизнеса | |
---|
Закрывшиеся группы | |
---|
|
---|
ПО | |
---|
Конференции | |
---|