Festival

Festival Speech Synthesis System — обобщенная многоязычная система синтеза речи, разработанная Аланом В. Блэком в Исследовательском Центре Речевых Технологий (CSTR) в университете Эдинбурга. Существенный вклад также был сделан Университетом Карнеги-Меллона и другими. Распространяется под свободной лицензией, аналогичной лицензии BSD.

Festival предлагает полную систему синтеза речи с различными API, а также среду для разработки и исследования методов синтеза речи. Система написана на C++ со Scheme-подобным командным интерпретатором для общей настройки и расширения.[1]

Festival спроектирован для работы с различными языками и поставляется с поддержкой английского (в английском и американском произношении), валлийского и испанского языков. Голосовые пакеты созданы и для других языков, среди которых кастильский, чешский, финский, хинди, итальянский, маратхи, польский, русский[2] и телугу.

Festvox

Проект Festvox направлен на создание новых синтетических голосов с применением более систематизированной и точной процедуры. Распространяется под свободной лицензией, аналогичной лицензии MIT.

Festvox представляет собой набор инструментов для создания синтетических голосов для Festival[3].

Flite

Флайт — небольшой движок синтеза речи, разработанный в Carnegie Mellon University. Основан на Festival и проекте Festvox из Carnegie Mellon University.

Linux-совместимость

Существует Festival-плагин для GStreamer. Festival входит в поставку нескольких дистрибутивов Linux.

См. также

Примечания

  1. «В целом он предлагает полный синтез речи через несколько API-интерфейсов: от уровня оболочки, через командную оболочку на Scheme, как библиотеку C++, от Java, с интерфейсом Emacs-а.»[1] Архивная копия от 25 сентября 2010 на Wayback Machine
  2. Соломенник А. И. / Автоматизация подготовки голоса для системы синтеза русской речи. - Приборостроение. - Февраль 2013
  3. Alan W. Black and Kevin A. Lenzo Building Synthetic Voices Архивная копия от 23 июля 2010 на Wayback Machine

Ссылки

  • Система синтеза речи Festival
  • Festival в CMU
  • Festvox
  • Flite — a small, fast run time synthesis engine
  • Cerva — a Python+GTK Festival frontend
  • Carnival — Карнавал, GUI для Festival
Перейти к шаблону «Синтез речи»
Проприетарное ПО
  • Alter/Ego
  • BrowseAloud
  • Cantor
  • CereProc
  • CeVIO Creative Studio
  • CoolSpeech
  • Chipspeech
  • DECtalk
  • IVONA
  • LaLaVoice
  • Microsoft Agent
  • Microsoft Speech API
  • Microsoft text-to-speech voices
  • PPG Phonem
  • Readspeaker
  • Realivox
  • Software Automatic Mouth
  • Symphonic Choirs
  • Synthesizer V
  • Talk It!
  • Utau
  • Voice browser
  • Vocaloid
  • Voiceroid
Свободное ПО
  • eSpeak
  • Gnuspeech
  • Festival Speech Synthesis System
  • FreeTTS
  • Gnopernicus
  • Orca
  • Sinsy
  • Automatik Text Reader
Машина
  • Echo 2
  • Pattern playback
  • Phasor
  • RIAS
  • Texas Instruments LPC Speech Chips
  • TuVox
Приложения
  • AOLbyPhone
  • DialogOS
  • Dr. Sbaitso
  • MBROLA
  • Microsoft Narrator
  • Microsoft Speech Server
  • PlainTalk
  • Voice font
Протоколы
Разработчики/
Исследователи
Процесс
  • Articulatory synthesis
  • Concatenative synthesis
  • Currah
  • Inverse filter
  • PSOLA
  • Phase vocoder
  • SABLE
  • Self-voicing