Бакалавр
Дипломные и курсовые на заказ

Синтезаторы речи. 
Интеллектуальные информационные системы

РефератПомощь в написанииУзнать стоимостьмоей работы

Одним из основных параметров, характеризующих синтезаторы речи, является емкость памяти V, необходимая для хранения 1 с речи, — примерно 1,5−2 слова. Для компиляторов она определяется типом параметрического представления речевого сигнала, для универсальных синтезаторов не зависит от типа используемого синтезатора речевых сигналов, а определяется числом фонем (букв текста), произносимых в 1 с. Эти… Читать ещё >

Синтезаторы речи. Интеллектуальные информационные системы (реферат, курсовая, диплом, контрольная)

Эти устройства предназначены для преобразования кодовой последовательности, поступающей от ЭВМ, ПЗУ или линии связи, в непрерывный речевой сигнал. Синтезаторы подразделяются на классы и группы по тем же признакам, что и анализаторы речи. Классам анализаторов речевых сигналов и сообщений соответствуют синтезаторы речевых сигналов и сообщений.

Синтезаторы сообщений делятся по аналогичным признакам на синтезаторы ограниченного словаря — компиляторы — и универсальные.

В компиляторах (рисунок 1.2, а) любое сложное речевое сообщение может быть получено путем компиляции (простого соединения) элементов речи. Элементы речи начитываются диктором, соответствующие им сигналы компрессируются тем или иным способом, кодируются и записываются в ПЗУ. При синтезе речевого сообщения из ПЗУ закодированные речевые элементы считываются в нужной последовательности и одновременно восстанавливается речевой сигнал. Очевидной простотой компиляционного метода и его технической реализации объясняется большое количество сообщений о проектируемых и законченных разработках компиляторов и их применении. Удовлетворительный по качеству компиляционный синтез речи возможен лишь при использовании в качестве элементов речи отдельных фраз либо словоформ, подставляемых в определенное место стандартной фразы. Попытки добиться высококачественного синтеза произвольного текста простой компиляцией словоформ, слогов или аллофонов не привели к положительным результатам. При разработке универсальных синтезаторов речевых сообщений стремятся получить функциональную модель речеобразования, адекватную реально существующим языковым и акустическим явлениям. На входе такой модели — орфографический или фонемный текст произвольного содержания, на выходе — звучащая речь (рисунок 1.2, б). По своему существу разрабатываемые в рамках данного подхода синтезаторы являются кибернетической функциональной моделью чтения текста человеком.

Рисунок 1.2 Схемы синтезаторов речевых сообщений ограниченного (а) и универсального (б) словаря В базе знаний синтезатора хранится не только информация об элементарных единицах речи (эталоны фонем и интонем), но и алгоритмические правила их модификации в зависимости от конкретного контекста звуковой реализации. Процесс применения этих правил к эталонам фонем и интонем для входного синтезируемого текста реализуется лингвистическим процессором. К настоящему времени качество речи и стоимость универсальных синтезаторов достигли коммерчески приемлемых показателей, и они начинают оказывать серьезную конкуренцию компиляторам в силу простоты применения, малого расхода памяти на элемент речи, неограниченности состава словаря синтезируемых сообщений.

Одним из основных параметров, характеризующих синтезаторы речи, является емкость памяти V, необходимая для хранения 1 с речи, — примерно 1,5−2 слова. Для компиляторов она определяется типом параметрического представления речевого сигнала, для универсальных синтезаторов не зависит от типа используемого синтезатора речевых сигналов, а определяется числом фонем (букв текста), произносимых в 1 с.

В классе компиляторов выделены наиболее распространенные типы, различающиеся методом представления речевого сигнала: ИКМ — импульсно-кодовая модуляция; кодек-дельта-модуляция; полосный — спектрально-полосное; ЛПК — линейное предиктивное кодирование; форматный.

Показать весь текст
Заполнить форму текущей работой