Построение системы распознавания речевых сигналов

Автор(ы):  Хеин Мин Зо, Курский государственный университет, г. Курск, Россия, аспирант кафедры программного обеспечения и администрирования информационных систем, heinminnzaw13@gmail.com

В.М. Довгаль, Доктор наук, Курский государственный университет, г. Курск, Россия, профессор кафедры программного обеспечения и администрирования информационных систем

В.А. Кудинов, Доктор наук, Профессор, Курская государственная сельскохозяйственная академия имени проф. И.И. Иванова, Курск, Россия, kudinovva@yandex.ru

Журнал:  Том 46, № 2

Рубрика:  Инфокоммуникационные технологии

Аннотация:  В работе описаны подходы к разработке системы распознавания речевых сигналов, которая представлена как сложная совокупность различных блоков обработки, для которой устанавливается набор параметров, обеспечивающих наиболее точное описание речевого сигнала в условиях неблагоприятной помеховой обстановки. Рассмотрены два основных подхода при анализе в частотной области – анализ спектра с помощью блока полосовых фильтров и анализ на основе кодирования с линейным предсказанием (LPC-анализ). Для практического примера рассмотрен логарифмический спектр сигнала, полученный обычным преобразованием Фурье и с помощью LPC-коэффициентов). Отмечены основные преимущества LPC-метода в сравнении с анализом с помощью блока фильтров.

Ключевые слова:  речевой сигнал, система распознавания, преобразование Фурье, вспомогательные коэффициенты, LPC-коэффициенты, z-характеристика

Полный текст (PDF):  Загрузить

Количество скачиваний:  254


Нашли ошибку? Выделите фрагмент текста и нажмите Ctrl+Enter.
Сообщение об ошибке автоматически отправится в редакцию.