Цифровая обработка речевых сигналов

Автор(ы):Рабинер Л., Гоулд Б.
06.10.2007
Год изд.:1981
Описание: Рассматриваются вопросы цифровой обработки речевых сигналов в системах предачи информации и управления ЭВМ голосом. Излагаются проблемы цифрового представления речевых сигналов: временная дискредитация, интерполяция, квантование, проектирование цифровых фильтров. Обсуждаются способы построения цифровых систем передачи, систем идентификации и верификации диктора. Предназначена для инженеров, специализирующихся в данной области, а также для студентов вузов соответствующих специальностей.
Оглавление: Предисловие к русскому изданию [5]
Предисловие [6]
1. Введение [9]
  1.0. Цель книги [9]
  1.1. Речевой сигнал [9]
  1.2. Обработка сигналов [10]
  1.3. Цифровая обработка сигналов [11]
  1.4. Цифровая обработка речи [12]
    1.4.1. Цифровая передача и хранение речевого сигнала [14]
    1.4.2. Системы синтеза речи [15]
    1.4.3. Системы верификации и идентификации диктора [15]
    1.4.4. Системы распознавания речи [15]
    1.4.5. Устранение дефектов речи [15]
    1.4.6. Улучшение качества речевого сигнала [16]
  1.5. Заключение [16]
2. Основы цифровой обработки сигналов [16]
  2.0. Введение [16]
  2.1. Сигналы и системы в дискретном времени [16]
  2.2. Описание преобразовании сигналов и систем [19]
    2.2.1. Прямое и обратное преобразованне [19]
    2.2.2. Преобразование Фурье [21]
    2.2.3. Дискретное преобразование Фурье [22]
  2.3. Основы цифровой фильтрации [24]
    2.3.1. Системы с конечными импульсными характеристиками [26]
    2.3.2. Системы с бесконечными импульсными характеристиками [27]
  2.4. Дискретизация [30]
    2.4.1. Теорема дискретизации [30]
    2.4.2. Прореживание и интерполяция дискретизированного сигнала [32]
  2.5. Заключение [37]
  Задачи [37]
3. Цифровые модели речевых сигналов [41]
  3.0. Введение [41]
  3.1. Процесс образования речи [42]
    3.1.1. Механизм речеобразования [42]
    3.1.2. Акустическая фонетика [45]
  3.2. Акустическая теория речеобразования [59]
    3.2.1. Распространение звуков [59]
    3.2.2. Однородная труба без потерь (пример) [63]
    3.2.3. Потерн в голосовом тракте [66]
    3.2.4. Излучение через губы [71]
    3.2.5. Передаточная функция голосового тракта для гласных [74]
    3.2.6. Влияние носовой полости [77]
    3.2.7. Возбуждение звуков в голосовом тракте [78]
    3.2.8. Модели сигнала, основанные на акустической теории [82]
  3.3. Модели с трубами без потерь [83]
    3.3.1. Распространение звуковых волн в соединении труб без потерь [83]
    3.3.2. Граничные условия [86]
    3.3.3. Связь с цифровыми фильтрами [88]
    3.3.4. Передаточная функция модели с трубами без потерь [92]
  3.4. Цифровые модели речевых сигналов [97]
    3.4.1. Голосовой тракт [99]
    3.4.2. Излучение [101]
    3.4.3. Возбуждение [102]
    3.4.4. Полная модель [104]
  3.5. Заключение [105]
  Задачи [105]
4. Методы обработки речевых сигналов во временной области [110]
  4.0. Введение [110]
  4.1. Текущая обработка речевых сигналов [110]
  4.2. Кратковременная энергия и кратковременное среднее значение сигнала [113]
  4.3. Кратковременная функция среднего числа переходов через нуль [119]
  4.4. Разделение речи н пауз на основе функций кратковременной энергии и среднего числа переходов через нуль [123]
  4.5. Оценивание периода основного тона на основе параллельной обработки [128]
  4.6. Кратковременная автокорреляционная функция [133]
  4.7. Кратковременная функция среднего значения разности [141]
  4.8. Оценивание периода основного тона по автокорреляционной функции [143]
  4.9. Медианное сглаживание и обработка речи [150]
  4.10. Заключение [154]
  Приложение. Сокращение объема вычислений при расчете автокорреляционной функции [154]
  Задачи [156]
5. Цифровое представление речевых сигналов [160]
  5.0. Введение [160]
  5.1. Дискретизация речевых сигналов [161]
  5.2. Обзор статистических моделей речевых сигналов [162]
  5.3. Квантование мгновенных значений [166]
    5.3.1. Равномерное квантование [168]
    5.3.2. Мгновенное компандирование [174]
    5.3.3. Оптимальное квантование [178]
  5.4. Адаптивное квантование [183]
    5.4.1. Адаптация по входному сигналу [185]
    5.4.2. Адаптация по выходному сигналу [190]
    5.4.3. Общие замечания [194]
  5.5. Общая теория разностного квантования [194]
  5.6. Дельта-модуляция [202]
    5.6.1. Линейная дельта-модуляция [202]
    5.6.2. Адаптивная дельта-модуляция [206]
    5.6.3. Предсказание высокого порядка в дельта-модуляции [211]
  5.7. Разностная ИКМ [212]
    5.7.1. АРИКМ с адаптивным квантованием [213]
    5.7.2. АРИКМ с адаптивным предсказанием [215]
  5.8. Сравнение систем [220]
  5.9. Преобразования способов кодирования [222]
    5.9.1. Преобразование Л ДМ в ИКМ [223]
    5.9.2. Преобразование ИКМ—АРИКМ [225]
  5.10. Заключение [226]
  Задачи [226]
6. Кратковременный анализ Фурье [231]
  6.0. Введение [231]
  6.1. Определения и свойства [232]
    6.1.1. Интерпретация преобразования Фурье [233]
    6.1.2. Интерпретация посредством линейной фильтрации [241]
    6.1.3. Частоты дискретизации Xn(eiw) по времени и частоте [244]
    6.1.4. Кратковременный синтез методом суммирования выходов гребенки фильтров [247]
    6.1.5. Кратковременный синтез методом суммирования с наложением [255]
    6.1.6. Влияние преобразований кратковременного спектра на синтез [258]
    6.1.7. Аддитивное преобразование [261]
    6.1.8. Обзор методов кратковременного анализа и синтеза речи [262]
  6.2. Проектирование гребенок цифровых фильтров [263]
    6.2.1. Соображения практического характера [263]
    6.2.2. Проектирование гребенок с БИХ-фильтрами [271]
    6.2.3. Проектирование гребенок с КИХ-фильтрами [273]
  6.3. Реализация метода суммирования выходов гребенки фильтров с помощью БПФ [281]
    6.3.1. Методы анализа [281]
    6.3.2. Методы синтеза [285]
  6.4. Спектрографическое отображение [289]
  6.5. Выделение основного тона [294]
  6.6. Анализ через синтез [297]
    6.6.1. Спектральный анализ, синхронный с основным тоном [297]
    6.6.2. Анализ полюсов и нулей модели с помощью анализа через синтез [300]
    6.6.3. Оценивание глоттальных колебаний, синхронное с основным тоном [301]
  6.7. Системы анализа-синтеза [302]
    6.7.1. Цифровое кодирование кратковременного преобразования Фурье [303]
    6.7.2. Фазовый вокодер [312]
    6.7.3. Полосный вокодер [319]
  6.8. Заключение [323]
  Задачи [323]
7. Гомоморфная обработка речи [329]
  7.0. Введение [329]
  7.1. Гомоморфные относительно свертки системы [329]
    7.1.1. Свойства комплексного кепстра [333]
    7.1.2. Вычислительные аспекты [337]
  7.2. Комплексный кепстр речи [340]
  7.3. Оценивание основного тона [344]
  7.4. Оценивание формант [351]
  7.5. Гомоморфный вокодер [358]
  7.6. Заключение [363]
  Задачи [363]
8. Кодирование речевых сигналов на основе линейного предсказания [365]
  8.0. Введение [365]
  8.1. Методы анализа на основе линейного предсказания [366]
    8.1.1. Автокорреляционный метод [370]
    8.1.2. Коварционный метод [372]
    8.1.3. Заключение [374]
  8.2. Вычисление коэффициента усиления модели [374]
  8.3. Решения уравнений линейного предсказания [377]
    8.3.1. Решение на основе разложения Холецкого для ковариационного метода [377]
    8.3.2. Алгоритм Дарбина для рекурсивного решения автокорреляционных уравнений [380]
    8.3.3. Постановка задачи и ее решение на основе лестничного фильтра [382]
  8.4. Сравнение методов решения уравнений линейного предсказания [386]
  8.5. Погрешность предсказания [390]
    8.5.1. Другие выражения для нормированного среднего квадрата погрешности предсказания [394]
    8.5.2. Экспериментальное определение погрешности предсказания [395]
    8.5.3. Зависимость нормированной погрешности предсказания от положения интервала анализа [399]
  8.6. Анализ линейного предсказания в частотной области [401]
    8.6.1. Спектральная трактовка среднего квадрата погрешности предсказания [402]
    8.6.2. Сравнение кратковременного спектрального анализа с оценкой спектра на основе линейного предсказания [405]
    8.6.3. Селективное линейное предсказание [406]
    8.6.4. Сравнение методов линейного предсказания с методами анализа через синтез [407]
  8.7. Применение анализа на основе линейного предсказания к моделям речевого тракта в виде труб без потерь [408]
  8.8. Соотношения между различными параметрами речи [410]
    8.8.1. Корин полинома передаточной функции предсказателя [410]
    8.8.2. Кепстр [411]
    8.8.3. Импульсная характеристика полюсной системы [411]
    8.8.4. Автокорреляционная функция импульсной характеристики [411]
    8.8.5. Коэффициенты автокорреляции полиномиальной передаточной функции предсказателя [412]
    8.8.6. Коэффициенты частной корреляции [412]
    8.8.7. Логарифм отношения площадей [413]
  8.9. Синтез речевого сигнала по параметрам линейного предсказания [413]
  8.10. Применение параметров линейного предсказания [416]
    8.10.1. Оценивание основного тона на основе коэффициентов линейного предсказания [416]
    8.10.2. Форматный анализ с использованием коэффициентов линейного предсказания [419]
    8.10.3. Вокодер на основе линейного предсказания [420]
    8.10.4. Полувокодер с линейным предсказанием [422]
  8.11. Заключение [424]
  Задачи [424]
9. Цифровая обработка речи в системах речевого общения человека с машиной [429]
  9.0. Введение [429]
  9.1. Системы с речевым ответом [430]
    9.1.1. Основные аспекты построения систем с речевым ответом [431]
    9.1.2. Многоканальная цифровая система с речевым ответом [435]
    9.1.3. Система синтеза речи на основе последовательного объединения слов, закодированных формантами [436]
    9.1.4. Применение систем с речевым ответом [439]
  9.2. Системы распознавания-дикторов [442]
    9.2.1. Система верификации диктора [444]
    9.2.2. Система идентификации диктора [450]
  9.3. Системы распознавания речи [455]
    9.3.1. Система распознавания изолированных цифр [456]
    9.3.2. Система распознавания слитной последовательности цифр [459]
    9.3.3. Меры различимости в пространстве параметров линейного предсказания [464]
    9.3.4. Система распознавания с большим объемом словаря [466]
  9.4. Комбинированная система речевого общения с машиной [468]
  9.5. Заключение [469]
Список литературы [472]
Дополнительная литература [486]
Предметный указатель [489]
Формат: djvu
Размер:8534887 байт
Язык:РУС
Рейтинг: 364 Рейтинг
Открыть: