Page 138 - Сборник трудов научно-исследовательских работ студентов МАИ
P. 138
несколько диалектов с различными тональными паттернами
для одних и тех же слов). Эта проблема особенно очевидна
при работе с омонимами.
Обзор ранее существовавших методов
автоматического распознавания речи:
Чтобы лучше понять методы распознавания речи,
используемые в настоящее время для борьбы с
вышеобозначенными проблемами, необходим взгляд на
ранее использовавшиеся технологии.
На заре создания программного обеспечения для
распознавания речи оцифрованный звуковой сигнал
проходил через двухэтапный процесс. На первом этапе
слоги каждого слова распознавались по их гласным и
согласным звукам. На втором этапе устанавливался
тональный контур (воспринимаемое изменения тона с
течением времени) этих слогов. В совокупности этой
информации было достаточно, чтобы распознать отдельные
слова. Однако такой метод был не очень эффективен для
распознавания непрерывной речи.
В попытке исправить это была предложена
одноэтапная модель.
В ней каждый слог был разделён на два полуслога,
один из которых, называемый тонемой, содержал всю
информацию о высоте тона и рассматривался как обычная
фонема.
Этот подход привёл к значительным улучшениям для
CSR, однако при использовании на языках с большим
количеством различных тонов (например, кантонский)
требуемые объёмы обучающих данных были слишком
большими и, что наиболее важно, декодирование
замедлялось из-за увеличения пространство поиска, в
котором использовались статистические алгоритмы - по
сути, приходилось просматривать слишком много
различных возможностей.
138

