Page 139 - Сборник трудов научно-исследовательских работ студентов МАИ
P. 139
Современные методы
В исследовании (1) было предложено
усовершенствование этого метода.
Вместо разделения начального слога на два, один из
которых нёс тональную информацию, достаточно было
извлечь только главный гласный каждого слога, чтобы
точно изобразить тональный контур слога.
Точность метода основного гласного оказалась лучше,
чем точность метода с использованием полуслогов,
несмотря на то что размер набора анализированных фонем
был значительно уменьшен.
Другой подход к сокращению набора фонем
сосредоточен на лексических и языковых моделях для
устранения неоднозначности омонимов. В нём был
использован критерий взаимной информации (MIC -
измеримое «количество информации» об одной случайной
величине, которое можно получить, наблюдая за другой
случайной величиной; используется, например, в HMM).
Взаимная информация между словами и их
транскрипцией измерялась на основе данного языкового
корпуса. Затем, используя алгоритм поиска, разработанный
авторами статьи (2), фонетические единицы объединялись
таким образом, чтобы минимизировать взаимную потерю
информации.
Кратко этот метод можно описать так: при наличии
двух наборов фонем, если из одного из них точно можно
«предсказать», что за слово было произнесено, не
анализируя другой набор, эти два набора будут
объединены, сокращая пространство поиска.
Таким образом, при использовании языковых и
лексических моделей, значительное количество этих
фонемных слияний может быть выполнено без какой-либо
139

