Page 135 - Сборник трудов научно-исследовательских работ студентов МАИ
P. 135

Современные методы автоматического распознавания
                 устной речи, используемые для тональных языков и
                           языков с музыкальным ударением
                                   Радченко Эжен Рене
                                       МАИ, Москва
                                  turnipseason@gmail.com

                     Аннотация
                     Автоматическое      распознавание      речи    широко
               используется  в  поисковых  системах,  программах  для
               перевода,  компьютерном  обучении  языкам,  а  также  во
               многих других областях. В данной статье были определены
               проблемы,  связанные  с  автоматическим  распознаванием
               устной  речи  (CSR)  в  тональных  языках,  а  т.ж.  языках  с
               музыкальным  ударением;  произведён  обзор  современных
               методов  CSR,  ориентированных  на  такие  языки.  В  конце
               работы  обсуждается  возможность  использования  этих
               методов для распознавания устной речи на японском языке.
                     Ключевые  слова:  автоматическое  распознавание
               речи, тональные языки, языки с музыкальным ударением
                     Введение
                     Стандартно,       устная      речь       анализируется
               автоматически  с  помощью  распознавания  образов  -
               алгоритмы  обучаются  на  наборах  данных,  звуки
               сопоставляются со значениями, взятыми из существующих
               языковых корпусов.
                     Помимо обычных проблем, которые можно ожидать
               при  попытках  анализа  речи,  таких  как  уровень  шума  в
               любой данной среде, с некоторыми  типами языков могут
               возникнуть другие трудности.
                     Описание существующих категорий языков.
                     Большинство  языков  можно  отнести  к  одной  из
               следующих категорий:





                                             135
   130   131   132   133   134   135   136   137   138   139   140