Назад в библиотеку

Классификация систем распознавания речи

Авторы: С.А. Федосин, А. Ю. Еремин

Источник: Федосин С.А., Еремин А. Ю. Классификация систем распознавания речи // "ЭЛЕКТРОНИКА И ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ" электронное научное периодическое издание. — 2010.

Аннотация

В данной работе сделана попытка классификации существующих подходов к решению проблем rлассификация систем распознавания речи


Задача создания надежной системы распознавания речи, устойчивой к шумам, с низкой частотой появления ошибок, является одной из актуальных на сегодняшний день. Технологии распознавания речи появились весьма давно. Хорошо известны исторические работы Дэвиса, Биддульфа и Балашека (1952), Нагаты, Като и Чибы (1962), Зайцева и Тимофеева (1965), Кинга и Тьюниса (1966), Голда (1966), Величко и Загоруйко (1969). Особенно быстро развитие технологии распознавания речи получили после появления устройств цифровой обработки, выполненных в виде микросхем и позволивших создать относительно дешевые распознаватели, работавшие в режиме реального времени. По мере роста вычислительной мощности сначала специализированных акустических, а затем и цифровых сигнальных процессоров усложнялись и совершенствовались алгоритмы, использовавшиеся в системах распознавания речи . Однако точность систем распознавания речи достигла своего пика в 1999 году и с тех пор застыла на месте. Различные тесты показывают, что современные системы общего профиля так и не преодолели уровень распознавания в 80%, тогда как у человека этот показатель составляет 96-98%. Поэтому крайне необходимо продолжать исследования в этой области.

В данной работе сделана попытка классификации существующих подходов к решению этой проблемы. Классификацию систем распознавания речи следует начать с определения основных аспектов этих систем. К таким аспектам можно отнести:

Выводы

Анализ основных аспектов систем распознавания речи показал, что в настоящее время не существует универсальной системы, которая бы была самообучаемой, дикторонезависимой, устойчивой к шумам, распознающей слитную речь, способной работать со словарями больших размеров и при этом иметь низкую частоту появления ошибок. Представленная в данной работе классификация систем распознавания речи позволит сузить область исследований в этом направлении при разработке

Литература

  1. Burger S., Sloane Z., Yang. J. Competitive Evaluation of Commercially Available Speech Recognizers in Multiple Languages / Susan Burger, Zachary Sloane, Jie Yang. – Pittsburgh: Carnegie Mellon University, 2006. – 6 p.
  2. Xuedong H. Spoken Language Processing: A Guide to Theory, Algorithm and System Development / Huang Xuedong. – New Jersey: Prentice Hall PTR, 2001. – 1008 p.
  3. Фролов А., Фролов Г., Синтез и распознавание речи. Современные решения [Электронный ресурс] / Александр Фролов, Григорий Фролов. – Электрон. журн. – 2003. – Режим доступа: http://www.frolov-lib.ru
  4. Чесебиев И.А. Компьютерное распознавание и порождение речи / И.А. Чесебиев. – М.: Спорт и культура, 2008 – 128 с