ДонНТУ> Портал магистров ДонНТУ> Главная | Реферат | Библиотека | Ссылки | Отчет о поиске | Индивидуальное задание

Бондаренко Иван Юрьевич

Тема магистерской диссертации:

Интеграция визуального и речевого способов управления процессом ввода и редактирования текстовой информации

Руководитель: Федяев О.И., доц., к.т.н.

Email: bond005@yandex.ru


Список ссылок по теме "Распознавание речи и речевые системы управления"

Составитель: Бондаренко Иван Юрьевич


Отчёт о поиске Internet-ресурсов по теме лежит здесь.

ОГЛАВЛЕНИЕ

  1. Специализированные сервера и порталы по теме
  2. Сайты магистров прошлых лет
  3. Персональные сайты специалистов, занимающихся речевыми технологиями
  4. Сайты периодических изданий
  5. Сайты научно-исследовательских организаций
  6. Сайты бизнес-структур, занимающихся речевыми технологиями
  7. Отдельные статьи и доклады

1 СПЕЦИАЛИЗИРОВАННЫЕ СЕРВЕРА И ПОРТАЛЫ ПО ТЕМЕ

1.1 Информационный портал речевых технологий
http://art.bdk.com.ru/govor/

Здесь содержится обширный обзор программных продуктов, использующих речевые технологии, а также информация об их разработчиках. Приведены результаты тестирования некоторых из описанных программ. Есть большой перечень ссылок на другие сайты, посвящённые распознаванию и синтезу речи. Что же касается статей, размещённых в этом портале, то они носят не научный, а скорее научно-популярный характер, и не представляют большого интереса. В целом, портал отлично выполняет функцию общего ознакомления с современным состоянием дел в области речевых технологий, но не более. Научного описания конкретных методов в нём не найти.

Моя оценка: 10 баллов (из 10)

1.2 "Цифровая обработка сигналов" - сайт
http://dsp-book.narod.ru/

Замечательная подборка "классиков" цифровой обработки сигналов (Голд, Марпл, Оппенгейм, Рабинер и др.). На мой взгляд, с этими работами должен познакомится каждый, кто занимается распознаванием речи.

Моя оценка: 10 баллов (из 10)

1.3 Сайт з розпізнавання та синтезу мовлення в Україні
http://www.speech.com.ua/index.html

Сайт примечателен прежде всего тем, что он украинский. В целом полезной информации здесь не так уж много: несколько электронных статей и весьма скромный список ссылок.

Моя оценка: 8 баллов (из 10)

2 САЙТЫ МАГИСТРОВ ПРОШЛЫХ ЛЕТ

2.1 Сайт магистра ДонНТУ Василенко Олега Владимировича
http://www.masters.donntu.ru/2002/fvti/vasylenko/index.htm

Василенко О.И. - мой предшественник. Я начал заниматься распознаванием речи со знакомства с его магистерской работой, посвященной анализу эфективности метода нечёткого сопоставления образов, впервые предложенного японскими учёными (эту работу можно прочитать из моей библиотеки). Сайт Василенко содержит довольно подробное описание этого метода. Однако временные изменения характерных временных образов, обусловленные разной скоростью произношения одних и тех же фонем, рассматриваются как линейные, что повышает быстродействие системы распознавания, но снижает её качество.

Моя оценка: 9 баллов (из 10)

2.2 Персональная страница Николаенко Дениса Владимировича
http://www.d-nikolaenko.narod.ru

На сайте представлена выпускная работа магистра группы ВТ-97б нашего университета Николаенко Д.В. "Разработка и исследование алгоритмов построения динамического портрета речевого сигнала". На мой взгляд, некоторый интерес в данной работе представляет раздел, посвященный тестированию четырёх программных продуктов, основанных на технологии распознавания речи, - Dragon NaturallySpeaking Preffered, IBM ViaVoice 98 Executive Edition, Lernout & Hauspie Voice Xpress Professional и Philips FreeSpeech 98. Описание методов, используемых в данной работе для построения динамического портрета, можно найти в книге Рабинера Л.Р. и Шафера Р.В. "Цифровая обработка речевых сигналов" (лежит на сайте "Цифровая обработка сигналов").

Моя оценка: 8 баллов (из 10)

2.3 Сайт магистра ДонНТУ Марченко Елизаветы Евгеньевны
http://www.masters.donntu.ru/2001/fvti/marchenko/index.htm

В работе "Проектирование и разработка естественно-языкового диалогового интерфейса к реляционным базам данных" Марченко Е.Е. рассматриваются вопросы применения естественно-языковых интерфейсов в системах электронной коммерции. В отличие от моей работы, посвящённой разработке речевого командного интерфейса, здесь решается задача проектирования речевого диалогового интерфейса системы автоматической продажи напитков. Основной упор сделан на исследовании проблемы синтаксического и лексического анализа фразы естественного языка, уже преобразованной из речевой формы представления в текстовую. Более сложная проблема преобразования речи в текст не рассматривается.

Моя оценка: 8 баллов (из 10)

3 ПЕРСОНАЛЬНЫЕ САЙТЫ СПЕЦИАЛИСТОВ, ЗАНИМАЮЩИХСЯ РЕЧЕВЫМИ ТЕХНОЛОГИЯМИ

3.1 Сайт доктора техн. наук, проф. МФТИ Арлазарова Владимира Львовича
http://www.isa.ru/persons/persons.asp?id=228

В.Л.Арлазаров - один из крупнейших учёных в области информатики и искусственного интеллекта. На основе его работ была создана советская шахматная программа "Каисса", ставшая в 1974 году первым чемпионом мира среди шахматных программ. На сайте представлены результаты работ В.Л.Арлазарова в области распознавания речи. Изложены основные принципы созданной методики распознавания речи. Приведены результаты тестирования разработанной системы распознавания на ограниченном словаре объёмом 200 слов при участии 50 дикторов. Более подробное описание методов распознавания отсутствует.

Моя оценка: 9 баллов (из 10)

3.2 Fractal Analysis
http://impb.psn.ru/~sychyov/

Домашняя страница кандидата физ.-мат. наук Сычева Вячеслава Викторовича. В разделе "Распознавание речи" лежит его дипломная работа "Обработка речевых сигналов", сделанная в годы обучения в МГУ. В работе заслуживает внимания формализованное описание метода нелинейной временной нормализации речевых образов, основанного на алгоритме Dynamic Time Warping.

Моя оценка: 10 баллов (из 10)

3.3 Speech Recognition by Dynamic Time Warping
http://www.dcs.shef.ac.uk/~stu/com326/index.html

Раздел домашней страницы подданного британской короны, преподавателя Шеффилдского университета, доктора философии (по-нашему, кандидата наук) Stuart N. Wrigley, занимающегося проблемами распознавания и синтеза речи в научно-исследовательской группе SpandH при Шеффилдском университете. Здесь приведено подробное описание алгоритмов Symmetrical Dynamic Time Warping (SymDTW) и Asymmetrical Dynamic Time Warping (AsymDTW). Проведён сравнительный анализ эффективности систем распознавания речевых слов, использующих SymDTW и AsymDTW.

Моя оценка: 10 баллов (из 10)

4 САЙТЫ ПЕРИОДИЧЕСКИХ ИЗДАНИЙ

4.1 "Цифровая обработка сигналов" - научно-технический журнал
http://www.dspa.ru/

На сайте журнала содержатся рефераты опубликованных статей, среди которых содержится много статей по цифровой обработке речевых сигналов и распознаванию речи. Полные тексты статей можно найти только в бумажной версии журнала.

Моя оценка: 9 баллов (из 10)

4.2 Электронный журнал "Техническая акустика"
http://ejta.org/ru

На сайте журнала можно найти интересные статьи по цифровой обработке акустических сигналов, в том числе и речевых, а также статьи по распознаванию речи. Все статьи доступны для скачивания.

Моя оценка: 10 баллов (из 10)

4.3 Научный журнал "Информатика"
http://uiip.bas-net.by/magazine/index.htm

Официальный сайт научного журнала "Информатика", издаваемого Объединённым институтом проблем информатики НАН Беларуси. В номерах журнала под рубрикой "Обработка сигналов, изображений и речи" содержится много публикаций по темам, связанных с цифровой обработкой речевых сигналов, распознаванием и пониманием устной речи. Однако все статьи представлены лишь аннотациями, а их полные варианты доступны только в печатной версии журнала.

Моя оценка: 9 баллов (из 10)

4.4 "Нейрокомпьютеры: разработка, применение" - научно-технический журнал
http://webcenter.ru/~iprzhr/nejrcomp.html

На сайте журнала содержатся аннотации опубликованных статей, связанных с нейроинформатикой и нейроматематикой. Есть ряд статей, посвященных применению нейросетевых подходов для решения задачи распознавания речи. Полные тексты статей можно найти только в бумажной версии журнала.

Моя оценка: 9 баллов (из 10)

4.5 Научно-технический журнал "Проблемы управления"
http://www.ipu.ru/period/pu/default.htm

Журнал Института проблем управления им. В.А.Трапезникова РАН. В электронном архиве номеров журнала можно найти статьи о применениии речевых технологий в компьютерных системах массового обслуживания.

Моя оценка: 8 баллов (из 10)

4.6 Сетевой электронный научный журнал "Системотехника"
http://systech.miem.edu.ru/

Здесь иногда публикуются статьи, связанные с речевыми технологиями.

Моя оценка: 8 баллов (из 10)

4.7 Электронный журнал "Открытые системы"
http://www.osp.ru/os/

В электронном архиве номеров журнала можно найти довольно много статей о программных продуктах, использующих распознавание и синтез речи. К сожалению, большинство из этих статей является рекламой авторских разработок, а о применяемой методике ничего не говорится.

Моя оценка: 8 баллов (из 10)

4.8 Электронный журнал "Инженерное образование"
http://www.techno.edu.ru:16001

В номерах журнала есть интересные статьи по распознаванию речи (правда, их немного).

Моя оценка: 8 баллов (из 10)

4.9 Электронный журнал "Современные технологии автоматизации"
http://www.cta.ru/

В архиве можно найти статьи об алгоритмах цифровой обработки сигналов.

Моя оценка: 8 баллов (из 10)

5 САЙТЫ НАУЧНО-ИССЛЕДОВАТЕЛЬСКИХ ОРГАНИЗАЦИЙ

5.1 Intelligent Electronic Systems
http://www.cavs.msstate.edu/hse/ies/

Сайт, посвящённый научно-исследовательской программе "Интеллектуальные электронные системы" (Intelligent Electronic Systems), которая выполняется в Центре перспективных транспортных систем (Center for Advanced Vehicular Systems) Миссисипского государственного университета (Mississippi State University), начиная с 2002 года. На сайте можно найти много интересной информации о методах распознавания слитной речи, в частности, неплохую подборку диссертационных работ на степень доктора философии (PhD), книг и статей по этой тематике (конечно, на английском языке).

Моя оценка: 10 баллов (из 10)

5.2 Speech and Hearing Research Group (SpandH)
http://www.dcs.shef.ac.uk/spandh/

Официальный сайт научно-исследовательской группы SpandH, входящей в состав Шеффилдского университета (Великобритания). Эта группа занимается исследованиями проблем распознавания и синтеза речи. На сайте представлен ряд интересных публикаций сотрудников группы, посвящённых, в частности, статистической модели представления речевого сигнала и распознаванию целых слов по словарям большого объёма. К сожалению, большинство статей представлено лишь аннотациями.

Моя оценка: 9 баллов (из 10)

5.3 Machine Intelligence Laboratory - Speech Group
http://mi.eng.cam.ac.uk/research/speech/

Официальный сайт научно-исследовательской группы по распознаванию речи, которая является структурным подразделением Кембриджского университета. На сайте можно найти много проектов и статей о речевых технологиях. Особое внимание уделяется применению скрытых марковских моделей в распознавании речи.

Моя оценка: 10 баллов (из 10)

5.4 Сектор цифровой обработки и распознавания речевых сигналов ВЦ РАН
http://www.ccas.ru/DCM/Chichag/index.htm

"Основная задача сектора состоит в разработке математических моделей, методов, алгоритмов и программ для решения задач анализа, синтеза, распознавания и цифровой обработки речевых сигналов." На сайте есть интересные публикации о цифровой обработке речевых сигналов (фильтрации, конвертации, удалению шума и т.п.), но эти публикации, к сожалению, на момент составления перечня ссылок были неполными (отсутствовало содержание заявленного раздела "Методы распознавания речевых сигналов").

Моя оценка: 9 баллов (из 10)

5.5 Українська асоціація з оброблення інформації та розпізнавання образів (УАсОІРО)
http://uasoiro.org.ua/home/holovna.htm

Президентом ассоциации является Тарас Климович Винцюк - один из крупнейших мировых и советских учёных в области речевых технологий, создатель метода ИКДП для распознавания устной речи. На сайте ассоциации можно найти материалы конференций "УкрОбраз", с периодичностью раз в два года проводимых ассоциацией. К сожалению, ссылки на них не всегда работают. Другие публикации по теме распознавания речи на сайте не представлены.

Моя оценка: 9 баллов (из 10)

5.6 Институт искусственного интеллекта (Донецк, Украина)
http://iai.donetsk.ua

Донецкий государственный интститут искусственного интеллекта - одна из немногих организаций на Украине, которая занимается проблемами распознавания речи. На сайте находится информация об отделе распознавания речевых образов, который под руководством Владислава Юрьевича Шелепова разработал несколько прикладных программ, в том числе программу речевого управления мобильным роботом. Также на сайте можно найти сведения о научно-теоретическом журнале "Искусственный интеллект", выпускаемом институтом с 1995 года. К сожалению, на сайте института нет электронных публикаций по распознаванию речи.

Моя оценка: 8 баллов (из 10)

5.7 Интеллектуальные системы
http://intsys.msu.ru/

Официальный сайт кафедры Математической теории интеллектуальных систем и лаборатории Проблем теоретической кибернетики механико-математического факультета МГУ им. М. В. Ломоносова. Кафедра занимается, помимо всего прочего, исследованиями в области распознавания речевых и визуальных образов. На сайте размещена подборка научных публикаций сотрудников кафедры по речевым технологиям.

Моя оценка: 10 баллов (из 10)

5.8 Сектор психофизиологии речи Института физиологии им. И.П.Павлова
http://www.infran.ru/labs/Ogorodnikova_r.htm

Страница сектора психофизиологии речи Института физиологии им. И.П.Павлова Российской академии наук. Сектор занимается изучением структуры акустических речевых сигналов и закономерностей их слухового восприятия. К сожалению, страница носит исключительно рекламно-информационный характер, и результаты исследований не представлены.

Моя оценка: 6 баллов (из 10)

5.9 Объединённый институт проблем информатики НАН Беларуси
http://uiip.bas-net.by/index.html

Официальный сайт Объединённого института проблем информатики НАН Беларуси. В круг научных исследований, проводимых сотрудниками интститута, входят исследования, связанные с проблемами распознавания и синтеза речи. Существует ряд практических разработок в области речевых технологий, в частности, система распознавания зашумлённой речи, выполненная для французского министерства обороны и предназначенная для добавления речевого канала в контур управления боевым истребителем. Недостатком сайта является то, что о научных подходах и методологии сказано лишь в самых общих чертах. Также на сайте отсутствуют публикации сотрудников института.

Моя оценка: 7 баллов (из 10)

6 САЙТЫ БИЗНЕС-СТРУКТУР, ЗАНИМАЮЩИХСЯ РЕЧЕВЫМИ ТЕХНОЛОГИЯМИ

6.1 Philips Speech Recognition Systems
http://www.speechrecognition.philips.com/

Раздел официального сайта корпорации Philips, посвящённый речевым технологиям. Здесь представлено два продукта корпорации - программа Speech Magic, предоставляющая возможность пользователям-медикам формировать медицинские документы с помощью голоса, и набор программных библиотек Speech SDK, предназначенный для встраивания речевого интерфейса в прикладные программы. Кроме того, Philips разместила на своём сайте ряд статей об основных принципах использования технологии преобразования речи в текст "speech-to-text" в своих программных продуктах (разумеется, подробности разработанной методики не раскрываются).

Моя оценка: 9 баллов (из 10)

6.2 Philips Dictation Systems
http://www.dictation.philips.com

Ещё один сайт корпорации Philips, посвящённый речевым технологиям, а точнее, системам речевой диктовки, предлагаемым корпорацией. Описываются только программные продукты, но не применяемые методы распознавания.

Моя оценка: 7 баллов (из 10)

6.3 Microsoft Speech: Home Page
http://www.microsoft.com/speech/default.mspx

Раздел официального сайта корпорации Microsoft, посвящённый речевым технологиям. Носит рекламный характер. Описываются последние разработки Microsoft, в которые внедрён речевой интерфейс, в частности, Microsoft Speech Server. Можно скачать библиотеки MS Speech SDK для внедрения речевого интерфейса в программные продукты, разрабатываемые под Win32, и MS Speech Application SDK (SASDK) для внедрения речевого интерфейса в программные продукты, разрабатываемые под платформу NET.

Моя оценка: 7 баллов (из 10)

6.4 Официальный сайт компании Nuance
http://www.nuance.com

Сайт носит рекламный характер. Основным программным продуктом фирмы Nuance является Dragon NaturallySpeaking.

Моя оценка: 7 баллов (из 10)

6.5 IBM Software - Home Page
http://www.software.ibm.com

Раздел официального сайта корпорации IBM, посвящённый предлагаемым корпорацией программным решениям, в том числе и главному продукту "голубого гиганта" в области речевых систем управления - IBM ViaVoice. C помощью этой системы пользователь может осуществлять речевой ввод и форматирование текста в текстовом процессоре MS Word. Легко догадаться, что о том, как именно осуществляется распознавание, не сказано ни слова.

Моя оценка: 7 баллов (из 10)

6.6 Компания VoiceMethods LLC (Нью-Йорк, США)
http://www.voicemethods.com

Дочерняя компания фирмы "Ectaco Inc", которая занимается разработкой программных продуктов, использующих технологии распознавания и синтеза речи. На сайте можно скачать демо-версии этих программных продуктов, а также составленные компанией речевые базы данных для "американского" английского.

Моя оценка: 7 баллов (из 10)

6.7 Официальный сайт компании "Acer Inc" (Тайвань)
http://www.allproducts.com/manufacture9/acer/supplier.html

В области речевых технологий компания "Acer Inc" может похвастаться системой речевого управления компьютером YeSir Voice Commander. Согласно информации, приведённой на сайте, эта система речевого управления может заменить англоязычным и китайским пользователям клавиатуру и мышь. Об использованной методике распознавания речи информации нет.

Моя оценка: 6 баллов (из 10)

6.8 Центр речевых технологий (Санкт-Петербург, Россия)
http://speechpro.ru/

Центр речевых технологий явлется едва ли не крупнейшей на постсоветском пространстве фирмой, занимающейся речевыми технологиями. Но сайт этой фирмы имеет рекламный характер и не содержит информации, непосредственно относящейся к научным проблемам распознавания и синтеза речи.

Моя оценка: 6 баллов (из 10)

6.9 Компания "Сакрамент" (Минск, Беларусь)
http://www.sakrament-speech.com/

"Сакрамент" с 1994 года занимается разработкой систем распознавания и синтеза речи для русского и английского языков. На сайте представлена информация о ряде разработанных фирмой программных продуктов. Но сайт не содержит информации, непосредственно относящейся к научным проблемам распознавания и синтеза речи.

Моя оценка: 7 баллов (из 10)

6.10 Компания "AudiTech Ltd." (Санкт-Петербург, Россия)
http://www.auditech.ru/

Фирма "AudiTech Ltd." возникла в 1991 году на базе отдела речевых исследований НПО "Дальняя связь". Фирма занимается исследованиями в области пофонемного распознавания слитной речи, идентификации диктора, формирования речевых и лингвистических баз данных. На сайте можно скачать демо-версии разработанных фирмой программных продуктов. Кроме того, на сайте размещена большая подборка научных статей сотрудников фирмы и крупных российских учёных, посвящённая проблемам распознавания и понимания устной речи, а также неплохая тематическая электронная библиотека. Встретить такое на официальном сайте коммерческой организации - приятная неожиданность!

Моя оценка: 10 баллов (из 10)

6.11 Группа компаний SPIRIT (Москва, Россия)
http://www.spirit.ru/index.html

SPIRIT предлагает ряд программных решений, основанных на оригинальных разработках в области распознавания и синтеза речи, а также распознавания диктора. Кроме того, на сайте содержится ряд статей, в общих чертах описывающих методологическую базу этих разработок.

Моя оценка: 8 баллов (из 10)

6.12 Компания "Стэл - компьютерные системы" (Москва, Россия)
http://www.stel.ru/

Компания "Стэл" занимается речевыми исследованиями с 1996 года. Конечные программные продукты не представлены, также на сайте отсутствуют статьи, описывающие методы распознавания и синтеза речи. Есть описание предлагаемой для продажи речевой базы слов и предложений русского языка, которая была сформирована сотрудниками фирмы в ходе исследований.

Моя оценка: 6 баллов (из 10)

6.13 Компания "ИстраCофт" (Москва, Россия)
http://www.istrasoft.ru/

Компания "ИстраСофт" разработала единый алгоритм, основанный на качественном измерении параметров звуковых сигналов, для решения задач сжатия звуковых файлов, распознавания речи, синтеза речи по тексту и идентификации личности по голосу. На сайте можно ознакомится с теоретическими основами этого алгоритма, которые, впрочем, изложены весьма кратко. Доступна для скачивания демонстрационная программа речевого командного управления "IstraSoft Voice Commander".

Моя оценка: 8 баллов (из 10)

6.14 Компания "Cognitive Technologies" (Москва, Россия)
http://www.cognitive.ru/

Компания "Cognitive Technologies" занимается речевыми исследованиями с 1993 года. За это время сотрудниками компании была сформирована многодикторная речевая база данных русского языка, которая, по мнению компании, станет основой будущей технологии распознавания речи. Конечные программные продукты на сайте не представлены, также отсутствуют статьи, описывающие методы распознавания и синтеза речи.

Моя оценка: 6 баллов (из 10)

7 ОТДЕЛЬНЫЕ СТАТЬИ И ДОКЛАДЫ

7.1 Проект дистанционного обучения нейролингвистике "Минерва"
http://www.smolny.nw.ru/minerva/review.html

Проект "Минерва" представляет собой электронную online-информационно-справочную систему для дистанционного обучения студентов и поддержки научных исследований по нейролингвистике. В 9-й главе этой системы содержится хороший аналитический обзор современных моделей речевосприятия, а также рассматривается соответствие этих моделей критериям гуманитарной и компьютерной адекватности.

Моя оценка: 10 баллов (из 10)

7.2 Использование нейросетей для автоматического распознавания и синтеза речи
http://alexmoshp.chat.ru/sas/sas.htm

Раздел домашней страницы Алексея Москаленко, посвящённый разработке системы распознавания и синтеза речи с помощью самоорганизующихся карт Кохонена. Основное внимание уделено методу синтеза речевых сигналов.

Моя оценка: 9 баллов (из 10)

7.3 Состояние исследований в академических и учебных институтах страны в области автоматического распознавания и синтеза речи
http://www.techno.edu.ru:16001/db/msg/24974.html

Статья из электронного журнала "Инженерное образование", посвящённая, как видно из названия, анализу состояния исследований в российских академических и учебных институтах в области автоматического распознавания и синтеза речи. Анализ выполнен по материалам годовых отчётов за 1995 - 1997 г.г. Научного совета РАН по распознаванию образов. Статья в целом интересная, помогает составить представление о наиболее перспективных направлениях в области речевых технологий.

Моя оценка: 8 баллов (из 10)


ДонНТУ> Портал магистров ДонНТУ> Главная | Реферат | Библиотека | Ссылки | Отчет о поиске | Индивидуальное задание