Веренич Иван Владимирович
Факультет: Вычислительная техника и информатика
Специальность: Программное обеспечение автоматизированных систем
Тема магистерской диссертации: Анализ методов построения систем распознавания речи на основе гибрида скрытой марковской модели и нейросети
Руководитель: к.т.н. Федяев О.И.
Ссылки по теме "Анализ методов построения систем распознавания речи на основе гибрида скрытой марковской модели и нейросети"
Специализированные сервера по теме
- Статьи TXT2MP3
Обзор алгоритмов по распознаванию и синтезу речи
- Энициклопедия википедия
Элементы скрытой марковской модели
- Narod.ru
Хорошая подборка литературы по цифровой обработке сигналов
- dspcenter.ru
Подборка материалов по цифровой обработке сигналов
- Стэл Компьютерные технологии
Распознавание речи и речевые технологии, перспективы развития
- Разработка программы распознавания русской речи для процессора SuperH RISK (Hitachi)
На этом сайте кротко излагаются все шаги алгоритма распознавания речи с небольшими теоритическими выкладками. В конце статьи приводятся результаты тестирования программы по распознаванию речи.
- Электронный журнал "Техническая акустика"
На сайте журнала можно найти интересные статьи по цифровой обработке акустических сигналов, в том числе и речевых, а также статьи по распознаванию речи. Все статьи доступны для скачивания.
- Microsoft Speech: Home Page
Раздел официального сайта корпорации Microsoft, посвящённый речевым технологиям. Носит рекламный характер. Описываются последние разработки Microsoft, в которые внедрён речевой интерфейс, в частности, Microsoft Speech Server. Можно скачать библиотеки MS Speech SDK для внедрения речевого интерфейса в программные продукты, разрабатываемые под Win32, и MS Speech Application SDK (SASDK) для внедрения речевого интерфейса в программные продукты, разрабатываемые под платформу NET.
- Журнал "Компьютерра"
Сайт посвящен речевым технологиям, их проблемам и перспективам. Рассмотрена проблема распознавания телефонной речи.
- Центр речевых технологий
Сайт посвящен проблемам обработки речевых сигналов, включая разработку алгоритмов и технологий шумоочистки и повышения разборчивости речи, синтеза и распознавания речи, автоматического определения биометрических и физиологических характеристик личности по голосу.
- Синтезаторы речи в Linux
Небольшой обзор систем преобразования текста в речь для Linux.
- Обзор апрельского, 2002 г. номера журнала Computer (IEEE Computer Society, v. 15, no. 4, April 2002)
Статья содержит обзор исследовательских проектов, связанных с проблемой так называемого улучшенного распознавания речи (Advanced Speech Recognition — ASR).
- Технологии распознавания речи
В статье рассмотрены основные вопросы, связанные с распознаванием речи, рассмотрены подходы к выбору критерия качества распознавания.
- СИСТЕМА ПОФОНЕМНОГО АВТОМАТИЧЕСКОГО РАСПОЗНАВАНИЯ КОМАНД РУССКОЙ РЕЧИ ДЛЯ ПРОИЗВОЛЬНОГО СЛОВАРЯ
В статье рассматривается способ обучения контекстно-независимых и контекстно-зависимых акустических моделей для русской речи. Приводятся результаты применения полученных акустических моделей в задаче пофонемного распознавания команд.
- Системы верификации и идентификации диктора
В докладе рассматриваются реализации коммерческих систем голосовой биометрики (верификация и идентификация диктора) компании SPIRIT Corp.
- Кодовая книга для речевых обратных задач
В статье рассматривается обратная задача, состоящая в нахождении функции площади поперечного сечения речевого тракта по измененным параметрам речевого сигнала.
Порталы по речевым технологиям
- Информационный портал по речевым технологиям
В этом портале оповещены такие вопросы, как распознавание речи, синтез речи, есть форму, посвященный данной тематике.
- ЗАО «Открытые Коммуникации»
Основным направлением деятельности компании является создание решений с применением голосовых приложений.
- Программы экранного доступа
Портал «Компьютерные технологии для незрячих и слабовидящих», на котором представлены различные по объему, уровню сложности и способу изложения публикации, связанные общей тематикой: какие современные технические средства могут помочь незрячим
- Сборник программ для чтения книг
Сборник программ для чтения книг (файлов) часть программ используют речевые технологии
- Open Source Projects for Blind
Сайт посвящен разработке программного обеспечения для людей с полной потерей зрения.
- компания Речевые Технологии
ООО <Речевые технологии> является официальным представителем в Республике Беларусь ООО <Центр речевых технологий> (ЦРТ) - признанного российского лидера в области разработки ипроизводства технологий и средств, предназначенных для высококачественной записи
- ООО Cayo Communications
ООО Cayo Communications (Сан-Бруно, Калифорния, США) - компания, специализирующаяся на производстве комплексных решений для автоматизации процессов взаимодействия с клиентами.
- Консорциум "Российские Речевые Технологии"
Консорциум "Российские Речевые Технологии" объединяет российские компании и научные учреждения, область деятельности которых - разработка новых речевых информационных технологий.
- Digalo
Голосовой движок для русского языка Digalo продукт французской фирмы Elan Informatique.
- ИстраСофт
Разработка и выпуск мультимедийных обучающих программ.
- Синтез речи на Украине
Целью этого сайта является предоставление информации о состоянии деятельности в области розпознавания и синтеза речи в Украине.
- ToM Reader
Программа для чтения электронных текстов наиболее привычным способом - в виде книги, а также озвучивания текстов с использованием речевого синтеза.
- www.sakrament.com
Сайт Белорусской компания, являющейся одним из ведущих мировых разработчиков программного обеспечения в области обработки звука и речи. Сакрамент обладает широким спектром продуктов для задач синтеза (озвучивания текста) и распознавания речи
- Sakrament
Ведущий мировой разработчик программного обеспечения в области обработки звука и речи.
- "Сумма технологий"
Распознавание речи и рукописного текста
- Федеральный портал "Инженерное образование"
Обсуждается математическая модель распознавания речи с использованием протяженных текстов. Показано, что введение операции перенормировки Марковской матрицы переходов между состояниями позволяет ввести зависимость принимаемых решений от контекста. Данная операция оказывается равносильной введению в систему обратных связей.
Отдельные статьи и доклады
- Проект дистанционного обучения нейролингвистике "Минерва"
Проект "Минерва" представляет собой электронную online-информационно-справочную систему для дистанционного обучения студентов и поддержки научных исследований по нейролингвистике. В 9-й главе этой системы содержится хороший аналитический обзор современных моделей речевосприятия, а также рассматривается соответствие этих моделей критериям гуманитарной и компьютерной адекватности.
- Использование нейросетей для автоматического распознавания и синтеза речи
Раздел домашней страницы Алексея Москаленко, посвящённый разработке системы распознавания и синтеза речи с помощью самоорганизующихся карт Кохонена. Основное внимание уделено методу синтеза речевых сигналов.
- Состояние исследований в академических и учебных институтах страны в области автоматического распознавания и синтеза речи
Статья из электронного журнала "Инженерное образование", посвящённая, как видно из названия, анализу состояния исследований в российских академических и учебных институтах в области автоматического распознавания и синтеза речи. Анализ выполнен по материалам годовых отчётов за 1995 - 1997 г.г. Научного совета РАН по распознаванию образов. Статья в целом интересная, помогает составить представление о наиболее перспективных направлениях в области речевых технологий.
Сайты научно-исследовательских организаций
- Intelligent Electronic Systems
Сайт, посвящённый научно-исследовательской программе "Интеллектуальные электронные системы" (Intelligent Electronic Systems), которая выполняется в Центре перспективных транспортных систем (Center for Advanced Vehicular Systems) Миссисипского государственного университета (Mississippi State University), начиная с 2002 года.
- Speech and Hearing Research Group (SpandH)
Официальный сайт научно-исследовательской группы SpandH, входящей в состав Шеффилдского университета (Великобритания). Эта группа занимается исследованиями проблем распознавания и синтеза речи.
- Machine Intelligence Laboratory - Speech Group
Официальный сайт научно-исследовательской группы по распознаванию речи, которая является структурным подразделением Кембриджского университета. На сайте можно найти много проектов и статей о речевых технологиях.
- Сектор цифровой обработки и распознавания речевых сигналов ВЦ РАН
На сайте есть интересные публикации о цифровой обработке речевых сигналов (фильтрации, конвертации, удалению шума и т.п.)
- Українська асоціація з оброблення інформації та розпізнавання образів (УАсОІРО)
На сайте ассоциации можно найти материалы конференций "УкрОбраз", с периодичностью раз в два года проводимых ассоциацией.
- Институт искусственного интеллекта (Донецк, Украина)
Донецкий государственный интститут искусственного интеллекта - одна из немногих организаций на Украине, которая занимается проблемами распознавания речи.
- Интеллектуальные системы
Официальный сайт кафедры Математической теории интеллектуальных систем и лаборатории Проблем теоретической кибернетики механико-математического факультета МГУ им. М. В. Ломоносова.
- Сектор психофизиологии речи Института физиологии им. И.П.Павлова
Сектор занимается изучением структуры акустических речевых сигналов и закономерностей их слухового восприятия.
- Объединённый институт проблем информатики НАН Беларуси
Официальный сайт Объединённого института проблем информатики НАН Беларуси. В круг научных исследований, проводимых сотрудниками интститута, входят исследования, связанные с проблемами распознавания и синтеза речи.
Сайты периодических изданий
- "Цифровая обработка сигналов" - научно-технический журнал
На сайте журнала содержатся рефераты опубликованных статей, среди которых содержится много статей по цифровой обработке речевых сигналов и распознаванию речи. Полные тексты статей можно найти только в бумажной версии журнала.
- Научный журнал "Информатика"
В номерах журнала под рубрикой "Обработка сигналов, изображений и речи" содержится много публикаций по темам, связанных с цифровой обработкой речевых сигналов, распознаванием и пониманием устной речи.
- "Нейрокомпьютеры: разработка, применение" - научно-технический журнал
На сайте журнала содержатся аннотации опубликованных статей, связанных с нейроинформатикой и нейроматематикой. Есть ряд статей, посвященных применению нейросетевых подходов для решения задачи распознавания речи.
Ссылки на сайты магистров прошлых лет
- Магистр 2007 Бондаренко Иван Юрьевич
Здесь довольно подробно описан метод нечеткого сопоставления образов и нечеткого DWT-сопоставления образов. Отличная подборка ссылок по теме.
- Чернов Александр Сергеевич
Здесь описано применение марковских моделей в системах массового обслуживания. Описаны основные понятия, открытая марковская модель.
- Панкова Александра Валериевна
Здесь подобрана неплохая коллекция ссылок по теме скрытых марковских моделей.
|