Ссылки по теме выпускной работы
- Магистерская
работа И.Ю. Бондаренко
Руководитель: к.т.н., доц., О.И. Федяев
Описание: Здесь довольно подробно описан метод нечеткого сопоставления образов и нечеткого DWT-сопоставления образов. Отличная подборка ссылок по теме.
- Магистерская
работа О.В. Василенко
Руководитель: к.т.н., доц., О.И. Федяев
Описание: Сайт Василенко посвящен анализу эфективности метода нечёткого сопоставления образов. Временные изменения характерных временных образов, обусловленные разной скоростью произношения одних и тех же фонем, рассматриваются как линейные, что повышает быстродействие системы распознавания, но снижает её качество.
- Магистерская
работа В.В. Ворона
Руководитель: д.ф.-м.н., проф., В.Ю. Шелепов
Описание: Хорошо описана важность распознавания речи, рассмотрены компоненты построения систем распознавания речи, а также рассмотрены проблемы сегментации слитно произносимых фраз.
- Магистерская
работа Е.Е. Марченко
Руководитель: к.ф.-м.н., доц., Н.Н. Дацун
Описание: Основной упор данной работы сделан на исследовании проблемы синтаксического и лексического анализа фразы естественного языка, уже преобразованной из речевой формы представления в текстовую. Более сложная проблема преобразования речи в текст не рассматривается.
- Магистерская
работа И.В. Варенич
Руководитель: к.т.н., О.И. Федяев
Описание: В работе рассматривается анализ методов построения систем распознавания речи на основе скрытых марковских моделей и нейросетей. Решаются задачи первичной обработки звукового сигнала, применение к полученному сигналу аппарата скрытых марковских моделей и применение нейросетей для получения выходной сигнальности.
- Магистерская
работа С.Ю. Стояновского
Руководитель: к.т.н., доц., А.В. Хорхордин
Описание: Рассмотрена группа алгоритмов по кодированию речевого сигнала, проведено сравнение вейвлетов на примерах сжатия голосовых данных.
- Магистерская
работа Д.М. Петрищевой
Руководитель: к.т.н., доц., С.А. Зори
Описание: Представлен анализ существующих систем визуализации реальных сигналов на основе их частотно-временных характеристик. Рассмотрена группа звуковых редакторов и систем анализа сигналов.
- Магистерская
работа Д.В. Николаенко
Руководитель: к.т.н., доц., С.А. Ковалев
Описание: Разработка и исследование алгоритмов построения динамического портрета речевого сигнала. На мой взгляд, некоторый интерес в данной работе представляет раздел, посвященный тестированию четырёх программных продуктов, основанных на технологии распознавания речи.
- Магистерская
работа Д.А. Деменко
Руководитель: к.т.н., доц., О.И. Федяев
Описание: Работа описывает автоматический синтез речевых сигналов для интеллектуализации вывода текстовой информации путем ее озвучивания.
- Магистерская
работа М.И. Скляренко
Руководитель: к.т.н., доц., И.В. Дегтяренко
Описание: Анализ нестационарных сигналов при помощи вейвлет преобразования.
- Wavelets
for Speech Signal Representations
Авторы: Shonda L. Walker, Simon Y. Foo.
Описание: В статье рассматривается проблема выбора типа вейвлета для наилучшего представления речевого сигнала.
- Выбор
интервалов анализа сигнала при распознавании речи
Авторы: Огородников А.Н.
Описание: В статье рассматривается проблема выбора интервалов анализа сигнала при распознавании речи.
- Построение
системы голосового управления компьютером на примере задачи набора
математических формул
Авторы: В.Ю. Шелепов, А.В. Ниценко, А.В. Жук
Описание: В статье рассмотрена архитектура модульной системы голосового управления, рассмотрены требования к функциям, экспортируемым модулем-прослойкой, а также требования к формату файла словаря команд.
- Моделювання
багаторівневого поскладового
розпізнавання мовленнєвого сигналу
Авторы: Н.Б. Васильева, М.М. Сажок
Описание: В статье проводится расширение многоуровневой многозначной модели автоматического распознавания слитной речи на случай послогового распознавания.
- Технология
построения интеллектуальной
системы распознавания речи
Авторы: О.А. Савенкова, О.Н. Карпов
Описание: В статье предложена информационная технология для системы распознавания речи с большим словарем на основе алгоритма сегментно-слогового синтеза траектории параметров. В основу технологии положены модели обучения и распознавания, использующие быстросходящиеся алгоритмы поиска.
- Система
пофонемного автоматического распознавания команд русской речи для
произвольного словаря
Авторы: В.В. Киселев, И.Б. Тампель
Описание: В статье рассматривается способ обучения контекстно-независимых и контекстно-зависимых акустических моделей для русской речи. Приводятся результаты применения полученных акустических моделей в задаче пофонемного распознавания команд.
- Система
распознавания изолированных слов с предварительной сегментацией
Авторы: Г.В. Саввина
Описание: Статья посвящена описанию системы пофонемного распознавания изолированных слов. Предложен способ повышения надежности системы пофонемного распознавания изолированных слов.
- Многоуровневая
система распознавания речи
Авторы: С.И. Ямов, И.С. Кабак и др.
Описание: Статья посвящена разработке приемов и алгоритмов распознавания речи на русском языке.
- Амплитудная
сегментация речевого сигнала, использующая фильтрацию и известный
фонетический состав
Авторы: В.Ю. Шелепов, А.В. Ниценко
Описание: В статье описывается новый условный сегментатор.
- Система
автоматического распознавания речи на базе нейросетевой технологии
Авторы: Д.А. Кушнир
Описание: В статье приводится описание системы автоматического распознавания речи, построенная с использованием нейросетевой технологии.
- Алгоритмы
пофонемного распознавания слов наперед заданного словаря
Авторы: А.В. Ниценко, В.Ю. Шелепов
Описание: В статье описывается система пофонемного распознавания, использующую лишь обобщенную транскрипцию, что повышает дикторонезависимость сегиентации.
- Национальная
библиотека Украины имени В.И. Вернадского
Крупнейшая библиотека Украины, главный научно-информационный центр государства. Входит в число десяти крупнейших национальных библиотек мира.
- Recent
Advances in Document Recognition and Understanding
Данная книга предоставляет недавний прогресс, приложения и новые идеи, которые уместны при бработке изображений, и речи, выделения признаков или их классификации. Также среди алгоритмов обработки описывается и алгоритм DTW.
- The
Use of
Recurrent Neural Networks in Continuous Speech Recognition
Использование периодических нейронных сетей в непрерывном распознавании Речи. Рассмотрена структура HMM и использован алгоритм DTW при обработке сигнала. Создана система распознавания речи на базе 20000 изолированных слов.
- Модели
и
программная реализация распознавания русской речи на основе морфемного
анализа
В диссертациионной работе рассматривается задача разработки модели дикторонезависимого распознавания русской слитной речи с большим словарем, которая обеспечивает ускорение процесса обработки речи при сохранении точности распознавания.
- Скрытые
марковские модели и их применение в избранных приложениях при
распознавании речи
Рассмотрена реализация распознавателей речи, основанных на скрытых марковских моделях. Общая структура системы распознавания,распознавание изолированных слов на основе смм. Смм для систем распознавания речи с большим словарем.
- Объективное
распознавание звуков речи
В книге рассмотрены вопросы автоматического распознавания речи и применения словесных команд для управления механизмами. Работа знакомит читателя с новой областью акустики и автоматики, получившей за последнее время весьма интенсивное развитие.
- Анализ,
распознавание и интерпретация речевых сигналов
В монографии рассматриваются вопросы автоматического анализа, распознавания, смысловой интерпретации, синтеза и компрессированной передачи речевых сигналов применительно к устному диалогу человека и ЭВМ.
- Unsupervised
Pattern Discovery in Speech: Applications to Word Acquisition and
Speaker Segmentation
В диссертационной работе россмотрены новые подходы к сегментации речевого сигнала. Рассмотрено формирование речевых кластеров. Присутствует алгоритм сегментации DTW.
- Проблемы
построения систем понимания речи
Сборник посвящен построению систем понимания речи для управления автоматами посредством естественного языка. Рассматриваются уровни систем понимания речи, включающие анализ процессов речеобразования, анализ параметров речевых сигналов, распознавание слитно произносящихся слов, а также использование синтаксической и семантической информации для сегментации слитной речи и коррекции ошибок распознавания.
- Анализ
и
синтез речи. Сборник научных трудов
Представлены работы по анализу и синтезу речи, выполненные в лаборатории автоматического распознавания и синтеза речи Института технической кибернетики АН БССР. В статьях сборника отражены результаты теоретических разработок, проведенных в последние годы, и итоги экспериментальных и конструкторских работ по внедрению новых методов анализа и синтеза в практику.
- Методы
автоматического распознавания речи. Том 1
Рассмотрены фонетические и аудио способы определения речи.
- Компьютерный
синтез и клонирование речи
Данная монография является обобщением научных результатов, полученных авторами за последние годы. Она посвящена рассмотрению теоретических и экспериментальных основ, а также описанию конкретных практических результатов в решении задач компьютерного синтеза и клонирования персональных характеристик речи.
- CIT-форум
Крупнейший архив научной и практической информации по всем направлениям компьютерных наук.
- Искусственный
интеллект.
Научно-теоретический журнал
Содержит архив изданных публикаций различной тематики в направлении искусственного интеллекта, в том числе и по распознаванию речи.
- Школа
региональных и международных исследований ДВФУ
Межкультурная коммуникация и речевые технологии. Данное учереждение занимается повышением научного уровня и инновационной эффективности фундаментальных и прикладных разработок в области речевых технологий и межкультурной коммуникации, решением перспективных научных и образовательных проблем лингвистической и филологической направленности.
- Intelligent
Electronic Systems
Сайт, посвящённый научно-исследовательской программе "Интеллектуальные электронные системы" (Intelligent Electronic Systems), которая выполняется в Центре перспективных транспортных систем (Center for Advanced Vehicular Systems) Миссисипского государственного университета (Mississippi State University). На сайте можно найти много интересной информации о методах распознавания слитной речи, в частности, неплохую подборку диссертационных работ на степень доктора философии (PhD), книг и статей по этой тематике (конечно, на английском языке).
- Институт
искусственного
интеллекта (Донецк, Украина)
Донецкий государственный интститут искусственного интеллекта – одна из немногих организаций на Украине, которая занимается проблемами распознавания речи. На сайте находится информация об отделе распознавания речевых образов, который под руководством Владислава Юрьевича Шелепова разработал несколько прикладных программ. Также на сайте можно найти сведения о научно-теоретическом журнале "Искусственный интеллект", выпускаемом институтом с 1995 года.
- Речевые
технологии
Информационный портал о речевых технологиях. Содержит программы синтеза речи и распознавания голоса.
- Microsoft
Tellme
Содержит информацию о новейших достижениях корпорации Майкрософт в области распознавания речи.
- Сетевой
электронный научный журнал "Системотехника"
Здесь иногда публикуются статьи, связанные с речевыми технологиями.
- Электронный журнал
"Техническая акустика"
На сайте журнала можно найти интересные статьи по цифровой обработке акустических сигналов, в том числе и речевых, а также статьи по распознаванию речи.
- Wikipedia
- Синтез речи
Краткое описание истории развития синтеза речи, его основных методов и направлений.
- Научно-технический
и
научно-производственный журнал "Информационные технологии"
Ежемесячный теоретический и прикладной научно-технический журнал содержащий обширный круг публикаций по информационным технологиям, в том числе и технологиям касающихся речи.
- "Цифровая
обработка сигналов" – научно-технический журнал
На сайте журнала содержатся рефераты опубликованных статей, среди которых содержится много статей по цифровой обработке речевых сигналов и распознаванию речи. Полные тексты статей можно найти только в бумажной версии журнала.
- Электронная
версия журнала "Компьютерра"
Здесь можно найти статьи публицистического характера о новейших разработках и новых программных продуктах в сфере речевых технологий.
- Горыныч
5.0 Dict Light
Программа распознавания речи. Предназначена для управления определенными функциями компьютера с помощью голосовых команд и перевода текста в любой текстовый редактор.
- Antares
Autotune
Программа для обработки голоса и музыки. Инструмент профессионального исправления высоты тона.
- Sound
Forge Pro 10.0c
Очень мощный и удобный цифровой аудио-редактор, в состав которого входит набор утилит, предназначенных для работы со звуком. При помощи данной программы можно эффективно обрабатывать звуковые композиции, накладывать множество эффектов, осуществлять точную и быструю запись и редактирование сэмплов, кодировать данные, перегонять файлы в различные форматы и т.д.
- Embedded
Speech Recognition Kit
Программа для распознавания речи или преобразования речи в текст для развития систем распознавания речи на электронном уровне.
- SoundProcessor
Бесплатный программный продукт от компании Телесистемы, предназначенный для обработки диктофонных записей и улучшения их разборчивости, существенного упрощения ручного перевода диктофонных записей в текст, и возможности автоматического перевода диктофонных записей в текст с помощью технологии Google.
- Antares
Autotune Evo v6.09
Autotune исправляет проблемы интонирования в вокале или солирующем инструменте, в реальном времени, без искажений и артефактов, сохраняя все нюансы и экспрессию оригинального исполнения – с беспрецендентным качеством, так, что единственная разница между оригинальным звуком и обработанным – правильная интонация.
- Dragon
Dictation
Бесплатная и очень полезная программа для iPhone. Распознавание и ведение текстовой записи с голоса.