Библиотека материалов по теме выпускной работы

Собственные публикации и доклады

Анализ алгоритмов преобразования речи из цифровой формы в частотную
Авторы: Ю.С. Иванченко, Д.Ю. Березин, Т.В. Завадская

Описание: В рассматриваемой статье даётся обоснование выбора алгоритма дискретизации звука для реализации функции распознавания речи. Описаны различные алгоритмы реализации преобразования звуковых данных в частотную форму с подробным описанием и иллюстрацией результатов их работы. Рассмотрены требования и условия для алгоритмов дискретизации, с определением их преимуществ и недостатков. В заключении подведены итоги проведенных исследований с подробным обоснованием факторов вывода, а также подробно изложено объяснение выбора подходящего требованиям алгоритма. Результаты дискретизации звука, в изложенной статье, могут использоваться в направлении распознавания речи.

Источник: VII Международный научный форум, ИУСМКМ-2021 ДонНТУ – 2020, С.463-467.
Исследование структуры устройства и приложения распознавания речи
Авторы: Ю.С. Иванченко, С.И. Алимбарашвили, Т.В. Завадская

Описание: В данной работе рассмотрены принципы создания приложения для распознавания речи. Также приведён структурный анализ устройства восприятия голоса и речи машинной.

Источник: IV Республиканская, с международным участием, научная интернет-конференция, Современные информационные технологии, ДонНУЭТ – 2021, С.133-135
Анализ методов и алгоритмов оцифровывания звуковых данных
Авторы: Ю.С. Иванченко, Т.В. Завадская

Описание: В рассматриваемой статье проводится анализ видов и методов преобразования аналогового звука в цифровую форму. Приведены различные инструменты реализации оцифровывания на программном и аппаратном уровнях, с подробным описанием и иллюстрацией их работы. Рассмотрены требования и условия для реализации оцифровывания, а также типы алгоритмов, с определением их преимуществ и недостатков. В заключении подведены итоги проведенных исследований, а также приведена эффективная комбинация алгоритма и метода. Результаты оцифровывания звука, в данной статье, могут использоваться для решения задач в направлении распознавания речи.

Источник: VIII Международная научно-практическая конференция, Современные тенденции развития и перспективы внедрения инновационных технологий в машиностроении, образовании и экономике, ДГТУ – 2021

Тематические статьи

Проблемы распознавания речи: что еще предстоит решить
Автор: Awni Hannun.

Описание: Аспирант Стэнфордского университета Авни Ханнун написал о том, какие проблемы ещё предстоит решить, чтобы вывести системы автоматического распознавания речи на человеческий уровень.

Источник: Github.Speech recognition. October 11, 2017.
Классификация систем распознавания речи
Авторы: С.А. Федосин, А. Ю. Еремин

Описание: В данной работе сделана попытка классификации существующих подходов к решению проблем rлассификация систем распознавания речи

Источник: Федосин С.А., Еремин А. Ю./ Классификация систем распознавания речи // "ЭЛЕКТРОНИКА И ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ" электронное научное периодическое издание. — 2010.
Системы автоматического распознавания речи
Автор: А. Прохоров

Описание: В данной работе произведена классификация существующих подходов к решению проблем распознавания речи.

Источник: А. Прохоров./Системы автоматического распознавания речи // "Компьютер Пресс" электронное издание. — 2003.
Распознавание речи: этапы развития, современные технологии и перспективы их применения
Авторы: М.Ф. Бондаренко, А.В. Работягов, С.В. Щепковский

Описание: В статье проведен обзор развития систем распознавания речи, рассмотрены общие принципы их построения, перечислены актуальные проблемы этого направления. Также рассмотрены актуальные области применения и перспективы развития систем распознавания речи.

Источник: М.Ф. Бондаренко, А.В. Работягов, С.В.. Щепковский.Распознавание речи: этапы развития, современные технологии и перспективы их применения//Электронный архив открытого доступа Харьковского национального университета радиоэлектроники "Bionica" 2010-2(73), С.164-168
Классификация фреймов речевого сигнала в задачах дикторонезависимого распознавания речи
Авторы: Т.В. Ермоленко, А.В. Жук

Описание: В статье предлагается метод определения границ речи в поступившем речевом потоке с использованием автоматической настройки под шум окружающей среды и звукозаписывающего оборудования, а также алгоритм классификации фреймов речевого сигнала в терминах обобщенной фонетической транскрипции. Используемые параметры базируются на различных спектральных представлениях сигнала, отражают особенности спектральной плотности звуков речи, принадлежащих разным фонетическим классам, что обеспечивает дикторонезависимость процесса классификации.

Источник: Т.В. Ермоленко, А.В. Жук./ Классификация фреймов речевого сигнала в задачах дикторонезависимого распознавания речи// Институт проблем искусственного интеллекта МОН Украины и НАН Украины, г. Донецк, 2011, С.87-95.
Проблемы распознавания слитной речи
Автор: А.А. Леонович

Описание: Описываются характеристики систем распознавания речи и их классификация. Обсуждаются методы сегментации и проблемы распознавания речи. Приводятся сравнительные характеристики методов сегментации.

Источник: А.А. Леонович./ Проблемы распознавания слитной речи// Научно-технический журнал "Цифровая обработка сигналов" - 2007, С.25-28.

Переводы статей

Распознавание английской фразы на основе алгоритма непрерывного распознавания речи и ограничений дерева слов
Авторы: Haifan Du, Haiwen Duan.

Автор перевода: Ю.С. Иванченко

Описание: В этой статье объединены результаты отечественных и международных исследований для анализа и изучения разницы между особенностями характеристик английской фразеологической речи и шума для увеличения кратковременной энергии, которая используется для повышения пороговой чувствительности; Добавление шума к набору данных о несоответствии используется для повышения устойчивости распознавания. Алгоритм обратного распространения ошибки улучшен, чтобы ограничить диапазон изменения веса, избежать явления колебаний и сократить время обучения. В реальной системе распознавания звуков английских фраз есть такие проблемы, как массивные обучающие данные и низкая эффективность обучения, вызванные сверхбольшими параметрами модели сверточной нейронной сети. Для решения этих проблем алгоритм «NWBP» основан на явлении колебаний, которое имеет тенденцию возникать при поиске минимального значения ошибки в позднем периоде обучения параметров сети с использованием алгоритма «K-MEANS» для получения начальных узлов, которые приближаются к минимальному количеству ошибок и использование правила граничных значений уменьшающие диапазон изменения размера, уменьшая явление колебаний, так что сетевая ошибка сводится к нулю, что повысит эффективность обучения. Благодаря имитационным экспериментам алгоритм «NWBP» улучшает степень подгонки и скорость сходимости при обучении сложных сверточных нейронных сетей по сравнению с другими алгоритмами, сокращает избыточные вычисления и в определенной степени сокращает время обучения, а алгоритм имеет преимущество ускорении конвергенции сети по сравнению с простыми сетями. Представлено ограничение дерева слов и его эффективная структура хранения, что повышает эффективность хранения ограничения дерева слов и эффективность поиска при поиске с распознаванием английских фраз.

Источник (англ.): Journal publishers "Hindawi"

Библиотека