Библиотека материалов по теме выпускной работы

    Собственные публикации и доклады

  1. Анализ алгоритмов преобразования речи из цифровой формы в частотную

    Авторы: Ю.С.  Иванченко, Д.Ю. Березин, Т.В. Завадская

    Описание: В рассматриваемой статье даётся обоснование выбора алгоритма дискретизации звука для реализации функции распознавания речи. Описаны различные алгоритмы реализации преобразования звуковых данных в частотную форму с подробным описанием и иллюстрацией результатов их работы. Рассмотрены требования и условия для алгоритмов дискретизации, с определением их преимуществ и недостатков. В заключении подведены итоги проведенных исследований с подробным обоснованием факторов вывода, а также подробно изложено объяснение выбора подходящего требованиям алгоритма. Результаты дискретизации звука, в изложенной статье, могут использоваться в направлении распознавания речи.

    Источник: VII Международный научный форум, ИУСМКМ-2021 ДонНТУ – 2020, С.463-467.

  2. Исследование структуры устройства и приложения распознавания речи

    Авторы: Ю.С.  Иванченко, С.И.  Алимбарашвили, Т.В. Завадская

    Описание: В данной работе рассмотрены принципы создания приложения для распознавания речи. Также приведён структурный анализ устройства восприятия голоса и речи машинной.

    Источник: IV Республиканская, с международным участием, научная интернет-конференция, Современные информационные технологии, ДонНУЭТ – 2021, С.133-135

  3. Анализ методов и алгоритмов оцифровывания звуковых данных

    Авторы: Ю.С. Иванченко, Т.В. Завадская

    Описание: В рассматриваемой статье проводится анализ видов и методов преобразования аналогового звука в цифровую форму. Приведены различные инструменты реализации оцифровывания на программном и аппаратном уровнях, с подробным описанием и иллюстрацией их работы. Рассмотрены требования и условия для реализации оцифровывания, а также типы алгоритмов, с определением их преимуществ и недостатков. В заключении подведены итоги проведенных исследований, а также приведена эффективная комбинация алгоритма и метода. Результаты оцифровывания звука, в данной статье, могут использоваться для решения задач в направлении распознавания речи.

    Источник: VIII Международная научно-практическая конференция, Современные тенденции развития и перспективы внедрения инновационных технологий в машиностроении, образовании и экономике, ДГТУ – 2021

  4. Тематические статьи

  5. Проблемы распознавания речи: что еще предстоит решить

    Автор: Awni Hannun.

    Описание: Аспирант Стэнфордского университета Авни Ханнун написал о том, какие проблемы ещё предстоит решить, чтобы вывести системы автоматического распознавания речи на человеческий уровень.

    Источник: Github.Speech recognition. October 11, 2017.

  6. Классификация систем распознавания речи

    Авторы: С.А. Федосин, А. Ю. Еремин

    Описание: В данной работе сделана попытка классификации существующих подходов к решению проблем rлассификация систем распознавания речи

    Источник: Федосин С.А., Еремин А. Ю./ Классификация систем распознавания речи // "ЭЛЕКТРОНИКА И ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ" электронное научное периодическое издание. — 2010.

  7. Системы автоматического распознавания речи

    Автор: А. Прохоров

    Описание: В данной работе произведена классификация существующих подходов к решению проблем распознавания речи.

    Источник: А. Прохоров./Системы автоматического распознавания речи // "Компьютер Пресс" электронное издание. — 2003.

  8. Распознавание речи: этапы развития, современные технологии и перспективы их применения

    Авторы: М.Ф. Бондаренко, А.В. Работягов, С.В. Щепковский

    Описание: В статье проведен обзор развития систем распознавания речи, рассмотрены общие принципы их построения, перечислены актуальные проблемы этого направления. Также рассмотрены актуальные области применения и перспективы развития систем распознавания речи.

    Источник: М.Ф. Бондаренко, А.В. Работягов, С.В.. Щепковский.Распознавание речи: этапы развития, современные технологии и перспективы их применения//Электронный архив открытого доступа Харьковского национального университета радиоэлектроники "Bionica" 2010-2(73), С.164-168

  9. Классификация фреймов речевого сигнала в задачах дикторонезависимого распознавания речи

    Авторы: Т.В. Ермоленко, А.В. Жук

    Описание: В статье предлагается метод определения границ речи в поступившем речевом потоке с использованием автоматической настройки под шум окружающей среды и звукозаписывающего оборудования, а также алгоритм классификации фреймов речевого сигнала в терминах обобщенной фонетической транскрипции. Используемые параметры базируются на различных спектральных представлениях сигнала, отражают особенности спектральной плотности звуков речи, принадлежащих разным фонетическим классам, что обеспечивает дикторонезависимость процесса классификации.

    Источник: Т.В. Ермоленко, А.В. Жук./ Классификация фреймов речевого сигнала в задачах дикторонезависимого распознавания речи// Институт проблем искусственного интеллекта МОН Украины и НАН Украины, г. Донецк, 2011, С.87-95.

  10. Проблемы распознавания слитной речи

    Автор: А.А. Леонович

    Описание: Описываются характеристики систем распознавания речи и их классификация. Обсуждаются методы сегментации и проблемы распознавания речи. Приводятся сравнительные характеристики методов сегментации.

    Источник: А.А. Леонович./ Проблемы распознавания слитной речи// Научно-технический журнал "Цифровая обработка сигналов" - 2007, С.25-28.

  11. Переводы статей

  12. Распознавание английской фразы на основе алгоритма непрерывного распознавания речи и ограничений дерева слов

    Авторы: Haifan Du, Haiwen Duan.

    Автор перевода: Ю.С. Иванченко

    Описание: В этой статье объединены результаты отечественных и международных исследований для анализа и изучения разницы между особенностями характеристик английской фразеологической речи и шума для увеличения кратковременной энергии, которая используется для повышения пороговой чувствительности; Добавление шума к набору данных о несоответствии используется для повышения устойчивости распознавания. Алгоритм обратного распространения ошибки улучшен, чтобы ограничить диапазон изменения веса, избежать явления колебаний и сократить время обучения. В реальной системе распознавания звуков английских фраз есть такие проблемы, как массивные обучающие данные и низкая эффективность обучения, вызванные сверхбольшими параметрами модели сверточной нейронной сети. Для решения этих проблем алгоритм «NWBP» основан на явлении колебаний, которое имеет тенденцию возникать при поиске минимального значения ошибки в позднем периоде обучения параметров сети с использованием алгоритма «K-MEANS» для получения начальных узлов, которые приближаются к минимальному количеству ошибок и использование правила граничных значений уменьшающие диапазон изменения размера, уменьшая явление колебаний, так что сетевая ошибка сводится к нулю, что повысит эффективность обучения. Благодаря имитационным экспериментам алгоритм «NWBP» улучшает степень подгонки и скорость сходимости при обучении сложных сверточных нейронных сетей по сравнению с другими алгоритмами, сокращает избыточные вычисления и в определенной степени сокращает время обучения, а алгоритм имеет преимущество ускорении конвергенции сети по сравнению с простыми сетями. Представлено ограничение дерева слов и его эффективная структура хранения, что повышает эффективность хранения ограничения дерева слов и эффективность поиска при поиске с распознаванием английских фраз.

    Источник (англ.): Journal publishers "Hindawi"