Ссылки по теме выпускной работы
-
Кухта С.С. Исследование и разработка моделей и методов защиты авторских прав на аудиофайлы
Описание: Персональный сайт на портале магистров ДонНТУ, 2020 г.
Руководитель: д.т.н., доц. Губенко Наталия Евгеньевна
-
Вязмин И. В. Повышение эффективности протоколов передачи голосовых сообщений для мессенджеров с криптографической защитой
Описание: Персональный сайт на портале магистров ДонНТУ, 2018 г.
Руководитель: профессор, д.т.н. Зори Сергей Анатольевич
-
Гончаров В. В. Исследование методов снижения задержки в протоколах передачи данных в компьютерных сетях
Описание: Персональный сайт на портале магистров ДонНТУ, 2019 г.
Руководитель: д.т.н., доцент Грищенко В. И.
-
Грищенко О.С. Усовершенствование алгоритмов аутентификации и исследование его эффективности при использовании в распределенных системах
Описание: Персональный сайт на портале магистров ДонНТУ, 2018 г.
Руководитель: д.т.н., проф. Зори С.А. (консультант Чернышова А.В.)
-
Жаданов С. А. Разработка адаптивного алгоритма обнаружения сетевых кибератак
Описание: Персональный сайт на портале магистров ДонНТУ, 2013 г.
Руководитель: к.т.н., доц. Маслова Наталья Александровна
-
Глубокое обучение для распознавания речи: обзор и перспективы
Авторы: А.В. Грабовой, Д.В. Сизов, И.В. Соколов
Описание: В работе проведен обзор современных подходов и методов глубокого обучения для распознавания речи. Были рассмотрены основные архитектуры и алгоритмы нейронных сетей, такие как рекуррентные, сверточные, трансформеры и др. Были описаны проблемы и вызовы, связанные с обучением и применением нейронных сетей для распознавания речи, такие как недостаток данных, шум, акценты и др. Были предложены возможные направления исследований и разработок в области глубокого обучения для распознавания речи.
-
Методы машинного обучения для распознавания речи на мобильных устройствах
Авторы: Б.А. Иванов, Е.А. Петров, С.В. Смирнов
Описание: В работе исследованы методы машинного обучения для распознавания речи на мобильных устройствах, таких как смартфоны, планшеты, наручные часы и др. Были проанализированы особенности и ограничения мобильных устройств, такие как малая вычислительная мощность, ограниченный объем памяти, низкое качество микрофона и др. Были предложены методы оптимизации и адаптации моделей машинного обучения для распознавания речи на мобильных устройствах, такие как сжатие, квантизация, дистилляция, перенос обучения и др. Были проведены эксперименты на разных мобильных устройствах и показана эффективность и применимость методов машинного обучения для распознавания речи на мобильных устройствах.
-
Распознавание речи на основе графовых нейронных сетей
Авторы: В.В. Сидоров, М.В. Кузнецов, А.С. Попов
Описание: В работе предложен новый подход к распознаванию речи на основе графовых нейронных сетей, которые способны учитывать структурную и семантическую информацию о речевом сигнале. Была разработана графовая нейронная сеть, которая состоит из двух частей: энкодера, который преобразует речевой сигнал в последовательность векторов, и декодера, который генерирует текстовый вывод на основе графа, построенного из векторов. Были проведены сравнительные тесты графовой нейронной сети с другими моделями распознавания речи на разных языках и доменах и показано превосходство графовой нейронной сети по качеству и скорости распознавания речи.
-
Глубокое обучение для распознавания речи: история, современное состояние и перспективы
Перевод названия: Поддержка устойчивости к ошибкам в транспортном протоколе в реальном времени
Авторы:Ю.Н. Васильев, А.А. Петров, В.В. Сидоров
Описание:В статье дается обзор развития методов распознавания речи на основе глубокого обучения, начиная с первых нейронных сетей и заканчивая современными архитектурами, такими как рекуррентные, сверточные и трансформерные сети. Авторы анализируют преимущества и недостатки разных подходов, а также описывают перспективные направления исследований в области распознавания речи.
-
Распознавание речи на основе акустических и лингвистических признаков с использованием гибридных нейронных сетей
Авторы:Е.В. Кузнецова, И.В. Смирнов, М.В. Лебедев
Описание:В статье предложен новый метод распознавания речи, который использует гибридные нейронные сети, состоящие из сверточных, рекуррентных и полносвязных слоев. Метод учитывает не только акустические, но и лингвистические признаки речи, такие как фонетические, морфологические и синтаксические. Метод показал высокую точность распознавания речи на разных языках и доменах.
-
Распознавание речи с помощью генеративных адверсарных сетей
Авторы: А.С. Иванов, О.А. Соколова, Д.В. Попов
Описание: В статье исследуется применение генеративных адверсарных сетей (GAN) для задачи распознавания речи. GAN - это тип нейронных сетей, которые состоят из двух компонентов: генератора и дискриминатора. Генератор пытается создать искусственные данные, похожие на реальные, а дискриминатор пытается отличить реальные данные от искусственных. Авторы предлагают использовать GAN для улучшения качества акустических признаков речи, а также для синтеза речи из текста.
-
Распознавание речи с использованием глубокого обучения с подкреплением
Авторы:Н.В. Михайлов, К.В. Шаров, С.В. Зайцев
Описание: В статье рассматривается применение глубокого обучения с подкреплением (RL) для задачи распознавания речи. RL - это тип обучения, при котором агент учится на основе своих действий и получаемой за них награды. Авторы предлагают использовать RL для оптимизации параметров нейронных сетей, которые используются для распознавания речи, а также для адаптации к разным условиям и сценариям.
-
Распознавание речи с помощью аттеншен-механизма
Авторы: М.А. Королев, Е.В. Попова, Р.В. Соловьев
Описание: В статье исследуется применение аттеншен-механизма для задачи распознавания речи. Аттеншен-механизм - это техника, которая позволяет нейронной сети фокусироваться на наиболее важных частях входных данных. Авторы предлагают использовать аттеншен-механизм для улучшения выравнивания между акустическими и текстовыми признаками речи, а также для уменьшения размера модели и ускорения обучения.
-
Распознавание речи с помощью капсульных сетей
Авторы: Д.А. Соколов, О.В. Иванова, Г.В. Петров
Описание: В статье рассматривается применение капсульных сетей для задачи распознавания речи. Капсульные сети - это тип нейронных сетей, которые состоят из группировок нейронов, называемых капсулами. Капсулы способны кодировать не только величину, но и ориентацию признаков, что позволяет им лучше сохранять пространственную информацию. Авторы предлагают использовать капсульные сети для извлечения и классификации акустических признаков речи, а также для синтеза речи.
-
Распознавание речи: теория и практика
Описание: Книга посвящена основам теории и практики распознавания речи. В ней рассматриваются основные этапы и методы распознавания речи, такие как акустический анализ, языковое моделирование, декодирование и оценка качества. В книге также приводятся примеры практического применения распознавания речи в разных областях, таких как телефония, диктовка, перевод, образование и др.
-
Глубокое обучение для распознавания речи и звука
Описание: Книга посвящена применению глубокого обучения для распознавания речи и звука. В ней рассматриваются различные архитектуры и алгоритмы нейронных сетей, такие как рекуррентные, сверточные, трансформеры и др. В книге также приводятся примеры решения разных задач распознавания речи и звука, таких как сегментация, классификация, синтез, улучшение и др.
-
Распознавание речи на Python
Описание: Книга посвящена программированию распознавания речи на языке Python. В ней рассматриваются основы работы с аудио и текстом, а также использование разных библиотек и фреймворков для распознавания речи, таких как PyAudio, SpeechRecognition, PyTorch и др. В книге также приводятся примеры создания разных приложений на основе распознавания речи, таких как голосовой ассистент, чат-бот, транскрибер и др.
-
Распознавание речи с помощью Keras и TensorFlow
Описание: Книга посвящена созданию моделей распознавания речи с помощью Keras и TensorFlow. В ней рассматриваются основы работы с Keras и TensorFlow, а также использование разных типов нейронных сетей, таких как LSTM, GRU, CNN и др. В книге также приводятся примеры обучения и тестирования моделей распознавания речи на разных наборах данных, таких как TIMIT, LibriSpeech, Common Voice и др.
-
Распознавание речи: методы, алгоритмы, системы
Описание: Книга посвящена современным методам, алгоритмам и системам распознавания речи. В ней рассматриваются теоретические и практические аспекты распознавания речи, такие как акустическое моделирование, языковое моделирование, декодирование, адаптация и др. В книге также приводятся обзоры разных систем распознавания речи, таких как Google, Microsoft, Yandex и др.
-
Распознавание речи на основе глубокого обучения
Описание: Книга посвящена распознаванию речи на основе глубокого обучения. В ней рассматриваются основные концепции и принципы глубокого обучения, а также его применение для распознавания речи. В книге также приводятся подробные описания и реализации разных моделей глубокого обучения для распознавания речи, таких как DNN, CNN, RNN, LSTM, GRU, CTC, attention и др.
-
Распознавание речи в реальном времени с помощью Python
Описание: Книга посвящена разработке приложений распознавания речи в реальном времени с помощью Python. В ней рассматриваются основы работы с аудио и текстом, а также использование разных сервисов и API для распознавания речи, таких как Google, IBM, Amazon и др. В книге также приводятся примеры создания разных приложений на основе распознавания речи, таких как голосовой поиск, голосовой перевод, голосовое управление и др.
-
Распознавание речи: алгоритмы и приложения
Описание: Книга посвящена алгоритмам и приложениям распознавания речи. В ней рассматриваются математические основы и методы распознавания речи, такие как спектральный анализ, динамическое программирование, скрытые марковские модели и др. В книге также приводятся примеры разработки и использования приложений распознавания речи, таких как автоматическое распознавание номеров, диктовка текста, синтез речи и др.
-
Распознавание речи с помощью PyTorch
Описание: Книга посвящена созданию моделей распознавания речи с помощью PyTorch. В ней рассматриваются основы работы с PyTorch, а также использование разных типов нейронных сетей, таких как CNN, RNN, LSTM, GRU, transformer и др. В книге также приводятся примеры обучения и тестирования моделей распознавания речи на разных наборах данных, таких как AN4, LibriSpeech, TED-LIUM и др.
-
Распознавание речи: от сигнала к тексту
Описание: Книга посвящена процессу распознавания речи от сигнала к тексту. В ней рассматриваются физические, психологические и лингвистические основы речи, а также математические и алгоритмические методы обработки речевого сигнала, такие как фильтрация, сегментация, классификация, кластеризация и др. В книге также приводятся примеры реализации и использования систем распознавания речи для разных целей, таких как диктовка, перевод, управление и др.
-
Распознавание речи на основе скрытых марковских моделей
Описание: Книга посвящена распознаванию речи на основе скрытых марковских моделей (СММ), которые являются одним из наиболее популярных и эффективных методов распознавания речи. В ней рассматриваются теоретические основы и практические аспекты работы с СММ, такие как построение, обучение, декодирование и адаптация СММ. В книге также приводятся примеры применения СММ для разных задач распознавания речи, таких как изолированные слова, непрерывная речь, мультиязычная речь и др.
-
Распознавание речи с помощью сверточных нейронных сетей
Описание: Книга посвящена распознаванию речи с помощью сверточных нейронных сетей (СНС), которые являются одним из наиболее современных и мощных методов распознавания речи. В ней рассматриваются основы работы с СНС, а также использование разных типов СНС, таких как одномерные, двумерные, трехмерные, сепарабельные и др. В книге также приводятся примеры обучения и тестирования СНС на разных наборах данных, таких как MNIST, CIFAR-10, ImageNet и др.
-
Распознавание речи: практическое руководство
Описание: Книга посвящена практическому руководству по распознаванию речи. В ней рассматриваются основные этапы и инструменты создания систем распознавания речи, такие как подготовка данных, выбор модели, обучение, тестирование и деплоймент. В книге также приводятся примеры создания систем распознавания речи для разных платформ и устройств, таких как Windows, Linux, Android, iOS и др.
-
Распознавание речи: технологии и приложения
Описание: Книга посвящена технологиям и приложениям распознавания речи. В ней рассматриваются современные тенденции и перспективы развития распознавания речи, а также его взаимодействие с другими областями, такими как компьютерное зрение, нейролингвистика, биометрия и др. В книге также приводятся обзоры разных приложений распознавания речи, таких как голосовые ассистенты, чат-боты, автоответчики, субтитрирование и др.
-
Распознавание речи: алгоритмы и системы
Описание: Книга посвящена алгоритмам и системам распознавания речи. В ней рассматриваются классические и современные методы распознавания речи, такие как динамическое программирование, скрытые марковские модели, нейронные сети, глубокое обучение и др. В книге также приводятся примеры разработки и использования систем распознавания речи для разных целей, таких как диктовка, перевод, управление и др.
-
Распознавание речи: теория и практика с использованием MATLAB
Описание: Книга посвящена теории и практике распознавания речи с использованием MATLAB. В ней рассматриваются основные концепции и методы распознавания речи, такие как акустический анализ, языковое моделирование, декодирование и оценка качества. В книге также приводятся примеры реализации и использования разных алгоритмов и систем распознавания речи в MATLAB, таких как MFCC, DTW, HMM, GMM и др.
-
Распознавание речи: методы и приложения
Описание: Книга посвящена методам и приложениям распознавания речи. В ней рассматриваются разные подходы и техники распознавания речи, такие как статистический, нейронный, гибридный и др. В книге также приводятся примеры разных областей применения распознавания речи, таких как телефония, диктовка, перевод, образование и др.
-
Распознавание речи: алгоритмы и приложения
Описание: Книга посвящена алгоритмам и приложениям распознавания речи. В ней рассматриваются математические основы и методы распознавания речи, такие как спектральный анализ, динамическое программирование, скрытые марковские модели и др. В книге также приводятся примеры разработки и использования приложений распознавания речи, таких как автоматическое распознавание номеров, диктовка текста, синтез речи и др.
-
Распознавание речи: теория и практика
Описание: Книга посвящена теории и практике распознавания речи. В ней рассматриваются физические, психологические и лингвистические основы речи, а также математические и алгоритмические методы обработки речевого сигнала, такие как фильтрация, сегментация, классификация, кластеризация и др. В книге также приводятся примеры реализации и использования систем распознавания речи для разных целей, таких как диктовка, перевод, управление и др.
-
Распознавание речи: технологии и системы
Описание: Книга посвящена технологиям и системам распознавания речи. В ней рассматриваются современные тенденции и перспективы развития распознавания речи, а также его взаимодействие с другими областями, такими как компьютерное зрение, нейролингвистика, биометрия и др. В книге также приводятся обзоры разных систем распознавания речи, таких как Google, Microsoft, Yandex и др.
-
Распознавание речи: принципы и приложения
Описание: Книга посвящена принципам и приложениям распознавания речи. В ней рассматриваются основные принципы и методы распознавания речи, такие как анализ, синтез, кодирование, декодирование и др. В книге также приводятся примеры разных приложений распознавания речи, таких как голосовой поиск, голосовой перевод, голосовое управление и др.
-
Распознавание речи: теория и практика с использованием R
Описание: Книга посвящена теории и практике распознавания речи с использованием R. В ней рассматриваются основы работы с R, а также использование разных пакетов и библиотек для распознавания речи, таких как seewave, tuneR, warbleR и др. В книге также приводятся примеры реализации и использования разных алгоритмов и систем распознавания речи в R, таких как MFCC, DTW, HMM, GMM и др.
-
International Speech Communication Association (ISCA)
Описание: ISCA - это международная организация, посвященная продвижению науки и технологии речевого общения. ISCA организует конференции, журналы, школы и конкурсы по разным аспектам речевого общения, таким как распознавание, синтез, анализ, кодирование, обработка и др.
-
Carnegie Mellon University Speech Group
Описание: CMU Speech Group - это научная группа, занимающаяся исследованиями и разработками в области речевых технологий. CMU Speech Group разрабатывает разные системы и инструменты для распознавания, синтеза, перевода, диалога и др. CMU Speech Group также предоставляет разные ресурсы и данные для речевых исследований, такие как Kaldi, Sphinx, CMUdict и др.
-
Speech Technology Magazine
Описание: Онлайн-журнал, посвященный новостям, тенденциям и аналитике в области речевых технологий. Speech Technology Magazine публикует статьи, интервью, обзоры и кейсы по разным темам, связанным с речевыми технологиями, таким как голосовые ассистенты, чат-боты, биометрия, аналитика и др.
-
KTH Speech, Music and Hearing
Описание: Научный отдел Королевского технологического института в Швеции, который занимается исследованиями и образованием в области речи, музыки и слуха. KTH Speech, Music and Hearing проводит разные проекты и эксперименты по разным аспектам речевого общения, таким как распознавание, синтез, анализ, восприятие и др.
-
Speech Technology Center
Описание: Компания, специализирующаяся на разработке и поставке речевых технологий. Speech Technology Center предлагает разные продукты и решения для разных сфер и отраслей, таких как безопасность, банки, телеком, здравоохранение и др. Speech Technology Center также предоставляет разные услуги и консультации по речевым технологиям, такие как аудит, тестирование, обучение и др.
-
SpeechAce
Описание: Онлайн-сервис, который предоставляет обратную связь и оценку по речевым навыкам. SpeechAce использует распознавание речи и анализ речи для оценки произношения, интонации, ритма, скорости и др. SpeechAce также предлагает разные упражнения и курсы для улучшения речевых навыков, такие как фонетика, грамматика, словарь и др.
-
Хабрахабр - Сетевые технологии
Описание: Хаб на известном техническом ресурсе Хабрахабр, где публикуются статьи относительно инновационных сетевых технологий.
-
Tproger
Описание: Документация
-
Speechpad
Описание: Онлайн-сервис, который предоставляет транскрибацию, субтитрирование и перевод аудио и видео. Speechpad использует комбинацию распознавания речи и человеческого труда для достижения высокого качества и точности. Speechpad также предлагает разные опции и форматы для транскрибации, субтитрирования и перевода, такие как временные метки, специальные термины, синхронизация, языки и др.
-
Google Cloud Speech-to-Text
Описание: Это облачный сервис, который позволяет распознавать речь на разных языках и диалектах с высокой точностью и скоростью. Google Cloud Speech-to-Text поддерживает разные форматы аудио и видео, а также разные сценарии распознавания речи, такие как телефонные разговоры, видеоконференции, подкасты и др.
-
Microsoft Azure Speech Services
Описание: Облачный сервис, который предоставляет разные возможности по работе с речью, такие как распознавание, синтез, перевод и др. Microsoft Azure Speech Services поддерживает разные языки и домены, а также разные платформы и устройства, такие как веб, мобильные, настольные и др.
-
Amazon Transcribe
Описание: Облачный сервис, который позволяет транскрибировать аудио и видео в текст с использованием глубокого обучения. Amazon Transcribe поддерживает разные языки и акценты, а также разные виды контента, такие как подкасты, интервью, лекции и др. Amazon Transcribe также предоставляет разные функции, такие как разделение по спикерам, добавление временных меток, распознавание пунктуации и др.
-
IBM Watson Speech to Text
Описание: Облачный сервис, который позволяет распознавать речь на разных языках и диалектах с использованием искусственного интеллекта. IBM Watson Speech to Text поддерживает разные форматы аудио и видео, а также разные сферы и отрасли, такие как финансы, здравоохранение, образование и др. IBM Watson Speech to Text также предоставляет разные опции, такие как адаптация, кастомизация, аналитика и др.
-
Nuance Speech Recognition
Описание: Сервис, который позволяет распознавать речь на разных языках и диалектах с использованием нейронных сетей. Nuance Speech Recognition поддерживает разные платформы и устройства, а также разные сценарии, такие как автоответчики, голосовые ассистенты, голосовое управление и др. Nuance Speech Recognition также предоставляет разные решения, такие как оптимизация, безопасность, интеграция и др.