Ссылки по теме выпускной работы

Материалы магистров ДонНТУ

1. Бондаренко И.Ю. Интеграция визуального и речевого способов управления процессом ввода и редактирования текстовой информации

Описание: Персональный сайт на портале магистров ДонНТУ, 2006 г.
Руководитель: к.т.н., доц. Федяев О.И.

2. Веренич И.В. Анализ методов построения систем распознавания речи на основе гибрида скрытой марковской модели и нейросети

Описание: Персональный сайт на портале магистров ДонНТУ, 2008 г.
Руководитель: к.т.н., доц. Федяев О.И.

3. Нестеренко Д.С. Автоматическое распознавание изолированных слов русского языка на основе вейвлет-анализа

Описание: Персональный сайт на портале магистров ДонНТУ, 2009 г.
Руководитель: к.т.н., доц. Федяев О.И.

4. Шатохин Н.А. Параллельные методы автоматического распознавания устной речи на вычислительных SIMD-архитектурах

Описание: Персональный сайт на портале магистров ДонНТУ, 2011 г.
Руководитель: д.т.н., проф. Фельдман Л.П.

5. Акопян А.Г. Распознавание слитной речи

Описание: Персональный сайт на портале магистров ДонНТУ, 2012 г.
Руководитель: д.ф.-м.н., проф. Шелепов В.Ю.

6. Савкова Д.Г. Речевой интерфейс для интеллектуализации ввода текста программ на языках программирования

Описание: Персональный сайт на портале магистров ДонНТУ, 2013 г.
Руководитель: к.т.н., доц. Федяев О.И.

Научные работы и статьи

7. Розпізнавання та смислова інтерпретація злитого українського мовлення для усного фразника-перекладача в умовах альтернативних граматик

Авторы: В.В. Яценко, М.М. Сажок
Описание: В статье рассматриваются проблемы создание систем смысловой интерпретации речевого сигнала в пределах предметных областей. На украинском языке.

8. Система автоматического распознавания русской речи SIRIUS

Авторы: А.Л. Ронжин, А.А. Карпов, И.В. Ли
Описание: В статье представлена разработанная в группе речевой информатики СПИИРАН система распознавания слитной русской речи SIRIUS.

9. Новые методы в пофонемном распознавании речи

Автор: Шелепов В.Ю.
Описание: Статья посвящена распознаванию изолированных слов и новым алгоритмам сегментации речевого сигнала.

10. О распознавании речи на основе межфонемных переходов

Авторы: В.Ю. Шелепов, А.В. Ниценко, Г.В. Дорохина, М.Х. Карабалаева, А.К.Бурибаева
Описание: В работе описан метод распознавания речи на основе межфонемных переходов. Подробно изложены преимущества данного подхода. Результаты исследования могут быть полезны при распознавании сверхбольших словарей.

11. Language recognition using deep-structured conditional random fields

Авторы: Dong Yu, Shizhen Wang, Zahi Karam, Li Deng
Описание: Распознавание речи используя мнослойные структурированные условные случайные поля. На английском языке.

12. Deep Narrow Sigmoid Belief Networks are Universal Approximators

Авторы: I. Sutskever, Geoffrey E. Hinton
Описание: Использование сигмоидных сетей доверия в качестве всеобщего аппроксиматора. На английском языке.

13. An Empirical Evaluation of Deep Architectures on Problems with Many Factors of Variation

Авторы: H. Larochelle, D. Erhan, A. Courville, J. Bergstra, Y. Bengio
Описание: Многослойные нейросетевые архитектуры в многофакторных задачах. На английском языке.

14. A Practical Guide to Training Restricted Boltzmann Machines

Автор: Geoffrey Hinton
Описание: Пособие по обучению ограниченной машины Больцмана. На английском языке.

15. Deep learning for spoken language identification

Автор: Gregoire Montavon
Описание: Практическое применение многослойной нейросетевой архитектуры для распознавания речи с обучением на разных наборах данных. На английском языке.

16. Spoken Language Identification Using Hybrid Feature Extraction Methods

Авторы: Pawan Kumar, Astik Biswas, A .N. Mishra and Mahesh Chandra
Описание: Использование гибридных техник для поиска признаков. На английском языке.

17. Towards Formal Structural Representation of Spoken Language: An Evolving Transformation System (ETS) Approach

Автор: Alexander Gutkin
Описание: Использование топологических методов в распознавании речи. На английском языке.

18. Automatic spoken language identification

Автор: Liang Wang
Описание: Подробно рассматриваются подходы к распознаванию речи с максимизацией функции правдоподобия. На английском языке

19. Spoken Language Understanding

Авторы: Renato De Mori, Frederic Béchet, Dilek Hakkani-Tür, Michael McTear, Giuseppe Riccardi, and Gokhan Tur
Описание: В статье подробно рассматриваются вероятностные методы распознавания речи. На английском языке.

20. How to develop and use a Bayesian Belief Network

Авторы: R. Montironi, W. F. Whimster, Y. Collan, P W Hamilton, D. Thompson, P. H. Bartels
Описание: Байесовские сети доверия, их разработка и применение на практике. На английском языке.

21. Reconnaissance automatique de la parole guidée par des transcriptions a priori

Автор: Benjamin Lecouteux
Описание: Автоматическое распознавание речи с помощью априорных передач. На французском языке.

22. De la reconnaissance automatique de la parole à l’analyse linguistique de corpus oraux

Автор: Martine Adda-Decker
Описание: Анализ лингвистического корпуса для распознавания речи. На французском языке.

23. Réseaux bayésiens : apprentissage et modélisation de systèmes complexes

Автор: Philippe Leray
Описание: Применение байесовских сетей для решения комплексных задач. На французском языке.

24. Classification et reconnaissance de la parole

Автор: Claude Barras
Описание: Рассмотрена подробная структура системы автоматического распознавания речи. На французском языке.

25. Reconnaissance automatique de la parole

Автор: Jean-Paul Haton
Описание: Построение системы распознавания речи с использованием разных моделей. На французском языке.

26. « Je parle, donc je suis ? » Un bilan des développements récents en traitement automatique de la parole

Автор: T. Dutoit
Описание: Обзор новейших исследований по распознаванию речи. На французском языке.

Учебные пособия

27. Neural Networks for Machine Learning

Описание: Интерактивный курс по нейронным сетям проекта "Coursera".
Лектор: профессор Джеффри Хинтон, университет Торонто

28. Machine Learning

Описание: Интерактивный курс по машинному обучению проекта "Coursera".
Лектор: профессор Эндрю Нг, Стэнфордский университет

Нейронные сети: полный курс, 2-е издание

Описание: В книге рассматриваются основные парадигмы искусственных нейронных сетей. Представленный материал содержит строгое математическое обоснование всех нейросетевых парадигм.
Автор: С. Хайкин

30. Pattern Recognition and Machine Learning

Описание: В данной книге рассматриваются основные парадигмы распознавания образов с позиции Байесовских сетей доверия. На английском языке.
Автор: Christopher M. Bishop

31. Нейронные сети: основные модели

Описание: Учебное пособие к курсу "Нейронные сети" для студентов 5 курса магистратуры кафедры электроники физического факультетата Воронежского Государственного университета
Автор: И.В. Заенцев

32. Анализ, распознавание и интерпретация речевых сигналов

Описание: В монографии рассматриваются вопросы автоматического анализа, распознавания, смысловой интерпретации, синтеза и компрессированной передачи речевых сигналов применительно к устному диалогу человека и ЭВМ на формализованных и естественных языках предметных областей для использования в человеко-машинных системах сбора, обработки информации и управления.
Автор: Винцюк Т.

33. Artificial Intelligence and Computational Intelligence

Описание: Материалы международной конференци AICI 2010, Санья, Китай. На английском языке.
Редакторы: Fu Lee Wang, Hepu Deng, Jingsheng Lei

34. Encyclopedia of Machine Learning

Описание: Энциклопедия содержит обширные сведения по машинному обучению. На английском языке.
Редакторы: Claude Sammut, Geoffrey I. Webb

35. Statistical Methods for Speech Recognition

Описание: Книга дает полное представление о статистических методах машинного обучения. На английском языке.
Автор: Frederick Jelinek

36. Computer Speech: Recognition, Compression, Synthesis

Описание: В данной книге подробно рассматриваются все этапы работы с речью с помощью компьютера. На английском языке.
Автор: Manfred R. Schroeder

37. Robust Speech Recognition of Uncertain or Missing Data: Theory and Applications

Описание: В данной книге рассматриваются подходы к распознаванию образов с помощью байесовских сетей доверия. На английском языке.
Авторы: Dorothea Kolossa, Reinhold Haeb-Umbach

Видео материалы

38. The Next Generation of Neural Networks

Описание: Лекция профессора Торонтского университета Джеффри Хинтона на Google Tech Talks, 2007 г.

39. Automatic Speech Recognition, Lecture I

Описание: Лекция Эрика Фослера-Лузье, доцента университета штата Огайо, в летней школе технологий человеческой речи университета Джонса Хопкинса, 2008 г.

40. Deep Belief Networks

Описание: Лекция Джеффри Хинтона в летней школы машинного обучения в Канберре, 2009 г.

41. Restricted Boltzmann Machines and Deep Belief Nets

Описание: Лекция доктора Маркуса Фрина, лектора университета Веллигтона, в летней школе машинного обучения в Канберре, 2010 г.

42. Deep Neural Networks for Speech and Image Processing

Описание: Лекция Алекса Эйсеро из Microsoft Research в летней школе распознавания образов AERFAI, 2012 г.

43. Recent Developments in Deep Learning

Описание: Лекция Джеффри Хинтона на факультете компьютерных наук университета Британской Колумбии, 2013 г.

Персональные сайты исследователей, занимающихся распознаванием образов

44. Джеффри Хинтон

Об исследователе: Британский информатик, в настоящий момент является профессором департамента компьютерных наук в университете Торонто. В марте 2013 года начал работать с Google. Был одним из исследователей, предложивших использовать метод обратного распространения ошибки для тренировки многослойной нейронной сети. Вместе с Терри Сейновски изобрел машину Больцмана.

45. Ян ЛеКун

Об исследователе: Французский информатик, в настоящий момент возглавляет лабораторию искусственного интеллекта Facebook в Нью-Йорке. Известен работами по применению нейросетей применительно к задачам оптического распознавания символов и машинного зрения. Один из основных создателей технологии сжатия изображений DjVu (совместно с Леоном Боту и Патриком Хаффнером). На его сайте находится популярная база данных для распознавания рукописных чисел MNIST, а также сравнительная таблица качества распознавания образов разными алгоритмами.

46. Эрик Фослер-Лузье

Об исследователе: Американский информатик, доцент факультета компьютерных наук и технологий университета Огайо. Работал в коммитете по речевым и языковым технологиям IEEE, редакционнй коллегии "Журнала о эксперементальной лингвистике". Научные интересы касаются астоматического распознавания речи, и применения для этого дискриминативных техник и моделирования произношения.

47. Стюарт Н. Райли

Об исследователе: Британский информатик, постдокторант Шеффилдского университета. Занимается проблемами распознавания и синтеза речи. Участник ряда европейских научных программ, организатор конференций по семантическим сетям.

48. Кристофер М. Бишоп

Об исследователе: Британский информатик, заслуженный деятель науки в Microsoft Research Cambridge, вице-президент Королевского института Великобритании. Научные интересы включают машинное обучение и его применение.

Дополнительные материалы

49. QuantumG — My Notes on Deep Belief Networks

Описание: Сборник различных полезных ресурсов информации о многослойных сетях доверия.

50. Introduction to Pattern Recognition

Описание: Сборник лекций разных лет по распознаванию образов от университета штата Нью-Йорк в Буффало.

51. Распознавание речи от Яндекса. Под капотом у Yandex.SpeechKit

Описание: Описание библиотеки Yandex SpeechKit и используемых в ней алгоритмов.

52. Распознавание речи

Описание: В статье неизвестного автора подробно рассмотрена технология распознавания речи.