Ссылки по теме выпускной работы
Материалы магистров ДонНТУ
1. Бондаренко И.Ю. Интеграция визуального и речевого способов управления процессом ввода и редактирования текстовой информацииОписание: Персональный сайт на портале магистров ДонНТУ, 2006 г. Руководитель: к.т.н., доц. Федяев О.И.
2. Веренич И.В. Анализ методов построения систем распознавания речи на основе гибрида скрытой марковской модели и нейросетиОписание: Персональный сайт на портале магистров ДонНТУ, 2008 г. Руководитель: к.т.н., доц. Федяев О.И.
3. Нестеренко Д.С. Автоматическое распознавание изолированных слов русского языка на основе вейвлет-анализаОписание: Персональный сайт на портале магистров ДонНТУ, 2009 г. Руководитель: к.т.н., доц. Федяев О.И.
4. Шатохин Н.А. Параллельные методы автоматического распознавания устной речи на вычислительных SIMD-архитектурахОписание: Персональный сайт на портале магистров ДонНТУ, 2011 г. Руководитель: д.т.н., проф. Фельдман Л.П.
5. Акопян А.Г. Распознавание слитной речиОписание: Персональный сайт на портале магистров ДонНТУ, 2012 г. Руководитель: д.ф.-м.н., проф. Шелепов В.Ю.
6. Савкова Д.Г. Речевой интерфейс для интеллектуализации ввода текста программ на языках программированияОписание: Персональный сайт на портале магистров ДонНТУ, 2013 г. Руководитель: к.т.н., доц. Федяев О.И.
Научные работы и статьи
7. Розпізнавання та смислова інтерпретація злитого українського мовлення для усного фразника-перекладача в умовах альтернативних граматикАвторы: В.В. Яценко, М.М. Сажок Описание: В статье рассматриваются проблемы создание систем смысловой интерпретации речевого сигнала в пределах предметных областей. На украинском языке.
8. Система автоматического распознавания русской речи SIRIUSАвторы: А.Л. Ронжин, А.А. Карпов, И.В. Ли Описание: В статье представлена разработанная в группе речевой информатики СПИИРАН система распознавания слитной русской речи SIRIUS.
9. Новые методы в пофонемном распознавании речиАвтор: Шелепов В.Ю. Описание: Статья посвящена распознаванию изолированных слов и новым алгоритмам сегментации речевого сигнала.
10. О распознавании речи на основе межфонемных переходовАвторы: В.Ю. Шелепов, А.В. Ниценко, Г.В. Дорохина, М.Х. Карабалаева, А.К.Бурибаева Описание: В работе описан метод распознавания речи на основе межфонемных переходов. Подробно изложены преимущества данного подхода. Результаты исследования могут быть полезны при распознавании сверхбольших словарей.
11. Language recognition using deep-structured conditional random fieldsАвторы: Dong Yu, Shizhen Wang, Zahi Karam, Li Deng Описание: Распознавание речи используя мнослойные структурированные условные случайные поля. На английском языке.
12. Deep Narrow Sigmoid Belief Networks are Universal ApproximatorsАвторы: I. Sutskever, Geoffrey E. Hinton Описание: Использование сигмоидных сетей доверия в качестве всеобщего аппроксиматора. На английском языке.
13. An Empirical Evaluation of Deep Architectures on Problems with Many Factors of VariationАвторы: H. Larochelle, D. Erhan, A. Courville, J. Bergstra, Y. Bengio Описание: Многослойные нейросетевые архитектуры в многофакторных задачах. На английском языке.
14. A Practical Guide to Training Restricted Boltzmann MachinesАвтор: Geoffrey Hinton Описание: Пособие по обучению ограниченной машины Больцмана. На английском языке.
15. Deep learning for spoken language identificationАвтор: Gregoire Montavon Описание: Практическое применение многослойной нейросетевой архитектуры для распознавания речи с обучением на разных наборах данных. На английском языке.
16. Spoken Language Identification Using Hybrid Feature Extraction MethodsАвторы: Pawan Kumar, Astik Biswas, A .N. Mishra and Mahesh Chandra Описание: Использование гибридных техник для поиска признаков. На английском языке.
17. Towards Formal Structural Representation of Spoken Language: An Evolving Transformation System (ETS) ApproachАвтор: Alexander Gutkin Описание: Использование топологических методов в распознавании речи. На английском языке.
18. Automatic spoken language identificationАвтор: Liang Wang Описание: Подробно рассматриваются подходы к распознаванию речи с максимизацией функции правдоподобия. На английском языке
19. Spoken Language UnderstandingАвторы: Renato De Mori, Frederic Béchet, Dilek Hakkani-Tür, Michael McTear, Giuseppe Riccardi, and Gokhan Tur Описание: В статье подробно рассматриваются вероятностные методы распознавания речи. На английском языке.
20. How to develop and use a Bayesian Belief NetworkАвторы: R. Montironi, W. F. Whimster, Y. Collan, P W Hamilton, D. Thompson, P. H. Bartels Описание: Байесовские сети доверия, их разработка и применение на практике. На английском языке.
21. Reconnaissance automatique de la parole guidée par des transcriptions a prioriАвтор: Benjamin Lecouteux Описание: Автоматическое распознавание речи с помощью априорных передач. На французском языке.
22. De la reconnaissance automatique de la parole à l’analyse linguistique de corpus orauxАвтор: Martine Adda-Decker Описание: Анализ лингвистического корпуса для распознавания речи. На французском языке.
23. Réseaux bayésiens : apprentissage et modélisation de systèmes complexesАвтор: Philippe Leray Описание: Применение байесовских сетей для решения комплексных задач. На французском языке.
24. Classification et reconnaissance de la paroleАвтор: Claude Barras Описание: Рассмотрена подробная структура системы автоматического распознавания речи. На французском языке.
25. Reconnaissance automatique de la paroleАвтор: Jean-Paul Haton Описание: Построение системы распознавания речи с использованием разных моделей. На французском языке.
26. « Je parle, donc je suis ? » Un bilan des développements récents en traitement automatique de la paroleАвтор: T. Dutoit Описание: Обзор новейших исследований по распознаванию речи. На французском языке.
Учебные пособия
27. Neural Networks for Machine LearningОписание: Интерактивный курс по нейронным сетям проекта "Coursera". Лектор: профессор Джеффри Хинтон, университет Торонто
28. Machine LearningОписание: Интерактивный курс по машинному обучению проекта "Coursera". Лектор: профессор Эндрю Нг, Стэнфордский университет
Нейронные сети: полный курс, 2-е изданиеОписание: В книге рассматриваются основные парадигмы искусственных нейронных сетей. Представленный материал содержит строгое математическое обоснование всех нейросетевых парадигм. Автор: С. Хайкин
30. Pattern Recognition and Machine LearningОписание: В данной книге рассматриваются основные парадигмы распознавания образов с позиции Байесовских сетей доверия. На английском языке. Автор: Christopher M. Bishop
31. Нейронные сети: основные моделиОписание: Учебное пособие к курсу "Нейронные сети" для студентов 5 курса магистратуры кафедры электроники физического факультетата Воронежского Государственного университета Автор: И.В. Заенцев
32. Анализ, распознавание и интерпретация речевых сигналовОписание: В монографии рассматриваются вопросы автоматического анализа, распознавания, смысловой интерпретации, синтеза и компрессированной передачи речевых сигналов применительно к устному диалогу человека и ЭВМ на формализованных и естественных языках предметных областей для использования в человеко-машинных системах сбора, обработки информации и управления. Автор: Винцюк Т.
33. Artificial Intelligence and Computational IntelligenceОписание: Материалы международной конференци AICI 2010, Санья, Китай. На английском языке. Редакторы: Fu Lee Wang, Hepu Deng, Jingsheng Lei
34. Encyclopedia of Machine LearningОписание: Энциклопедия содержит обширные сведения по машинному обучению. На английском языке. Редакторы: Claude Sammut, Geoffrey I. Webb
35. Statistical Methods for Speech RecognitionОписание: Книга дает полное представление о статистических методах машинного обучения. На английском языке. Автор: Frederick Jelinek
36. Computer Speech: Recognition, Compression, SynthesisОписание: В данной книге подробно рассматриваются все этапы работы с речью с помощью компьютера. На английском языке. Автор: Manfred R. Schroeder
37. Robust Speech Recognition of Uncertain or Missing Data: Theory and ApplicationsОписание: В данной книге рассматриваются подходы к распознаванию образов с помощью байесовских сетей доверия. На английском языке. Авторы: Dorothea Kolossa, Reinhold Haeb-Umbach
Видео материалы
38. The Next Generation of Neural NetworksОписание: Лекция профессора Торонтского университета Джеффри Хинтона на Google Tech Talks, 2007 г.
39. Automatic Speech Recognition, Lecture IОписание: Лекция Эрика Фослера-Лузье, доцента университета штата Огайо, в летней школе технологий человеческой речи университета Джонса Хопкинса, 2008 г.
40. Deep Belief NetworksОписание: Лекция Джеффри Хинтона в летней школы машинного обучения в Канберре, 2009 г.
41. Restricted Boltzmann Machines and Deep Belief NetsОписание: Лекция доктора Маркуса Фрина, лектора университета Веллигтона, в летней школе машинного обучения в Канберре, 2010 г.
42. Deep Neural Networks for Speech and Image ProcessingОписание: Лекция Алекса Эйсеро из Microsoft Research в летней школе распознавания образов AERFAI, 2012 г.
43. Recent Developments in Deep LearningОписание: Лекция Джеффри Хинтона на факультете компьютерных наук университета Британской Колумбии, 2013 г.
Персональные сайты исследователей, занимающихся распознаванием образов
44. Джеффри ХинтонОб исследователе: Британский информатик, в настоящий момент является профессором департамента компьютерных наук в университете Торонто. В марте 2013 года начал работать с Google. Был одним из исследователей, предложивших использовать метод обратного распространения ошибки для тренировки многослойной нейронной сети. Вместе с Терри Сейновски изобрел машину Больцмана.
45. Ян ЛеКунОб исследователе: Французский информатик, в настоящий момент возглавляет лабораторию искусственного интеллекта Facebook в Нью-Йорке. Известен работами по применению нейросетей применительно к задачам оптического распознавания символов и машинного зрения. Один из основных создателей технологии сжатия изображений DjVu (совместно с Леоном Боту и Патриком Хаффнером). На его сайте находится популярная база данных для распознавания рукописных чисел MNIST, а также сравнительная таблица качества распознавания образов разными алгоритмами.
46. Эрик Фослер-ЛузьеОб исследователе: Американский информатик, доцент факультета компьютерных наук и технологий университета Огайо. Работал в коммитете по речевым и языковым технологиям IEEE, редакционнй коллегии "Журнала о эксперементальной лингвистике". Научные интересы касаются астоматического распознавания речи, и применения для этого дискриминативных техник и моделирования произношения.
47. Стюарт Н. РайлиОб исследователе: Британский информатик, постдокторант Шеффилдского университета. Занимается проблемами распознавания и синтеза речи. Участник ряда европейских научных программ, организатор конференций по семантическим сетям.
48. Кристофер М. БишопОб исследователе: Британский информатик, заслуженный деятель науки в Microsoft Research Cambridge, вице-президент Королевского института Великобритании. Научные интересы включают машинное обучение и его применение.
Дополнительные материалы
49. QuantumG — My Notes on Deep Belief NetworksОписание: Сборник различных полезных ресурсов информации о многослойных сетях доверия.
50. Introduction to Pattern RecognitionОписание: Сборник лекций разных лет по распознаванию образов от университета штата Нью-Йорк в Буффало.
51. Распознавание речи от Яндекса. Под капотом у Yandex.SpeechKitОписание: Описание библиотеки Yandex SpeechKit и используемых в ней алгоритмов.
52. Распознавание речиОписание: В статье неизвестного автора подробно рассмотрена технология распознавания речи.