ДонНТУ Портал магистров

Магистр ДонНТУ Бакаленко Валерий Сергеевич

Бакаленко Валерий Сергеевич

Факультет компьютерных наук и технологий

Кафедра прикладной математики и информатики

Специальность Инженерия программного обеспечения

Интеллектуализация ввода-вывода кода программы на основе речевых технологий

Научный руководитель: к. т. н., доц. Федяев Олег Иванович

Библиотека материалов по теме выпускной работы

Собственные публикации и доклады

Речевой интерфейс для интеллектуализации ввода исходного кода программ
Авторы: О. И. Федяев, В. С. Бакаленко, Д. Г. Савкова

Описание: В данной работе построена функциональная схема системы речевого ввода текста программы на языке Паскаль, обеспечивающая более естественный способ набора исходного кода программ. Разработана и исследована акустико-лингвистическая модель распознавания речи, основанная на скрытых марковских моделях.

Источник: 15 международная научная конференция им. Т. А. Таран Интеллектуальный анализ информации (ИАИ–2015), Киев, 20–21 мая 2015 г. — К.: Просвіта, 2015. — c. 21–28.
Разработка речевого распознавателя на основе моделей языка в среде CMU Sphinx
Авторы: В. С. Бакаленко, О. И. Федяев

Описание: В данной статье изучена архитектура верхнего уровня системы CMU Sphinx, указаны основные ее составляющие, определены условия применения системы распознавания речи к прикладной задаче распознавания кода программы

Источник: Информационные управляющие системы и компьютерный мониторинг — 2015 (ИУС и КМ — 2015) / Материалы Всеукраинской научно-технической конференции студентов, аспирантов и молодых ученых — 20–24 мая 2015 — Донецк, ДонНТУ — 2015, с. 111–117.
Эффективность инновационных процессов
Авторы: В. А. Харченко, В. С. Бакаленко

Описание: В данной статье изучены типы и критерии инноваций в современных условиях хозяйствования, указаны основные аспекты инновационной деятельности, обобщена сущность показателей оценки инновационных решений

Источник: Инновационные перспективы Донбасса — 2015 / Материалы международной научно-технической конференции студентов, аспирантов и молодых ученых — 20–22 мая 2015 — Донецк, ДонНТУ — 2015, с. 65–68.

Тематические статьи

Распознавание ключевых слов в потоке речи при помощи фонетического стенографа
Авторы: В. В. Пилипенко

Описание: В статье рассматривается использование фонетического стенографа для распознавания ключевых слов в потоке речи. Для моделирования фонем используются скрытые Марковские модели. Ключевое слово задается последовательностью фонем в виде транскрипции слова. Приведены результаты поиска ключевых слов в потоке речи большого количества дикторов. Предложенный подход может использоваться для поиска речевой информации в огромных массивах данных.

Источник: Пилипенко В. В. Распознавание ключевых слов в потоке речи при помощи фонетического стенографа. — Искусственный интеллект. — Донецк, 2009. — № 4.
Автоматизированный стенограф украинской речи
Авторы: В. В. Пилипенко, В. В. Робейко

Описание: В статье рассматривается автоматизированный стенограф для получения текста стенограммы из звукового файла на основе системы распознавания речи с участием оператора. Записанная фонограмма обрабатывается системой распознавания слитной речи многих дикторов из больших словарей (больше 10 тыс. слов). Оператор исправляет допущенные ошибки для получения текста, пригодного для дальнейшей работы. Он также вводит новые слова, не знакомые системе распознавания. На основе анализа ошибок и новых слов производится дообучение системы распознавания, что позволяет улучшать показатели надежности распознавания речи в процессе эксплуатации системы стенографирования.

Источник: Пилипенко В.В., Робейко В. В. Автоматизированный стенограф украинской речи. — Искусственный интеллект. — Донецк, 2008. — № 4., http://www.speech.com.ua/sc/sc2008_p1.pdf
Алгоритм розпізнавання злитого мовлення з надвеликих словників із застосуванням вибірки інформації з баз даних
Авторы: В. В. Пилипенко

Описание: В данной статье представлен новый двухпроходный алгоритм для очень больших (более 1 млн слов) словарей распознавания слитной речи на основе информационного поиска (ELVIRCOS). Принцип этого подхода заключается в разложении процесса распознавания в два прохода, где первый проход строит подмножество для второго прохода распознавания.

Источник: Пилипенко В. В. Алгоритм розпізнавання злитого мовлення з надвеликих словників із застосуванням вибірки інформації з баз даних. — Праці 8-ї міжнародної конференції «УкрОбраз–2006», Київ, 2006., http://www.speech.com.ua/sc/sc2006_p3.pdf
Tuning a CMU Sphinx-III Speech Recognition System for Polish Language
Авторы: Marcin Plonkowski, Pavel Urbanovich

Описание: Статья о настройке системы распознавания речи CMU Sphinx для польского языка и анализ полученных результатов.

Источник: Marcin Plonkowski, Pavel Urbanovich Katolicki Uniwersytet Lubelski Jana Pawa II, Lublin., http://pe.org.pl/articles/2014/4/42.pdf
О перспективах создания системы автоматического распознавания слитной устной русской речи
Авторы: Д. Н. Бабин, И. Л. Мазуренко, А. Б. Холоденко

Описание: В статье приводится прининципиальное описание механизма автоматического распознавания речи. Распознавание речи на акустическом и фонетическом уровнях в настоящее время доведено до совершенства, то есть сравнимо по качеству с надежностью распознавания отдельных звуков человеком, и соответствующие блоки распознавателя уже приобрели канонический вид. Теперь работа по созданиюэтих блоков распознавателя для русского, равно как и для любого другого естественного языка, может быть выполнена по готовому рецепту: сначала записать представительнуюбазу данных, затем настроить по ней параметры вероятностных автоматов — описателей звуков и их сочетаний. Этот подход и описан в статье.

Источник: Д. Н. Бабин, И. Л. Мазуренко, А. Б. Холоденко О перспективах создания системы автоматического распознавания слитной устной русской речи. — Восьмаямеждународная конференция аспирантов, МГУ,Москва, 2009., http://intsys.msu.ru/magazine/archive/v8%281-4%29/babin-045-070.pdf
О перспективах создания системы автоматического распознавания слитной устной русской речи
Авторы: Т. В. Людовик, М. М. Сажок

Описание: В статье описывается структура синтезатора и используемый вариант конкатенативного метода синтеза речи, основанный на хранении, выборе и сглаженном склеивании предварительно записанных сегментов речи. Используются речевые БД большого объема, записанные разными дикторами. Фонетическая и просодическая информация, содержащаяся в БД, используется для поиска необходимых элементов БД.

Источник: Т. В. Людовик, М. М. Сажок Использование речевых баз данных большого обьема при синтезе речи в системах искусственного интеллекта. Проблемы управления и информатики. Київ, 6’2003., http://www.speech.com.ua/sc/sc2003pui.pdf

Переводы статей

Sphinx4 — гибкая система с открытым исходным кодом для распознавания речи (дополненный перевод)
Авторы: В. Волкер, П. Ламьер, Ф. Квок, Б. Радж, Р. Синь, Э. Гувеа, П. Вульф, Дж. Вьюлфель

Автор перевода: В. С. Бакаленко

Описание: Статья об архитектуре и методах работы инструментальной среды CMU Sphinx.

Источник (англ.): http://pad.twiki.di.uniroma1.it/pub/NLP/WebHome/Sphinx4Whitepaper.pdf

Резюме Биография Реферат Ссылки Отчет о поиске Индивидуальный раздел