Ссылки по теме выпускной работы
Леонов А.Д. Методы автоматизированной коррекции специализированных естественно-языковых текстов
Руководитель: доц. Бабаков Р.М.
Описание: Персональный сайт на портале магистров ДонНТУ, 2014 г.
Шулянский Д.В. Интеллектуальная система оценки знаний естественных языков
Руководитель: к.т.н., Хмелевой С.В.
Описание: Персональный сайт на портале магистров ДонНТУ, 2016 г.
Сарры Н.А. Методы и алгоритмы извлечения структурированных данных из текстов новостей
Руководитель: к.т.н., доц. Звенигородский А.С.
Описание: Персональный сайт на портале магистров ДонНТУ, 2012 г.
Линкин В.О. Исследование алгоритмического обеспечения интеллектуальной системы классификации политематических гипертекстовых документов
Руководитель: к.т.н., доц. Егошина А.А.
Описание: Персональный сайт на портале магистров ДонНТУ, 2013 г.
Охрименко К.С. Модели и алгоритмическое обеспечение для построения семантических сетей текстов на естественном языке
Руководитель: к.т.н., доц. Вороной С.М.
Описание: Персональный сайт на портале магистров ДонНТУ, 2012 г.
Непомящий А.А. Разработка и исследование вопросно–ответного интерфейса в системах тестирования
Руководитель: к.т.н., доц. Звенигородский А.С.
Описание: Персональный сайт на портале магистров ДонНТУ, 2014 г.
Гайдамака А.С. Разработка метода автоматического обнаружения предикатных структур распространённых простых предложений русского языка методами традиционного синтаксического анализа
Руководитель: к.т.н., доц. Ермоленко Т.В.
Описание: Персональный сайт на портале магистров ДонНТУ, 2012 г.
Соколенко И.В. Система сокрытия информации на основе лингвистических ресурсов
Руководитель: к.т.н., доц. Губенко Н.Е.
Описание: Персональный сайт на портале магистров ДонНТУ, 2014 г.
Бажанова А.И. Разработка онтологической модели для семантического поиска информации в электронной библиотеке
Руководитель: доц. Мартыненко Т.В.
Описание: Персональный сайт на портале магистров ДонНТУ, 2012 г.
Использование методов машинного обучения в анализе текстовых форумов для подготовки учебных объектов
Авторы: Грозин В.А., Добренко Н.В., Гусарова Н.Ф., Нин Тао
Описание: Nowadays the concept of a learning object (LO) is widely used in preparation of educational materials. Usually, LOs are parts or fragments of previously created educational content, which is very informative and pedagogically focused. However, concerning high-dynamic branches of science and technologies LOs tend to become outdated and trivial thus losing their educative value. In this situation, specialized text forums become a valuable source of knowledge. Forums contain experience of people who actually used the technology and its features. They contain both positive and negative experience—something that is not available from official documentation at all. However, they also contain many trivial, repeated and still irrelevant posts. Also, an expert needs to extract useful messages from text forums according to his individual learning objectives.
Автоматическое исправление опечаток в поисковых запросах без учета контекста
Авторы: Панина М.Ф., Байтин А.В., Галинская И.Е.
Описание: Анализируя ошибки в поисковых запросах нетрудно заметить, что большая часть из них имеет однозначное исправление, не зависящее от словарного окружения, и может быть исправлена в автоматическом режиме. В данной работе мы попытались выделить классы ошибок, которые можно исправлять автоматически, определить долю контекстно-независимых исправлений, и для выбранного множества ошибок разработать классификатор, позволяющий разделить исправления на надежные (пригодные для автоматической замены) и малонадежные (пригодные только для подсказки).
Повышение точности определения морфологических признаков неизвестных слов методом аналогий с помощью нечётких множеств
Авторы: Гашков А.В.
Описание: Проблема определения морфологических признаков неизвестных слов, то есть таких, которые не содержатся в словаре автоматической системы, пока не имеет удовлетворительного решения. Известные системы определяют морфологические признаки неизвестных слов с точностью менее 30 %, что недостаточно для использования таких систем в полностью автоматическом режиме. Предполагается, что использование метода аналогий в сочетании с нечеткими множествами может улучшить качество анализа. Проведенные эксперименты показали, что точность определения признаков неизвестных слов возросла до 50%, что автор полагает удовлетворительным результатом.
Обработка текстов на естественном языке
Авторы: Константин Селезнев
Описание: Задачи обработки текстов возникли практически сразу вслед за появлением вычислительной техники. Но несмотря на полувековую историю исследований в области искусственного интеллекта, огромный скачок в развитии ИТ и смежных дисциплин, удовлетворительного решения большинства практических задач обработки текста пока нет.
Автоматизация морфологического анализа текстовой информации
Авторы: Н.И. Степанова
Описание: В статье предложена методика морфологического анализа текстовой информации автоматической системой.
Модель извлечения фактов из естественно-языковых текстов и метод ее обучения
Авторы: А.М.Андреев, Д.В. Березкин, К.В. Симаков
Описание: В статье изложена модель извлечения фактов из естественно-языковых текстов и метод ее обучения. Ключевым элементом модели является набор правил извлечения. Метод обучения генерирует набор правил на основе обучающих примеров подготовленных человеком. Проведен ряд экспериментов, дана оценка зависимости основных показателей качества обученной модели от свойств исходной обучающей выборки.
Реализация ресурса знаний в системе извлечения информации из текста
Авторы: Д.А. Александровский, Д.А. Кормалев, Е.П. Куршев, Е.А. Сулейманова, И.В. Трофимов
Описание: Задача извлечения информации из текста состоит в автоматической обработке документов с целью распознавания и выделения релевантной информации и представления ее в структурированной форме. Практически в любой предметной области для точного извлечения требуются априорные знания о ней — знания о понятиях, объектах и отношениях, связанных с целями извлечения или являющихся целями. В свою очередь, извлеченная из текстов информация может нести в себе новые знания о предметной области и быть полезна для дальнейшего извлечения. Тесная связь между априорной и извлеченной информацией, а также между предметными и лингвистическими знаниями сформировала потребность в унификации средств представления. В статье рассматривается интегрированный ресурс знаний (РЗ) системы извлечения информации, объединяющий базу предметных знаний и словарь.
Автоматическое выделение терминов из текстов предметных областей и установление связей между ними
Авторы: Д.С. Новикова
Описание: В настоящей работе приведен краткий обзор наиболее интересных подходов и методов в области автоматического выделения терминов.
Автоматический анализ текстов на естественном языке
Авторы: Щуревич Е.В., Крючкова Е.Н.
Описание: В работе исследуется возможность автоматического анализа текстов на естественном языке на предмет выделения их основного смысла.
Глубинный анализ текстов. Технология эффективного анализа текстовых данных
Авторы: Дмитрий Ландэ
Описание: Основы технологии Text Mining
Оценка качества информационного поиска в слабо структурированных источниках на основе метаданных и базы знаний
Авторы: Егошина А.А., Вороной А.С.
Описание: Предлагается технология повышения эффективности поиска в слабо структурированных базах данных с Web–интерфейсом на основе метаданных, представляющих структуру баз данных и базы знаний, описывающей семантику хранимых данных. Проведена оценка качества информационного поиска в слабо структурированных источниках на основе метаданных и базы знаний для различных категорий пользователей с использованием критериев полноты и точности.
Концепция и задачи понимания смысла текста в системах искусственного интеллекта
Авторы: Звенигородский А.С.
Описание: В статье рассматривается проблема построения концепции искусственного интеллекта для понимания смысла текство на естественном языке. Предлагается смысл текста рассматриваеть не с точки зрения семантики языка, а с точки зрения смысла для субъекта. Формулируется новая постановка задачи понимания смысла текстов в системах искусственного интеллекта.
Повышение эффективности извлечения информации из слабо структурированных источников на основе метаданных и базы знаний
Авторы: Егошина А.А., Вороной А.С.
Описание: Предлагается технология повышения эффективности поиска в слабо структурированных базах данных с Web–интерфейсом на основе метаданных, представляющих структуру баз данных и базы знаний, описывающей семантику хранимых данных. Предложена модель метаданных для рассматриваемых баз данных и структура хранилища метаданных. Хранение метаданных и базы знаний на отдельном сервере позволяет сократить время обработки запросов. Приведены результаты экспериментальных исследований в производственной среде работы с базами данных для различных профилей операций пользователей.
Контекстный семантический анализ текста
Авторы: Марченко А.А., Никоненко А.А.
Описание: В данной работе содержится описание системы ассоциативно-семантического контекстного анализаестественно-языковых текстов, на базе которой реализована прикладная система мониторинга текстовых потоков и корпусов с блоком качественного оценивания лингвистических фокусных объектов, предназначенная для вычисления различных качественных характеристик и параметровзаданных объектов и процессов.
Разработка подхода к созданию алгоритма синтаксического анализа естественно-языкового текста информационно-поисковых систем
Авторы: М.Ю. Полякова, Б.Н. Судаков
Описание: Рассмотрены существующие методы синтаксического анализа естественно-языкового текста и выделены основные преимущества и недостатки. Разработан усовершенствованный алгоритм синтаксического анализа. Показано, что параллельное использование синтакического и семантического анализа позволяет сократить временные затраты на обработку естественно-языкового текста.
Модели семантики простых предложений русского языка и их приложение в синтаксическом анализе.
Авторы: Г.Ф. Дюбко
Описание: Основной идеей данной модели является проектирование анализатора, который производит синтаксико-семантический анализ простого предложения русского языка, определяя семантические функции предложения и используя А-словарь. Семантическая функция – это определенный смысл, который ставится каждому словосочетанию (группа связанных между собой по смыслу и грамматически слов) предложения. Словосочетание в свою очередь формируются с помощью поверхностного смысла входящих в него слов, который определяется толковым словарем.
Разработка методов автоматического индексирования текстов на естественном языке для информационно-поисковых систем
Авторы: Бевзов А.Н.
Описание: Рассматривается разработка методов автоматического индексирования текстов на естественном языке (ЕЯ), которые могут использоваться при создании информационнопоисковых систем (ИПС).
Классификация текстов с помощью сверточных нейронных сетей
Авторы: Воробьев Е.В., Пучков Е.В.
Описание: Исследованы методы применения сверточных нейронных сетей для классификации коротких текстов подзадачи разработки чат-бота. Проведено сравнение качества работы построенного классификатора с результатами, полученными с помощью метода опорных векторов и рекуррентных нейронных сетей. Показано, что реализованный классификатор демонстрирует результаты лучше, чем другие методы, а также может быть рекомендован для применения в чат-боте.
Эвристическая сеть для программы chatbot
Авторы: Шовин В.А.
Описание: Разработан эффективный алгоритм эвристической сети по некоторым свойствам аналогичный рекуррентной нейронной сети для программы виртуального собеседника. Алгоритм усовершенствован с использованием толкового словаря русского языка. В эвристическую сеть внедрён генератор новых ответов на базе статистической информации базы знаний.
Проблема отбора языкового материала при исследовании диалогов чата
Авторы: Иноземцева Ю.А.
Описание: Интернет коммуникативное пространство, свободное от различных регулятивов реального мира. Здесь встречаются явления, не вписывающиеся в рамки стандартных понятий о репликах диалога, подлежащих исследованию. Они-то и приводят к трудностям отбора языкового материала. Исследования реплик-реакций с учётом реплик, содержащих обсценные выражения, смайлы, а также реагирующих реплик ботов и реакции на иноязычную речь, будут более полными, в то время, как непристойные предложения и инициирующие реплики ботов могут быть опущены.
Перспективы и особенности разработки чат-ботов
Авторы: Параскевов А.В., Каденцева А.А., Мороз С.И.
Описание: To date, a necessary condition for progress in the field of information technology is wide adoption of standards and technologies of information systems used for hardware and software products. Building software of computing and information systems, based on the ideology of open systems, allows to solve successfully the problem of software portability on platforms of various manufacturers, the problem of interchangeability of components and, most importantly, ensures the integration of devices and users in a variety of computing and telecommunication networks. It should be emphasized the fact that to date the successful implementation of any significant projects in the field of information and computer technology, management of information and telecommunications is not possible without coordination of development with existing standards in the field of information systems and, in some cases, the development of new standards. In the transition to a unified computing telecommunications systems principles of information systems form the basis of technology integration, the establishment of sectoral, regional and national information infrastructures and their interactions on a global scale.
Классификация текста с помощью нейронной сети на Java
Статья на портале Хабрахабр.
Классификация предложений с помощью нейронных сетей без предварительной обработки
Статья на портале Хабрахабр.
Алгоритмы чат бота на базе рекуррентной нейронной сети и расширения языка AIML
Статья на портале Сохабр.
Как решить 90% задач NLP: пошаговое руководство по обработке естественного языка
Статья на портале Хабрахабр.
5 методов обработки естественного языка, которые стремительно меняют мир вокруг нас
Статья на портале Neurohive.
Эвристическая сеть для программы chatbot
Статья на портале Сyberleninka.
E-archive DonNTU (Electronic Archive Donetsk National Technical University)
Электронный архив Донецкого национального технического университета.
Cyber-Leninka
Научная электронная библиотека, построенная на парадигме открытой науки, основными задачами которой является популяризация науки и научной деятельности.
Neurohive
Разрабатка приложений и статьи о последних исследованиях в области нейронных сетей
Нabr.com
Русскоязычный веб-сайт в формате коллективного блога с элементами новостного сайта, созданный для публикации новостей, аналитических статей, мыслей, связанных с информационными технологиями, бизнесом и интернетом.
Нtmlbook.ru
Сайт посвящен HTML, CSS и верстке веб страниц..
Нtml5book.ru
Сайт для тех, кто изучает современные веб-технологии и создает сайты.
Современный учебник Javascript
Учебник по JavaScript, начиная с основ, включающий в себя много тонкостей и фишек JavaScript/DOM.
Самоучитель Python
Cайт призван помочь начинающим научиться программировать на Python 3. Также здесь можно подробнее узнать об особенностях функционирования этого языка.
Использование сверточных нейронных сетей для задачи классификации текстов
Авторы: Рысьмятова А.А.
Описание: Сверточные нейронные сети — мощный инструмент машинного обучения, который нацелен на эффективное распознавание и классификацию изображений. Успех применения сверточных нейронных сетей для изображений породил множество попыток использования этого инструмента в других задачах.
В данной работе исследованы основные методы использования сверточных нейронных сетей для задачи классификации текстов. Выполнены эксперименты на текстовых данных большого объема, показавшие, что сверточные нейронные сети для задачи классификации текстов позволяют достичь качества, аналогичного или лучшего в сравнении с традиционными методами.
Neural Networks and Deep Learning
Авторы: Michael Nielsen
Описание: Neural networks and deep learning currently provide the best solutions to many problems in image recognition, speech recognition, and natural language processing. This book will teach you many of the core concepts behind neural networks and deep learning.
Нейронные сети. Полный курс
Авторы: Орельен Жерон
Описание: В книге рассматриваются основные парадигмы искусственных нейронных сетей. Представленный материал содержит строгое математическое обоснование всех нейросетевых парадигм, иллюстрируется примерами, описанием компьютерных экспериментов, содержит множество практических задач, а также обширную библиографию. В книге также анализируется роль нейронных сетей при решении задач распознавания образов, управления и обработки сигналов. Структура книги очень удобна для разработки курсов обучения нейронным сетям и интеллектуальным вычислениям.
Книга будет полезна для инженеров, специалистов в области компьютерных наук, физиков и специалистов в других областях, а также для всех тех, кто интересуется искусственными нейронными сетями.
Прикладное машинное обучение с помощью Scikit-Learn и TensorFlow
Авторы: Орельен Жерон
Описание: Благодаря серии недавних достижений глубокое обучение значительно усилило всю область машинного обучения. В наше время даже программисты, почти ничего не знающие об этой технологии, могут использовать простые и эффективные инструменты для реализации программ, которые способны обучаться на основе данных. В настоящем практическом руководстве показано, что и как следует делать.
Python и машинное обучение
Авторы: Себастьян Рашка
Описание: Крайне необходимое издание по новейшей предсказательной аналитике для более глубокого понимания методологии машинного обучения Использование разных машинно-обучаемых моделей для формулирования различных вопросов в отношении данных Конструирование нейронных сетей при помощи библиотек Написание красивого и лаконичного кода с оптимальным использованием созданных вами алгоритмов Встраивание машинно-обучаемой модели в веб-приложение для повышения ее общедоступности Обнаружение скрытых повторяющихся образов и структур в данных посредством кластерного анализа Организация данных с помощью эффективных методов предобработки и использование передовых практических подходов к оценке машинно-обучаемых моделей Анализ мнений для подробной интерпретации текстовых данных и информации из социальных сетей.
Natural Language Processing with Python: Analyzing Text with the Natural Language Toolkit
Авторы: Steven Bird, Ewan Klein, Edward Loper
Описание: This book offers a highly accessible introduction to natural language processing, the field that supports a variety of language technologies, from predictive text and email filtering to automatic summarization and translation. With it, you'll learn how to write Python programs that work with large collections of unstructured text. You'll access richly annotated datasets using a comprehensive range of linguistic data structures, and you'll understand the main algorithms for analyzing the content and structure of written communication.