Библиотека материалов по теме выпускной работы
-
Анализ алгоритмов лексической и морфологической обработки текстов c целью определения жанровой принадлежности
Авторы: Н.О. Сторожук, И.А. Коломойцева
Описание: В работе представлен обзор существующих алгоритмов лексического анализа и стемминга, используемых в поисковых системах и анализаторах текстов. Сделаны выводы о возможности использования комбинации определенных методов в системе, определяющей жанр исследуемого текста.
Источник: Материалы V Международной научно-технической конференции «Современные информационные технологии в образовании и научных исследованиях» (СИТОНИ-2017). – Донецк: ДонНТУ, 2017. – С. 191-195.
-
Анализ методов определения текстовой близости документов
Авторы: Н.О. Сторожук, И.А. Коломойцева
Описание: В работе представлен обзор основных алгоритмов вычисления меры сходства документов, используемых в поисковых системах и анализаторах текстов. Приведен пример расчетов близости тестовых документов, на основе полученных данных сделаны выводы о возможности использования одного из методов в системе, определяющей жанр исследуемого текста.
Источник: Материалы студенческой секции IX Международной научно-технической конференции «Информатика, управляющие системы, математическое и компьютерное моделирование» (ИУСМКМ-2018). – Донецк: ДонНТУ, 2018. – С. 43-47.
-
Реализация прототипа анализатора жанровой принадлежности произведений на основании векторно – пространственной модели представления документов
Авторы: Н.О. Сторожук, И.А. Коломойцева
Описание: В работе представлено описание прототипа программной системы, реализующей анализ жанровой принадлежности документа с использованием векторно–пространственной модели. Приведен алгоритм работы программы, выполнен анализ результатов, на основании которого сделаны выводы о недостатках построенной модели, определены последующие направления работы.
Источник: Материалы международной научно-практическаой конференции «Программная инженерия: методы и технологии разработки информационновычислительных систем» (ПИИВС-2018) – Донецк: ДонНТУ, 2018. – С. 132-137.
-
Вероятностная модель токенизации в проекте «Открытый корпус»
Авторы: Бочаров В.В., Грановский Д.В., Суриков А.В.
Описание:В данной статье описаны проблемы и основные принципы токенизации в проекте "Открытый корпус", использование машинного обучения и анализ результатов работы модели токенизации проекта "Открытый корпус".
Источник:Новые информационные технологии в автоматизированных системах. – 2012. – № 1. – С. 179-182, https://cyberleninka.ru/article/...
-
Использование интеллектуальных алгоритмов для обработки текстовой информации
Авторы: Е. А. Энгель
Описание:В статье описано создание программного модуля, включающего в себя интеллектуальные алгоритмы автоматического определения жанра текста.
Источник:Сибирский журнал науки и технологий. – 2010. – № 2. – С. 62-68. , https://cyberleninka.ru/article/...
-
Определение стилевых и жанровых характеристик коллекций текстов на основе частеречной сочетаемости
Авторы: А.Ю. Антонова , Э.С. Клышинский, Е.В. Ягунова
Описание:В статье рассмотрен метод классификации текстов по стилям, используя статистическую информацию об использовании частей речи и их комбинаций. Проанализированы результаты исследования, выдвинуты направления дальнейшей работы.
Источник:Сибирский журнал науки и технологий. – 2010. – № 2. – С. 62-68. , http://webground.su/data/...
-
Определение жанра и автора литературного произведения статистическими методами
Авторы: Ю.Н. Орлов, К.П. Осминин
Описание:В настоящей статье излагается метод классификации текстов на основе анализа статистических закономерностей буквенных распределений, т. е. вероятностей встречаемости букв и буквосочетаний. Подробно рассматривается задача кластеризации литературных произведений по определенным жанрам, а также вопрос определения авторства произведения. При этом решение должно быть найдено без вторжения в область литературы, т. е. без анализа синтаксиса, литературных приемов и схем взаимодействий персонажей.
Источник: Прикладная информатика. – 2010. – № 2(26). – С. 95-108. , https://cyberleninka.ru/article/...
-
Эксперимент и вычисления в анализе ключевых слов художественного текста
Авторы: Е.В. Ягунова
Описание: В статье излагаются пути выделения и классификации ключевых слов художественного текста. Методика предполагает объединение традиционного эксперимента с информантами и анализа формальных признаков, значения которых выявляются в ходе вычислительного эксперимента.
Источник: Философия языка. Лингвистика. Лингводидактика. – 2010. – № 1. – С. 83-89. , http://webground.su/data/lit/yagunova/...
-
Формальные методы определения авторства текстов
Авторы: Т.В. Батура
Описание: Представлен обзор формальных методов установления авторства (атрибуции) текстов. В статье приведено описание наиболее известных программных систем для определения авторского стиля, ориентированных на рус- ский язык, предпринята попытка произвести их сравнительный анализ, выявить особенности и недостатки рас- смотренных подходов.
Источник: Вестник Новосибирского государственного университета. Серия: Информационные технологии. – 2012. – № 4 том 10. – С. 81-94. , https://cyberleninka.ru/article/...
-
Солтон Г. и Бакли К. Методики, основанные на взвешивании термов в автоматическом поиске текста
Авторы: Г. Солтон, К. Бакли
Описание: Экспериментальные данные, накопленные за последние 20 лет, показывают, что системы индексирования текста, основанные на назначении правильно взвешенных отдельных терминов, дают результаты поиска, которые превосходят результаты, полученные с помощью других более сложных текстовых представлений. Эти результаты в решающей степени зависят от выбора эффективных весовых систем. В этой статье обобщаются данные, полученные при автоматическом взвешивании терминов, и представлены базовые модели с одним индексом, с помощью которых можно сравнивать другие более сложные процедуры анализа контента.
Источник (англ.): Information Processing & Management Vol. 24, No. 5, pp. 513-523, 1988 http://pmcnamee.net/744/papers...