Библиотека материалов по теме выпускной работы

    Собственные публикации и доклады

  1. Анализ алгоритмов лексической и морфологической обработки текстов c целью определения жанровой принадлежности

    Авторы: Н.О. Сторожук, И.А. Коломойцева

    Описание: В работе представлен обзор существующих алгоритмов лексического анализа и стемминга, используемых в поисковых системах и анализаторах текстов. Сделаны выводы о возможности использования комбинации определенных методов в системе, определяющей жанр исследуемого текста.

    Источник: Материалы V Международной научно-технической конференции «Современные информационные технологии в образовании и научных исследованиях» (СИТОНИ-2017). – Донецк: ДонНТУ, 2017. – С. 191-195.

  2. Анализ методов определения текстовой близости документов

    Авторы: Н.О. Сторожук, И.А. Коломойцева

    Описание: В работе представлен обзор основных алгоритмов вычисления меры сходства документов, используемых в поисковых системах и анализаторах текстов. Приведен пример расчетов близости тестовых документов, на основе полученных данных сделаны выводы о возможности использования одного из методов в системе, определяющей жанр исследуемого текста.

    Источник: Материалы студенческой секции IX Международной научно-технической конференции «Информатика, управляющие системы, математическое и компьютерное моделирование» (ИУСМКМ-2018). – Донецк: ДонНТУ, 2018. – С. 43-47.

  3. Реализация прототипа анализатора жанровой принадлежности произведений на основании векторно – пространственной модели представления документов

    Авторы: Н.О. Сторожук, И.А. Коломойцева

    Описание: В работе представлено описание прототипа программной системы, реализующей анализ жанровой принадлежности документа с использованием векторно–пространственной модели. Приведен алгоритм работы программы, выполнен анализ результатов, на основании которого сделаны выводы о недостатках построенной модели, определены последующие направления работы.

    Источник: Материалы международной научно-практическаой конференции «Программная инженерия: методы и технологии разработки информационновычислительных систем» (ПИИВС-2018) – Донецк: ДонНТУ, 2018. – С. 132-137.

  4. Тематические статьи

  5. Вероятностная модель токенизации в проекте «Открытый корпус»

    Авторы: Бочаров В.В., Грановский Д.В., Суриков А.В.

    Описание:В данной статье описаны проблемы и основные принципы токенизации в проекте "Открытый корпус", использование машинного обучения и анализ результатов работы модели токенизации проекта "Открытый корпус".

    Источник:Новые информационные технологии в автоматизированных системах. – 2012. – № 1. – С. 179-182, https://cyberleninka.ru/article/...

  6. Использование интеллектуальных алгоритмов для обработки текстовой информации

    Авторы: Е. А. Энгель

    Описание:В статье описано создание программного модуля, включающего в себя интеллектуальные алгоритмы автоматического определения жанра текста.

    Источник:Сибирский журнал науки и технологий. – 2010. – № 2. – С. 62-68. , https://cyberleninka.ru/article/...

  7. Определение стилевых и жанровых характеристик коллекций текстов на основе частеречной сочетаемости

    Авторы: А.Ю. Антонова , Э.С. Клышинский, Е.В. Ягунова

    Описание:В статье рассмотрен метод классификации текстов по стилям, используя статистическую информацию об использовании частей речи и их комбинаций. Проанализированы результаты исследования, выдвинуты направления дальнейшей работы.

    Источник:Сибирский журнал науки и технологий. – 2010. – № 2. – С. 62-68. , http://webground.su/data/...

  8. Определение жанра и автора литературного произведения статистическими методами

    Авторы: Ю.Н. Орлов, К.П. Осминин

    Описание:В настоящей статье излагается метод классификации текстов на основе анализа статистических закономерностей буквенных распределений, т. е. вероятностей встречаемости букв и буквосочетаний. Подробно рассматривается задача кластеризации литературных произведений по определенным жанрам, а также вопрос определения авторства произведения. При этом решение должно быть найдено без вторжения в область литературы, т. е. без анализа синтаксиса, литературных приемов и схем взаимодействий персонажей.

    Источник: Прикладная информатика. – 2010. – № 2(26). – С. 95-108. , https://cyberleninka.ru/article/...

  9. Эксперимент и вычисления в анализе ключевых слов художественного текста

    Авторы: Е.В. Ягунова

    Описание: В статье излагаются пути выделения и классификации ключевых слов художественного текста. Методика предполагает объединение традиционного эксперимента с информантами и анализа формальных признаков, значения которых выявляются в ходе вычислительного эксперимента.

    Источник: Философия языка. Лингвистика. Лингводидактика. – 2010. – № 1. – С. 83-89. , http://webground.su/data/lit/yagunova/...

  10. Формальные методы определения авторства текстов

    Авторы: Т.В. Батура

    Описание: Представлен обзор формальных методов установления авторства (атрибуции) текстов. В статье приведено описание наиболее известных программных систем для определения авторского стиля, ориентированных на рус- ский язык, предпринята попытка произвести их сравнительный анализ, выявить особенности и недостатки рас- смотренных подходов.

    Источник: Вестник Новосибирского государственного университета. Серия: Информационные технологии. – 2012. – № 4 том 10. – С. 81-94. , https://cyberleninka.ru/article/...

  11. Переводы статей

  12. Солтон Г. и Бакли К. Методики, основанные на взвешивании термов в автоматическом поиске текста

    Авторы: Г. Солтон, К. Бакли

    Описание: Экспериментальные данные, накопленные за последние 20 лет, показывают, что системы индексирования текста, основанные на назначении правильно взвешенных отдельных терминов, дают результаты поиска, которые превосходят результаты, полученные с помощью других более сложных текстовых представлений. Эти результаты в решающей степени зависят от выбора эффективных весовых систем. В этой статье обобщаются данные, полученные при автоматическом взвешивании терминов, и представлены базовые модели с одним индексом, с помощью которых можно сравнивать другие более сложные процедуры анализа контента.

    Источник (англ.): Information Processing & Management Vol. 24, No. 5, pp. 513-523, 1988 http://pmcnamee.net/744/papers...