ДонНТУ   Портал магистров

БИБЛИОТЕКА МАТЕРИАЛОВ ПО ТЕМЕ ВЫПУСКНОЙ РАБОТЫ

    Собственные публикации и доклады

  1. Система извлечения информации об однотипных объектах из массивов текстовых документов

    Авторы: А.А. Егошина, В.О. Линкин, О.В. Арбузова

    Описание: Рассмотрен подход к решению задачи Text Mining по извлечению информации об объектах из текстовых документов и переносу в базу данных для последующего извлечения знаний на основе стандартных методов Data Mining. Сформулированы требования к системе извлечения и структурирования данных. Предложена структурная организация системы и выбраны алгоритмы извлечения.

    Источник: Інформаційні управляючі системи та комп’ютерний моніторинг (ІУС-2013) / Матерiали IV мiжнародної науково-технiчної конференцiї студентiв, аспiрантiв та молодих вчених. – Донецьк, ДонНТУ – 2013, Том 1, с. 394-399.

  2. Тематические статьи

  3. Быстрый генетический алгоритм решения задачи кластеризации текстовых документов

    Авторы: Р.М. Алгулиев, Р.М. Алыгулиев

    Описание: В данной работе для кластеризации текстовых документов предлагается подход, суть которого заключается в одновременной минимизации диаметров кластеров и максимизации расстояний между кластерами. Предложенный подход сводится к задаче целочисленного программирования, которая решается с помощью генетического алгоритма. С целью повышения эффективности вводится штрафная функция, позволяющая ускорить процесс сходимости генетического алгоритма. В работе предложен критерий, определяющий оптимальное количество кластеров.

    Источник: Алгулиев Р.М., Алыгулиев Р.М. Быстрый генетический алгоритм решения задачи кластеризации текстовых документов // Искусственный интеллект. – 2005. – № 3. – C. 698-707. http://iai.dn.ua/public ...

  4. Извлечение значимой информации из web-страниц с использованием предложений

    Автор: Р.Ф. Кузнецов

    Описание: В данной работе описывается разработка метода, позволяющего отделять значимую часть web-страницы от навигационной, в качестве эвристики используются законченные предложения.

    Источник: Кузнецов Р.Ф. Извлечение значимой информации из web-страниц с использованием предложений. // Сборник тезисов постерных докладов восьмой всероссийской конференции RCDL’2006. – Санкт-Петербург: НУ ЦСИ, 2006. – 274 с. http://rcdl.ru/doc/2006 ...

  5. Обзор существующих алгоритмов Data Mining для глубинного анализа текстов и методов извлечения знаний

    Авторы: Д.В. Бабин, Е.В. Малащук, М.Г. Кочеткова, С.М. Вороной

    Описание: В данной статье рассматриваются современные подходы к получению новых знаний на основе анализа информационного пространства корпоративных сетей и сети Internet. Ставится задача исследования методологий в сфере применения Text Mining, выделяется специфика современных требований к эффективной интеллектуальной переработке данных. Анализируются проблемы, которые неудовлетворительно решаются существующими методами предварительной обработки и доступа к большим объемам информации, рассматриваются особенности различных информационно-поисковых систем и средств извлечения знаний. Большое внимание уделено новому направлению обработки текстовой информации – глубинному анализу текстов (Text Mining), объединяющему в себе технологические и методологические подходы контент-анализа, компьютерной лингвистики и искусственного интеллекта.

    Источник: Бабин Д.В., Вороной С.М., Кочеткова  М.Г., Малащук Е.В. Обзор существующих алгоритмов Data Mining для глубинного анализа текстов и методов извлечения знаний // Искусственный интеллект. – 2005. – № 4. – C. 618-626. http://iai.dn.ua/public ...

  6. Об одном методе периодического тематического поиска информации в Web

    Автор: А.В. Максаков

    Описание: В статье описывается метод периодического тематического поиска, основанный на композиции метода поиска по ключевым словам и тематической фильтрации с использованием классификаторов текстов. Рассматриваются различные алгоритмы классификации с точки зрения эффективности их применения при решении рассматриваемой задачи.

    Источник: Максаков А.В. Об одном методе периодического тематического поиска информации в Web// Труды восьмой всероссийской научной конференции «Электронные библиотеки: перспективные методы и технологии, электронные коллекции». М.: МАКС Пресс, 2006, стр. 101-107 http://elib.lvk.cs.msu.su/papers ...

  7. Повышение эффективности извлечения знаний на основе интеллектуального анализа и структурирования информации

    Авторы: Д.В. Бабин, Е.В. Малащук, С.М. Вороной

    Описание: В данной работе исследуется проблема взаимодействия человек – информация. Рассматриваются основные подходы обеспечения этой взаимосвязи: интеллектуальный анализ текстов и предварительное структурирование информации. Проводится анализ этих подходов, и описываются тенденции развития информационного пространства и средств его анализа. Предлагается структура системы извлечения знаний из информационных ресурсов с неструктурированной и структурированной информацией.

    Источник: Бабин Д.В., Вороной С.М., Малащук Е.В. Повышение эффективности извлечения знаний на основе интеллектуального анализа и структурирования информации // Искусственный интеллект. – 2005. – № 3. – C. 259-264. http://iai.dn.ua/public ...

  8. Фильтрация HTTP–трафика на основе анализа структуры Web-страницы

    Автор: А.П. Зайцев

    Описание: В статье рассмотрен один из самых сложных этапов фильтрации – классификация web-страниц.

    Источник: Зайцев А.П. Фильтрация HTTP-трафика на основе анализа структуры Web-страницы // Вестник АГТУ. Серия: Управление, вычислительная техника и информатика. 2009. № 1. http://cyberleninka.ru/article ...

  9. Огляд існуючих алгоритмів та моделей пошуку у Web

    Автор: О.Я. Тарас

    Описание: Представлен обзор алгоритмов и моделей поиска, применяемых в поисковых системах.

    Источник: Тарас О.Я. Огляд існуючих алгоритмів та моделей пошуку у Web / О.Я. Тарас // Інформаційні системи та мережі : [збірник наукових праць] / відповідальний редактор В.В. Пасічник. – Львів : Видавницво Національного університету „Львівська політехніка”, 2006. – 336 с. : іл. – (Вісник / Національного університету „Львівська політехніка” ; № 489). – С. 286-296. http://ena.lp.edu.ua:8080 ...

  10. Технології пошуку та видобування даних у WWW (аналіз проблеми)

    Автор: Ю.О. Серов

    Описание: Рассмотрена актуальная проблема поиска информации в Интернет и исследований технологии Web Mining. Анализируются способы поиска информации и проблемы, которые возникают. Описываются технологии Web Mining, разделение Web Mining на категории. Исследуются перспективные направления технологии Web Mining, в частности технологии структурированных языков запросов в Интернет.

    Источник: Сєров Ю.О. Технології пошуку та видобування даних у WWW (аналіз проблеми) / Ю.О. Сєров // Інформаційні системи та мережі : [збірник наукових праць] / відповідальний редактор В.В. Пасічник. – Львів : Видавницво Національного університету „Львівська політехніка”, 2003. – 336 с. : іл. – (Вісник / Національного університету „Львівська політехніка” ; № 489). – С. 276-286. http://ena.lp.edu.ua:8080 ...

  11. Переводы статей

  12. Web Mining: сегодня и завтра

    Авторы: K. Sharma, G. Shrivastava, V. Kumar

    Перевод: О.В. Арбузова

    Описание: В данной работе представлены исследования о том, как извлечь полезную информацию из Интернета, а также общие понятия об интеллектуальном анализе данных (Web Mining). Статья описывает настоящее, прошлое и будущее Web Mining.

    Источник (англ.): IEEE Xplore. Digital library. [Электронный ресурс]. – Режим доступа:http://ieeexplore...