БИБЛИОТЕКА МАТЕРИАЛОВ ПО ТЕМЕ ВЫПУСКНОЙ РАБОТЫ
-
Система извлечения информации об однотипных объектах из массивов текстовых документов
Авторы: А.А. Егошина, В.О. Линкин, О.В. Арбузова
Описание: Рассмотрен подход к решению задачи Text Mining по извлечению информации об объектах из текстовых документов и переносу в базу данных для последующего извлечения знаний на основе стандартных методов Data Mining. Сформулированы требования к системе извлечения и структурирования данных. Предложена структурная организация системы и выбраны алгоритмы извлечения.
Источник: Інформаційні управляючі системи та комп’ютерний моніторинг (ІУС-2013) / Матерiали IV мiжнародної науково-технiчної конференцiї студентiв, аспiрантiв та молодих вчених. – Донецьк, ДонНТУ – 2013, Том 1, с. 394-399.
-
Быстрый генетический алгоритм решения задачи кластеризации текстовых документов
Авторы: Р.М. Алгулиев, Р.М. Алыгулиев
Описание: В данной работе для кластеризации текстовых документов предлагается подход, суть которого заключается в одновременной минимизации диаметров кластеров и максимизации расстояний между кластерами. Предложенный подход сводится к задаче целочисленного программирования, которая решается с помощью генетического алгоритма. С целью повышения эффективности вводится штрафная функция, позволяющая ускорить процесс сходимости генетического алгоритма. В работе предложен критерий, определяющий оптимальное количество кластеров.
Источник: Алгулиев Р.М., Алыгулиев Р.М. Быстрый генетический алгоритм решения задачи кластеризации текстовых документов // Искусственный интеллект. – 2005. – № 3. – C. 698-707. http://iai.dn.ua/public ...
-
Извлечение значимой информации из web-страниц с использованием предложений
Автор: Р.Ф. Кузнецов
Описание: В данной работе описывается разработка метода, позволяющего отделять значимую часть web-страницы от навигационной, в качестве эвристики используются законченные предложения.
Источник: Кузнецов Р.Ф. Извлечение значимой информации из web-страниц с использованием предложений. // Сборник тезисов постерных докладов восьмой всероссийской конференции RCDL’2006. – Санкт-Петербург: НУ ЦСИ, 2006. – 274 с. http://rcdl.ru/doc/2006 ...
-
Обзор существующих алгоритмов Data Mining для глубинного анализа текстов и методов извлечения знаний
Авторы: Д.В. Бабин, Е.В. Малащук, М.Г. Кочеткова, С.М. Вороной
Описание: В данной статье рассматриваются современные подходы к получению новых знаний на основе анализа информационного пространства корпоративных сетей и сети Internet. Ставится задача исследования методологий в сфере применения Text Mining, выделяется специфика современных требований к эффективной интеллектуальной переработке данных. Анализируются проблемы, которые неудовлетворительно решаются существующими методами предварительной обработки и доступа к большим объемам информации, рассматриваются особенности различных информационно-поисковых систем и средств извлечения знаний. Большое внимание уделено новому направлению обработки текстовой информации –
глубинному анализу текстов
(Text Mining), объединяющему в себе технологические и методологические подходы контент-анализа, компьютерной лингвистики и искусственного интеллекта.Источник: Бабин Д.В., Вороной С.М., Кочеткова М.Г., Малащук Е.В. Обзор существующих алгоритмов Data Mining для глубинного анализа текстов и методов извлечения знаний // Искусственный интеллект. – 2005. – № 4. – C. 618-626. http://iai.dn.ua/public ...
-
Об одном методе периодического тематического поиска информации в Web
Автор: А.В. Максаков
Описание: В статье описывается метод периодического тематического поиска, основанный на композиции метода поиска по ключевым словам и тематической фильтрации с использованием классификаторов текстов. Рассматриваются различные алгоритмы классификации с точки зрения эффективности их применения при решении рассматриваемой задачи.
Источник: Максаков А.В. Об одном методе периодического тематического поиска информации в Web// Труды восьмой всероссийской научной конференции «Электронные библиотеки: перспективные методы и технологии, электронные коллекции». М.: МАКС Пресс, 2006, стр. 101-107 http://elib.lvk.cs.msu.su/papers ...
-
Повышение эффективности извлечения знаний на основе интеллектуального анализа и структурирования информации
Авторы: Д.В. Бабин, Е.В. Малащук, С.М. Вороной
Описание: В данной работе исследуется проблема взаимодействия
человек – информация
. Рассматриваются основные подходы обеспечения этой взаимосвязи: интеллектуальный анализ текстов и предварительное структурирование информации. Проводится анализ этих подходов, и описываются тенденции развития информационного пространства и средств его анализа. Предлагается структура системы извлечения знаний из информационных ресурсов с неструктурированной и структурированной информацией.Источник: Бабин Д.В., Вороной С.М., Малащук Е.В. Повышение эффективности извлечения знаний на основе интеллектуального анализа и структурирования информации // Искусственный интеллект. – 2005. – № 3. – C. 259-264. http://iai.dn.ua/public ...
-
Фильтрация HTTP–трафика на основе анализа структуры Web-страницы
Автор: А.П. Зайцев
Описание: В статье рассмотрен один из самых сложных этапов фильтрации – классификация web-страниц.
Источник: Зайцев А.П. Фильтрация HTTP-трафика на основе анализа структуры Web-страницы // Вестник АГТУ. Серия: Управление, вычислительная техника и информатика. 2009. № 1. http://cyberleninka.ru/article ...
-
Огляд існуючих алгоритмів та моделей пошуку у Web
Автор: О.Я. Тарас
Описание: Представлен обзор алгоритмов и моделей поиска, применяемых в поисковых системах.
Источник: Тарас О.Я. Огляд існуючих алгоритмів та моделей пошуку у Web / О.Я. Тарас // Інформаційні системи та мережі : [збірник наукових праць] / відповідальний редактор В.В. Пасічник. – Львів : Видавницво Національного університету „Львівська політехніка”, 2006. – 336 с. : іл. – (Вісник / Національного університету „Львівська політехніка” ; № 489). – С. 286-296. http://ena.lp.edu.ua:8080 ...
-
Технології пошуку та видобування даних у WWW (аналіз проблеми)
Автор: Ю.О. Серов
Описание: Рассмотрена актуальная проблема поиска информации в Интернет и исследований технологии Web Mining. Анализируются способы поиска информации и проблемы, которые возникают. Описываются технологии Web Mining, разделение Web Mining на категории. Исследуются перспективные направления технологии Web Mining, в частности технологии структурированных языков запросов в Интернет.
Источник: Сєров Ю.О. Технології пошуку та видобування даних у WWW (аналіз проблеми) / Ю.О. Сєров // Інформаційні системи та мережі : [збірник наукових праць] / відповідальний редактор В.В. Пасічник. – Львів : Видавницво Національного університету „Львівська політехніка”, 2003. – 336 с. : іл. – (Вісник / Національного університету „Львівська політехніка” ; № 489). – С. 276-286. http://ena.lp.edu.ua:8080 ...
-
Web Mining: сегодня и завтра
Авторы: K. Sharma, G. Shrivastava, V. Kumar
Перевод: О.В. Арбузова
Описание: В данной работе представлены исследования о том, как извлечь полезную информацию из Интернета, а также общие понятия об интеллектуальном анализе данных (Web Mining). Статья описывает настоящее, прошлое и будущее Web Mining.
Источник (англ.): IEEE Xplore. Digital library. [Электронный ресурс]. – Режим доступа:http://ieeexplore...