Ссылки по теме выпускной работы
-
Магистерская работа Е.В. Поминчук
Тема: Исследование метода интеллектуального анализа данных, прецедентов для прогнозирования метеорологических параметров
Руководитель: к.т.н., Г.В. Аверин
-
Магистерская работа Т.Б. Срока
Тема: Разработка интеллектуальной системы анализа финансовой деятельности предприятия
Руководитель: к.т.н., доц. В.А. Светличная
-
Магистерская работа Е.А.Кравченко
Тема: Разработка ПО для анализа и оптимизации деятельности подписного агентства
Руководитель:к.т.н., доц. О.Д. Ситникова
-
Магистерская работа И.А. Чернов
Тема: Автоматизированное извлечение знаний из баз данных
Руководитель: к.т.н., доц. О.И. Федяев
-
Магистерская работа В,А, Кошелева
Тема: Анализ методов автоматического извлечения знаний из реляционных баз данных
Руководитель: к.т.н., доц. О.И. Федяев
-
Применение методов Data Mining в системе обработки и анализа медикостатистической информации
Авторы: Тевелев А. Д.
Описание: В докладе кратко описываются методы Data Mining, которые применяются в системе обработки и анализа медикостатистической информации
-
Современные методы анализа данных
Авторы: Компания Фрегат
Описание: В статье рассмотрены основы анализа данных, построения моделей, задачи Data Mining, структура аналитической системы данных.
-
Предобработка и очистка данных перед загрузкой в хранилище.
Авторы: Алексей Арустамов
Описание: В статье рассматривается начальный этап обработки данных, т.к. в аналитических приложениях очень часто концентрируют усилия на механизмах анализа данных, не уделяя должного внимания задачам предобработки и очистки данных. Хотя именно плохое «качество» исходных данных является одной из самых серьёзных и распространённых проблем.
-
Potter’sWheel: An Interactive Data Cleaning System
Авторы: Vijayshankar Raman, Joseph M. Hellerstein
Описание: Данная статья очень подробно рассматривает новую систему под названием "Гончарный круг". В статье отображаются все положительные стороны этого алгоритма
-
Очистка данных: проблемы и актуальные подходы<
Авторы: Эрхард Рам (Erhard Ram), Хонг Хай До (Hong Hai Do)
Описание:Данная статья рассматривает проблемы данных в хранилищах данных
-
Что дает очистка данных?
Авторы: Игорь Артамонов
Описание: В данной статье рассматривается актуальность проблемы очистки персональных данных
-
Введение в добычу данных (Data Mining)
Авторы: Александра Симонова и Стас Богатырев
Описание: В данной статье рассматривается понятие Data Mining, методы добычи данных из БД, а также проблемы и перспективы технологии Data Mining
-
Хранилища Данных: вчера, сегодняб завтра
Авторы: Максим Бодаев
Описание: Обзорная статья о Хранилищах данных
-
Интеграция данных (Data Integration)
Авторы: Максим Бодаев
Описание: Обзорная статья об Data Integration
-
Хранилища данных и задачи прогнозирования
Авторы: Компания Basegroup
Описание: Обзор проблемы прогнозирования. Представлен алгоритм решения данной задачи анализа, раскрыты основные понятия и ключевые моменты процесса прогнозирования, а также вопросы, связанные с анализом и отбором данных.
-
Кластеризация данных
Авторы: Александр Котов, Николай Красильников
Описание: В статье описывается класстеризация: описание, зачем она нужна и ее алгоритмы.
-
Презентация
Описание: Презентация о подготовке данных Data Mining
-
Очистка данных
Авторы: Джули Борт
Описание:Рекомендации по очистке данных
-
Очистка данных
Описание: Понятие очистка данных
-
Очистка данных
Описание:MSDN по очистке данных
-
Порядок разработки ETL-процессов
Авторы: OLAP.ru
Описание:В статье приведена подробная последовательность разработки ETL-процессов.
-
Принципы интеграции данных в сфере недропользования
Авторы: А.А. Кресов, В.В.Уваров
Описание:Приведен анализ трех основных подходов к интеграции разнородных информационных ресурсов: консолидация, федерализация, распространение. Предложены принципы разработки системы интеграции данных в сфере недропользования.
-
Архитектуры хранилищ данных
Авторы: Сабир Асадуллаев
Описание: Эта работа открывает цикл из трех статей, посвященных архитектурам хранилищ данных (ХД) и их предшественников. Обилие различных подходов, методов и рекомендаций приводят к некоторой путанице понятий, достоинств, недостатков и границ применимости тех или иных архитектурных решений. В первой статье рассмотрены эволюция понимания места OLAP, компоненты архитектуры ХД, виртуальные ХД и независимые витрины данных. Вторая публикация 1 посвящена таким архитектурам, как централизованное ХД с системой извлечения, преобразования и загрузки данных (ETL), хранилище данных с системой извлечения, загрузки и преобразования данных (ELT), ЦХД с оперативным складом данных (ОCД), расширенная модель с витринами данных (ВД). В третьей статье 2 рассмотрены хранилище с накоплением данных в ВД, централизованная ETL с параллельными ХД и ВД, ХД с интеграционной шиной, а также рекомендованная архитектура хранилища данных
-
Проблема интеграции множественных источников данных
Авторы: О.А. Бубарева, Ф.А. Попов
Описание:В статье описывается в чем состоит проблема интеграции множественных источников данных.
-
Обзор алгоритмов кластеризации данных
Описание:Обзорная статья по кластеризации. В статье подробно описаны все методы по кластеризации данных
-
Архитектуры хранилищ данных
Описание:Обзорная статья по кластеризации. В статье подробно описаны все методы по кластеризации данных
-
Технология анализа данных
Авторы: Academic Resources
Описание:Приведен анализ трех основных подходов к интеграции разнородных информационных ресурсов: консолидация, федерализация, распространение. Предложены принципы разработки системы интеграции данных в сфере недропользования.
-
Хранилища данных и задачи прогнозирования
Авторы: Компания Basegroup
Описание:Раскрыт вопрос для чего нужно Data Mining и задачи решаемые им.
-
Кластеризация данных
Авторы: Александр Котов, Николай Красильников
Описание: В статье описывается класстеризация: описание, зачем она нужна и ее алгоритмы.
-
Adaptive Duplicate Detection Using Learnable String Similarity Measures
Авторы: Александр Котов, Николай Красильников
Описание: Данная статья рассматривает методы интегрирования баз данных
-
String Edit Analysis for Merging Databases
Авторы: J. Joanne Zhu and Lyle H. Ungar
Описание: В статье кратко описываются: дублирование, методы обнаружения и устранения такого вида ошибки.
-
Problems, Methods, and Challenges in Comprehensive Data Cleansing
Авторы: Heiko Muller, Johann-Christoph Freytag
Описание:В статье описываются проблемы, методы, инструменты и задачи очистки данных
-
Duplicate Detection in Click Streams
Авторы: Ahmed Metwally, Divyakant Agrawal, Amr El Abbadi
Описание: Данная статья рассматривает проблему дублирования данных в базах данных, поиск дубликатов. Рассматривается решение этой проблемы на основе фильтров Блума, а также его еффективность.
-
Schema Matching using Duplicates
Авторы: Alexander Bilke, Felix Naumann
Описание: В статье показано, как наличие дубликатов в наборах данных могут быть использованы для автоматической идентификации соответствующих атрибутов, описаны алгоритмы, позволяющие схеме определять соответствующие атрибуты, сравнивая значения данных в этих дублирующихся записях.
-
Duplicate Record Detection: A Survey
Авторы: Ahmed K. Elmagarmid, Panagiotis G. Ipeirotis, Vassilios S. Verykios
Описание: Обзорная статья по обнаружению дублированных данных
-
Ontology Based Data Validation and Cleaning: Restructuring operations for ontology maintenance
Авторы: Stefan Bru?ggemann, Thomas Aden
Описание:В статье рассматриваются интеллектуальные приложения для обнаружения такого вида ошибок, как дублирование
-
Intelligent Application for Duplication Detection
Авторы: Plamen Paskalev, Anatoliy Antonov
Описание:В статье кратко рассматриваются обнаружение и устранение занрязненныз данных, а также методы очистки данных.
-
Data Quality Mining--Making a Virtue of Necessity
Авторы: Jochen Hipp, Ulrich Guntzer, Udo Grimmer
Описание: Данная статья рассказывает об актуальности задачи повышения качества данных, а также способ решения проблемы - использование ассоциативных правил.
-
Record Linkage: Current Practice and Future Directions
Авторы: Jochen Hipp, Ulrich Guntzer, Udo Grimmer
Описание: Данная статья представляет "стандартную" вероятностную модель связи полей и ассоциативного алгоритма.
-
Бизнес-аналитика: от данных к знаниям
В книге последовательно раскрываются основные технологии, используемые при создании и внедрении корпоративных информационно-аналитических систем, объединяемые термином «бизнес-аналитика»: хранилища данных и OLAP, трансформация данных, ETL и методы очистки, базовые алгоритмы Data Mining, анализ временных рядов, подходы к построению ансамблей моделей и их сравнению. Во второй части авторы на демонстрационных примерах показывают, как можно решать такие задачи как консолидация, аналитическая отчетность, скоринг, стимулирование продаж, прогнозирование спроса и другие средствами бизнес-аналитики на базе аналитической платформы Deductor компании BaseGroup Labs. .
-
Data Mining : учебное пособие
Курс знакомит слушателей с технологией Data Mining. Подробно рассматриваются методы, задачи, применение, а также инструментальные средства и способы внедрения Data Mining в информационную инфраструктуру компании.
-
Методы и модели анализа данных: OLAP и Data Mining
В книге представлены наиболее актуальные направления в области разработки корпоративных систем: организация хранилищ данных, оперативный (OLAP) и интеллектуальный анализ данных (Data Mining). Все три направления рассмотрены в достаточном для понимания и дальнейшего использования на практике объеме. Описание методов и алгоритмов анализа данных и иллюстрация их работы на примерах позволит использовать книгу не только как учебное пособие, но и как практическое руководство при разработке программного обеспечения.
-
Data Mining. Учебный курс
В книге приводится объективный аналитический обзор методов и программных продуктов Data Mining. Подробно рассматриваются статистические пакеты, нейросети, эволюционные методы и алгоритмы поиска логических закономерностей. Описываются наиболее популярные инструментальные средства Data Mining. Разбираются практические примеры.
-
http://www.basegroup.ru/
BaseGroup Labs – профессиональный поставщик программных продуктов и решений в области анализа данных. Они специализируемся на разработке систем для глубокого анализа данных, охватывающих вопросы сбора, консолидации, очистки данных, построения моделей и визуализации.
-
http://www.intuit.ru/
Институт дистанционного обучения, а также электронный ресурс.
-
http://www.prj-exp.ru/
Институт дистанционного обучения, а также электронный ресурс.
-
http://www.ict.edu.ru/
ИТ портал "Информационно-коммуникационные технологии в образовании"
-
http://www.ibm.com/developerworks/ru/library/
ИТ библиотека
-
http://www.kent.edu/cas/cs/
ИТ библиотека факультета компьютерных наук университета Kent State
-
http://www.ats.ucla.edu/stat/sas/library/
ИТ библиотека Калифорнийского университета