ДонНТУ   Портал магистров


Ссылки по теме выпускной работы

    Материалы магистров ДонНТУ

  1. Магистерская работа Е.В. Поминчук

    Тема:  Исследование метода интеллектуального анализа данных, прецедентов для прогнозирования метеорологических параметров

    Руководитель: к.т.н., Г.В. Аверин

  2. Магистерская работа Т.Б. Срока

    Тема:  Разработка интеллектуальной системы анализа финансовой деятельности предприятия

    Руководитель: к.т.н., доц. В.А. Светличная

  3. Магистерская работа Е.А.Кравченко

    Тема:  Разработка ПО для анализа и оптимизации деятельности подписного агентства

    Руководитель:к.т.н., доц. О.Д. Ситникова

  4. Магистерская работа И.А. Чернов

    Тема:  Автоматизированное извлечение знаний из баз данных

    Руководитель: к.т.н., доц. О.И. Федяев

  5. Магистерская работа В,А,  Кошелева

    Тема:  Анализ методов автоматического извлечения знаний из реляционных баз данных

    Руководитель: к.т.н., доц. О.И. Федяев

  6. Научные работы и статьи

  7. Применение методов Data Mining в системе обработки и анализа медикостатистической информации

    Авторы: Тевелев А. Д.

    Описание: В докладе кратко описываются методы Data Mining, которые применяются в системе обработки и анализа медикостатистической информации

  8. Современные методы анализа данных

    Авторы: Компания Фрегат

    Описание: В статье рассмотрены основы анализа данных, построения моделей, задачи Data Mining, структура аналитической системы данных.

  9. Предобработка и очистка данных перед загрузкой в хранилище.

    Авторы: Алексей Арустамов

    Описание: В статье рассматривается начальный этап обработки данных, т.к. в аналитических приложениях очень часто концентрируют усилия на механизмах анализа данных, не уделяя должного внимания задачам предобработки и очистки данных. Хотя именно плохое «качество» исходных данных является одной из самых серьёзных и распространённых проблем.

  10. Potter’sWheel: An Interactive Data Cleaning System

    Авторы: Vijayshankar  Raman, Joseph  M. Hellerstein

    Описание: Данная статья очень подробно рассматривает новую систему под названием "Гончарный круг". В статье отображаются все положительные стороны этого алгоритма

  11. Очистка данных: проблемы и актуальные подходы<

    Авторы: Эрхард  Рам (Erhard Ram), Хонг Хай  До (Hong Hai Do)

    Описание:Данная статья рассматривает проблемы данных в хранилищах данных

  12. Что дает очистка данных?

    Авторы: Игорь  Артамонов

    Описание: В данной статье рассматривается актуальность проблемы очистки персональных данных

  13. Введение в добычу данных (Data Mining)

    Авторы: Александра Симонова и Стас Богатырев

    Описание: В данной статье рассматривается понятие Data Mining, методы добычи данных из БД, а также проблемы и перспективы технологии Data Mining

  14. Хранилища Данных: вчера, сегодняб завтра

    Авторы: Максим Бодаев

    Описание: Обзорная статья о Хранилищах данных

  15. Интеграция данных (Data Integration)

    Авторы: Максим Бодаев

    Описание: Обзорная статья об Data Integration

  16. Хранилища данных и задачи прогнозирования

    Авторы: Компания Basegroup

    Описание: Обзор проблемы прогнозирования. Представлен алгоритм решения данной задачи анализа, раскрыты основные понятия и ключевые моменты процесса прогнозирования, а также вопросы, связанные с анализом и отбором данных.

  17. Кластеризация данных

    Авторы: Александр Котов, Николай Красильников

    Описание: В статье описывается класстеризация: описание, зачем она нужна и ее алгоритмы.

  18. Презентация

    Описание: Презентация о подготовке данных Data Mining

  19. Очистка данных

    Авторы: Джули Борт

    Описание:Рекомендации по очистке данных

  20. Очистка данных

    Описание: Понятие очистка данных

  21. Очистка данных

    Описание:MSDN по очистке данных

  22. Порядок разработки ETL-процессов

    Авторы: OLAP.ru

    Описание:В статье приведена подробная последовательность разработки ETL-процессов.

  23. Принципы интеграции данных в сфере недропользования

    Авторы: А.А. Кресов, В.В.Уваров

    Описание:Приведен анализ трех основных подходов к интеграции разнородных информационных ресурсов: консолидация, федерализация, распространение. Предложены принципы разработки системы интеграции данных в сфере недропользования.

  24. Архитектуры хранилищ данных

    Авторы: Сабир Асадуллаев

    Описание: Эта работа открывает цикл из трех статей, посвященных архитектурам хранилищ данных (ХД) и их предшественников. Обилие различных подходов, методов и рекомендаций приводят к некоторой путанице понятий, достоинств, недостатков и границ применимости тех или иных архитектурных решений. В первой статье рассмотрены эволюция понимания места OLAP, компоненты архитектуры ХД, виртуальные ХД и независимые витрины данных. Вторая публикация 1 посвящена таким архитектурам, как централизованное ХД с системой извлечения, преобразования и загрузки данных (ETL), хранилище данных с системой извлечения, загрузки и преобразования данных (ELT), ЦХД с оперативным складом данных (ОCД), расширенная модель с витринами данных (ВД). В третьей статье 2 рассмотрены хранилище с накоплением данных в ВД, централизованная ETL с параллельными ХД и ВД, ХД с интеграционной шиной, а также рекомендованная архитектура хранилища данных

  25. Проблема интеграции множественных источников данных

    Авторы: О.А. Бубарева, Ф.А. Попов

    Описание:В статье описывается в чем состоит проблема интеграции множественных источников данных.

  26. Обзор алгоритмов кластеризации данных

    Описание:Обзорная статья по кластеризации. В статье подробно описаны все методы по кластеризации данных

  27. Архитектуры хранилищ данных

    Описание:Обзорная статья по кластеризации. В статье подробно описаны все методы по кластеризации данных

  28. Технология анализа данных

    Авторы: Academic Resources

    Описание:Приведен анализ трех основных подходов к интеграции разнородных информационных ресурсов: консолидация, федерализация, распространение. Предложены принципы разработки системы интеграции данных в сфере недропользования.

  29. Хранилища данных и задачи прогнозирования

    Авторы: Компания Basegroup

    Описание:Раскрыт вопрос для чего нужно Data Mining и задачи решаемые им.

  30. Кластеризация данных

    Авторы: Александр Котов, Николай Красильников

    Описание: В статье описывается класстеризация: описание, зачем она нужна и ее алгоритмы.

  31. Adaptive Duplicate Detection Using Learnable String Similarity Measures

    Авторы: Александр Котов, Николай Красильников

    Описание: Данная статья рассматривает методы интегрирования баз данных

  32. String Edit Analysis for Merging Databases

    Авторы: J. Joanne Zhu and Lyle H. Ungar

    Описание: В статье кратко описываются: дублирование, методы обнаружения и устранения такого вида ошибки.

  33. Problems, Methods, and Challenges in Comprehensive Data Cleansing

    Авторы: Heiko Muller, Johann-Christoph Freytag

    Описание:В статье описываются проблемы, методы, инструменты и задачи очистки данных

  34. Duplicate Detection in Click Streams

    Авторы: Ahmed Metwally, Divyakant Agrawal, Amr El Abbadi

    Описание: Данная статья рассматривает проблему дублирования данных в базах данных, поиск дубликатов. Рассматривается решение этой проблемы на основе фильтров Блума, а также его еффективность.

  35. Schema Matching using Duplicates

    Авторы: Alexander Bilke, Felix Naumann

    Описание: В статье показано, как наличие дубликатов в наборах данных могут быть использованы для автоматической идентификации соответствующих атрибутов, описаны алгоритмы, позволяющие схеме определять соответствующие атрибуты, сравнивая значения данных в этих дублирующихся записях.

  36. Duplicate Record Detection: A Survey

    Авторы: Ahmed K. Elmagarmid, Panagiotis G. Ipeirotis, Vassilios S. Verykios

    Описание: Обзорная статья по обнаружению дублированных данных

  37. Ontology Based Data Validation and Cleaning: Restructuring operations for ontology maintenance

    Авторы: Stefan Bru?ggemann, Thomas Aden

    Описание:В статье рассматриваются интеллектуальные приложения для обнаружения такого вида ошибок, как дублирование

  38. Intelligent Application for Duplication Detection

    Авторы: Plamen Paskalev, Anatoliy Antonov

    Описание:В статье кратко рассматриваются обнаружение и устранение занрязненныз данных, а также методы очистки данных.

  39. Data Quality Mining--Making a Virtue of Necessity

    Авторы: Jochen Hipp, Ulrich Guntzer, Udo Grimmer

    Описание: Данная статья рассказывает об актуальности задачи повышения качества данных, а также способ решения проблемы - использование ассоциативных правил.

  40. Record Linkage: Current Practice and Future Directions

    Авторы: Jochen Hipp, Ulrich Guntzer, Udo Grimmer

    Описание: Данная статья представляет "стандартную" вероятностную модель связи полей и ассоциативного алгоритма.

  41. Техническая и справочная литература

  42. Бизнес-аналитика: от данных к знаниям

    В книге последовательно раскрываются основные технологии, используемые при создании и внедрении корпоративных информационно-аналитических систем, объединяемые термином «бизнес-аналитика»: хранилища данных и OLAP, трансформация данных, ETL и методы очистки, базовые алгоритмы Data Mining, анализ временных рядов, подходы к построению ансамблей моделей и их сравнению. Во второй части авторы на демонстрационных примерах показывают, как можно решать такие задачи как консолидация, аналитическая отчетность, скоринг, стимулирование продаж, прогнозирование спроса и другие средствами бизнес-аналитики на базе аналитической платформы Deductor компании BaseGroup Labs. .

  43. Data Mining : учебное пособие

    Курс знакомит слушателей с технологией Data Mining. Подробно рассматриваются методы, задачи, применение, а также инструментальные средства и способы внедрения Data Mining в информационную инфраструктуру компании.

  44. Методы и модели анализа данных: OLAP и Data Mining

    В книге представлены наиболее актуальные направления в области разработки корпоративных систем: организация хранилищ данных, оперативный (OLAP) и интеллектуальный анализ данных (Data Mining). Все три направления рассмотрены в достаточном для понимания и дальнейшего использования на практике объеме. Описание методов и алгоритмов анализа данных и иллюстрация их работы на примерах позволит использовать книгу не только как учебное пособие, но и как практическое руководство при разработке программного обеспечения.

  45. Data Mining. Учебный курс

    В книге приводится объективный аналитический обзор методов и программных продуктов Data Mining. Подробно рассматриваются статистические пакеты, нейросети, эволюционные методы и алгоритмы поиска логических закономерностей. Описываются наиболее популярные инструментальные средства Data Mining. Разбираются практические примеры.

  46. Специализированные сайты и порталы

  47. http://www.basegroup.ru/

    BaseGroup Labs – профессиональный поставщик программных продуктов и решений в области анализа данных. Они специализируемся на разработке систем для глубокого анализа данных, охватывающих вопросы сбора, консолидации, очистки данных, построения моделей и визуализации.

  48. http://www.intuit.ru/

    Институт дистанционного обучения, а также электронный ресурс.

  49. http://www.prj-exp.ru/

    Институт дистанционного обучения, а также электронный ресурс.

  50. http://www.ict.edu.ru/

    ИТ портал "Информационно-коммуникационные технологии в образовании"

  51. http://www.ibm.com/developerworks/ru/library/

    ИТ библиотека

  52. http://www.kent.edu/cas/cs/

    ИТ библиотека факультета компьютерных наук университета Kent State

  53. http://www.ats.ucla.edu/stat/sas/library/

    ИТ библиотека Калифорнийского университета