Может интеллектуальный анализ данных предсказать будущее вашего предприятия?
Интеллектуальный анализ данных является одним из 10 новых технологий, которые изменят мир, согласно Technology Review Массачусетского технологического института. В данной статье приводится общий обзор этой мощной технологии.
Консолидация корпоративных данных в витринах и на складах позволяет запрашивать их, чтобы получить дорогостоящие идеи и информацию. Online Analytical Processing (OLAP) инструменты довольно мощный для обычных анализа и отчетности, но не может легко выявлять необычные или сложные отношения причина / следствие. Тем не менее, анализ данных технология представляет другой класс бизнес-аналитики инструмент, предназначенный для"Шахта"Ваши данные и извлечь этот вид сложной информации.
С интеллектуального анализа данных инструментов становятся все более доступными, они начинают найти свой путь в основное русло, как настольных приложений. Хотя интеллектуального анализа данных является мощным (один из 10 новых технологий MIT Technology Review о том, что будет"изменить мир"), вам нужно развивать базовое понимание инструментов до пожинает плоды интеллектуального анализа данных технологий. В данной статье рассматриваются несколько основных определений, а также некоторые ключевые вопросы Вы хотите, чтобы учитывать при оценке ваши варианты и стратегии интеллектуального анализа данных.
Обещание интеллектуального анализа данных является убедительным. Образно, это как иметь хрустальный шар в вашем распоряжении, чтобы предоставить вам богатых и значимых деловых идей. Например, вы можете использовать интеллектуальный анализ данных, чтобы делать такие вещи, как:
Разработка"Яблочко"списки контактов и адресные сообщения, которые значительно улучшить результаты продаж и маркетинговых инициатив.
Определите, что конкретный страховой случай, вероятно, сфальсифицированы.
Опишите ваши клиенты и их покупательские привычки, а затем акции товаров соответственно.
Предсказать, что клиенты, которые покупают продукт «А», скорее всего, приобрести продукт"B"в то же время.
Интеллектуальный анализ данных определяется
Горнодобывающая термин данных часто ошибочно используется для описания рутинной нарезки и перетасовки данных. Я часто слышу фразы типа: «Мы деления и группировки наших данных к информации"мое"."Но интеллектуального анализа данных на самом деле относится к иной концепции в целом. Это включает в себя применение интеллектуальных и сложных программных алгоритмов против вашего хранилища данных (или другого источника данных), чтобы распознавать образы не являются очевидными в рамках более простых методов анализа. Ценные прогностические или описательные модели разработаны таким образом. С интеллектуального анализа данных, допрос данных производится автоматически с помощью программного обеспечения, содержащего алгоритм интеллектуального анализа данных, в то время как с традиционной OLAP, это делается практический пользователем.
Модели интеллектуального анализа данных
В основе процесса интеллектуального анализа данных является модель, которая является чем-то вроде черного ящика: Ваши данные идет в одном конце, и полезные предсказания или описания выйти с другой. Модель содержит сложные правила, которые производят точные прогнозы и описания, правила, которые должны быть скорректированы и доработаны с использованием ваших данных, чтобы увеличить их точность. Таким образом, модели, как говорят, быть обучены.
После обучения,точность моделей проверяется с использованием ваших данных. Потому что это лучше не использовать тот же набор данных для обучения и проверки, набор данных, как правило, делится на две части. Тестирование обычно включает используя модель против тестовых данных для генерации предсказания (или описания), а затем сравнивая их с известными результатами. Как только модель обучение и проверку, он может быть использован для прогнозирования с использованием набора свежих исходных данных.
Типы моделей
Есть две классификации моделей интеллектуального анализа данных: прогностические и описательные. Прогнозные модели предсказывают значение определенного атрибута (зависимой переменной) на основе значений других атрибутов (независимых переменных). В следующих примерах, зависимые переменные выделены курсивом:
Что вероятность определенного междугородной переключения клиента к конкуренту?
Что вероятность конкретного страхового возмещения в бытия мошеннических?
Как восприимчивы является пациент к приобретению того или иного заболевания?
Что вероятность, что конкретный студент будет успешным в колледже?
Насколько вероятно, определенная клиентов сделать заказ?
Что выручкановый клиент будет генерировать в течение следующего года?
Описательные модели обратная прогнозных моделей - вы знаете результат и вы ищете вклад атрибуты. Эти модели используются для описания характеристик, например, те из ваших клиентов междугородной (возраст, пол, доход, образование, количество детей и т.д.), которые сделал переключиться на конкурента.
Конечно, ничто никогда не так просто, и есть различные виды прогнозирования и описательные модели, как вы видите здесь:
Модели Классификация прогнозировать исход, задающий набор входных характеристик. Прогнозируемые результаты затем сортируются по классам (например, мошеннических или нет мошеннических).
Модели регрессии предсказать действительное число исход (например, расходы клиента в течение следующего года, учитывая множество входных характеристик).
Ассоциация модели предсказать возникновение второго события, учитывая возникновение другой. Например, пиво покупатели покупают арахис 75 процентов времени.
Модели секвенирования предсказать последовательность событий. Те, кто сдает в аренду Star Wars затем арендовать Империя наносит ответный удар, то Возвращение джедая, именно в таком порядке.
Модели кластеризации описать естественную группу вещей, такие как предназначения каникул по возрастным группам и доходов. Кластеризации широко используется для определения сегментов рынка.
Вы по-прежнему нужен эксперт
Есть ли понятие имея доступную хрустальный шар в вашем распоряжении звучит слишком хорошо, чтобы быть правдой? Вероятно, таким образом, и вот в чем загвоздка. Хотя большинство экспертов сходятся во мнении, что интеллектуальный анализ данных может предложить значительные преимущества по сравнению с традиционными (ручной) статистических подходов, многие считают, что оптимальное использование интеллектуального анализа данных инструментов по-прежнему нуждается в услугах добросовестных профессионалов.
В основе этих обсуждений является возможность достижения недопустимые выводы через неправомерного использования инструментов, а затем, действующая на этих выводах в ущерб предприятию. Производство точных и действенные прогнозы от исходных данных является серьезным бизнесом. Выбор соответствующего алгоритма для работы не новичок деятельность и ни один не является подготовка данных, чтобы убедиться, что это стоит добыча в первую очередь.
Вывод
В то время как добыча данных развивающаяся технология, обещание его идеи часто слишком убедительными, чтобы их игнорировать. Тем не менее, существует реальная возможность неудачи - определяется как не получения ответа, получения неправильный ответ, или неправильного толкования ответ. Мой совет, чтобы действовать с осторожностью. Начните с принятия решения именно то, что вы пытаетесь доказать или понять. Если у вас нет четкой цели в виду, вы будете молотить в море отвлекающих корреляций. Знайте, что это требует навыка приобрести чистую, качественную, и nonbiased данные для ввода, чтобы выбрать соответствующие алгоритмы интеллектуального анализа данных, для проверки обоснованности любых результатов с помощью правильного статистических испытаний. Возможно, все преимущества интеллектуального анализа данных, так же как ее сложность и затраты, лежат в выполнении этих действий хорошо и это требует более поверхностное понимание.