Доказательство 80/20 Закон Парето и точные границы для ABC-анализа

Альфред Ультш

Перевод с английского: Безе В.И.


Источник:
http://www.informatik.uni-marburg.de/~databionics/papers/ultsch02proof.pdf


ВВЕДЕНИЕ

Во многих проектах 20 % полного усилия приводят к 80 % полного результата. Это явление обычно называют 80/20 законом Пэрето. В этой статье мы предлагаем теорию для объяснения этого эмпирического наблюдения. Измерены доходы, полученные подразделением проекта в нескольких задачах. Требования для таких доходов приводят к аксиомам информации Шаннона. При правильной регулировки приборов для стоимости и доходов это дает определение Энтропических Доходов. 80/20 закон Пэрето таким образом следует из экономической оптимизации Энтропических Доходов форме уменьшения неосуществленного потенциала. Как применение теории мы получили точные пределы для анализа ABC. Обрисованная в общих чертах теория добавляет к информационной Теории рассмотрение издержек производства для информации. Кроме того это проливает некоторый свет на связь между физическим термином Энтропии и информацией Шаннона. Теория может быть применена в анализе статистических данных, например. группа - и/или анализ фактора, так же как в маркетинге, логистике или других бизнес-приложениях.
1. 80/20-закон Парето
Итальянский экономист Вильфредо Парето (1848-1923) наблюдаемый в 19-ом столетии в Италии, что 20 % находящихся в собственности населения земли 80 % годной к употреблению (Парето 1935). Парето нашел то же самое распределение в других экономичных и естественных процессах. Как правило он сформулировал это открытие как: "в любом произвольном наборе элементов, попытка достигнуть подмножеством маленького в числа, будет иметь самый большой эффект" (Sombart 1967).
В настоящее время много проектов показывают то же самое 80/20 распределение выпуска против затрат. Это часто приписывается наблюдению Парето и названо 80/20-закон Парето или закон тривиального многие и критическое немногие. Экономические активы следуют за 80/20-законом Пэрето вполне часто, в особенности в маркетинговом и качественном управлении (Кимбер и др. 1997), (Дайч 2001). Здесь выбор многих вызывает, в котором 80/20-закон Парето сообщается:
• 20 % клиентов приносят 80% оборота
• 20% продукции составляют 80% от оборота
• 20% возможностей сделать ошибки в производстве несут ответственность за 80% бракованной продукции
• 80% из решений сделаны в 20 % времени на встрече
• 20 % продукции составляют 80% от прибыли
• 20 % сотрудников 80% времени отсутствуют
• 80 % из результатов могут быть достигнуты в 20% рабочего времени, если используется стратегического планирования времени
• лучшие 20% продавцов несут ответственность за 80% от прибыли фирмы
• 20 % товаров в запасе суммируют до 80 % ценности запаса
• 80% от запросов на заполненном артикуле только 20% товаров
• 80 % затрат или потерь бизнеса вызваны 20 % проблемами 80/20-закон Парето в особенности наблюдается во многих проектах программного обеспечения. Следующая таблица взята у Артура (Артур 1992):
20 % из этих 80 % из них
модули потребляют ресурсы
модули вносят ошибки
модули потребляют время выполнения
ошибки потребляют затраты ремонта
повышения потребляют адаптивные затраты на обслуживание
инструменты испытывают использование инструмента
80/20-закон Парето обычно оправдывается только наблюдением, то есть опытным путем (Артур 1992).
Мы не знаем ни о какой теории, которая объяснила бы 80/20-закон Парето. Начиная с 80/20 явлений, кажется, является настолько вездесущим, вопрос, могло ли бы быть "естественное право" позади этого наблюдения. 80/20-закон Пэрето также используется в так называемом анализе ABC, используемом для оптимизации фирм и проектов.
В следующем мы получаем 80/20-закон Парето из основных принципов. Мы анализируем урожай, произведенный подразделением проекта в подпроекты. Этот элементарный выпуск измерен с точки зрения информации или энтропии. 80/20-закон Парето следует из оптимизации стоимости и урожая такого подразделения. Используя нашу теорию на 80/20-законе Парето мы можем вычесть точные теоретические пределы для параметров анализа ABC.
2. ABC-анализ
Когда бизнес-процессы оптимизированы, так называемый анализ ABC часто применяется (Гоердин 2001). Этот анализ частично основан на 80/20-законе Парето и поэтому часто названный Парето-анализом (Джурэн (Эд). 1998). Анализ ABC означает классифицировать подпроекты в три класса A, B, и С. Подпроекты отсортированы в порядке убывания доходности. Класс A должен содержать проекты высокой выработки, проекты класса B средней выработки и проекты C низкой выработки следующим образом: Класс A: подпроекты с относительными низкими затратами, возвращают пропорциональную доходность, то есть относительно немногие подпроекты в этом классе должны возвратить очень высокие доходы с низкими расходами. Класс B: подпроекты по крайней мере, с средним соотношением доходов к стоимости. Доходы проектов в этом классе должны быть, по крайней мере, прямопропорциональны затратам. Класс C: остальная часть подпроектов, то есть эти подпроекты производят низкую прибыль от высокой стоимости. Различные эмпирические правила предложены для границ в доходах, чтобы определить классы. Типичные предложения по пределам доходов в классе А диапазон от 5 % до 33 %. Предложения по классу B колеблются от 15 % до 33 % для класса C от 25 % до 50 %. Во многом практическоем применении границы вручную отобраны, используя так называемые кривые Лоренца (Джуран 1950). На оси X Лоренца кривые - накопленные затраты на оси Y накопленные доходов проектов. Следующая кривая Лоренца произведена от данных в основном учебнике по статистике (Хартунг 1997). Это показывает размер земли, принадлежавшей фермам в Южной Африке против числа ферм. Обе единицы оси находятся в проценте.
В продолжении мы описываем происхождение границ, полученных из нашей теории по 80/20-закону Парето.
3. Деление Проектов в Задачи
Набор шагов, необходимых, чтобы решить проблему, называют проектом. Следующее - очень общий подход, чтобы решить любой вид проблемы: во-первых, разделите проблему на ряд под проблемы или задачи. Во-вторых, решите каждую под проблему отдельно и в-третьих, объедините частичные решения, и проблема решена. Этот подход к решению задач известен как "разделяй и властвуй" подход в отношении итальянского политического деятеля Маччиавелли, который, как предполагается, рекомендовал этот принцип как директиву для государственных лидеров (Ахо и др. 1982). Для того чтобы измерить долю усилия, затраченную на проект, мы предполагаем, что доклад подан на всех подпроектах. Для каждого подпроекта уникальный символ например, такие как буквы или цифры, используется, чтобы указать, что определенная часть стоимости потрачена на тот проект. Через равные промежутки времени в течение проекта эти символы могут быть написаны в отчете. После завершения проекта число различных символов пропорциональны затратам, потраченным для каждого подпроекта. Полная стоимость проекта пропорциональна общему количеству букв в этом типе отчета. Частота возникновения символа задачи в отчете пропорциональна усилию (стоимость) потраченному для этой задачи.
4. Энтропические Доходы
Энтропические Доходы - это мера дохода, произведенного подразделением проекта в задачи. Предположите, что проблема может быть разделена на n задачи. Тогда есть n различные символы, существующие в отчете по проекту. Каждый из символов, происходящих с частотами p1... pn в отчете. Если только один подпроект поднимает все ресурсы, это - символ, будет единственный, существующий в отчете проекта. Ничто не получено этим чрезвычайным "подразделением". Энтропический Доход этого подразделения установлен в ноль. Если символ задачи не содержится в отчете по проекту, это означает, что никакое усилие не потрачено на эту задачу. Энтропический Доход этой задачи должен также быть нолем. Если проект разделен таким образом, что стоимость для каждого подпроекта равна общему Энтропическому Доходу должен быть максимальной. Информация Шаннона определена в теории информации меры информации сообщения, состоящего из отличных знаков (Шаннон 1948). Информация, содержавшаяся в отчете по проекту, вычислена как сумма информации для знака каждой задачи. Информация знака задачи, происходящего с частотой p, вычислена по следующей формулой: inf(p) = – c* p* logв ( p) . (1) где b - основа логарифма, и c - положительная константа. В информации Теория c и b приспособлена таким образом, что ценности формулы (1) измерены в битах. Та же самая формула используется в физике, чтобы обозначить энтропию (Болцман 2000). Формула для энтропии может быть получена из очевидных принципов, которые совместимы с интуитивным пониманием доходов. Для наших целей важно, что стоимость и доходность измеряются в одинаковых единицах: в процентах. Мы оцениваем стоимость в подпроекте как долю от общей стоимости т.е. в диапазоне от 0% до 100%. Используя элементарные исчисления можно показать, что информация Шеннона для задачи максимальна при . С e = 2.1718..., число Эйлера, это дает максимально возможную информацию Шеннона на частоте pmax = 37%. Таким образом, мы определим Энтропический Доход как EY(p) = ? e ? p ? ln( p) . Где Е обозначает число Эйлера и ln натуральный логарифм. Энтропическай Доход по p = pmax становится 100%. Это означает, стоимость и доходность измеряется в том же диапазоне от 0% до 100%. Рисунок 2 изображает график Энтропических Доходов задачи как функция стоимости. Как видно на рисунке 2 Энтропические Доходы из подпроектов сначала растут, когда больше тратится на подпроект. Для 37% расходы больше, чем от общей стоимости доходов, накопленные разделения на подпроекты уменьшаются. Слишком много усилий уходит в такие подпроекта. Если все усилия проводится в одном подпроекте, нет доходов порожденных разделениями.
5. Нереализованный потенциал
Экономичное соображение призывает к проектам, производящим максимум доходности с затратами настолько низко насколько возможно. Идеальная ситуация проекта должна была бы произвести 100 % урожая с 0 % затрат. Хотя эта оптимальная ситуация O может едва быть найдена в практических проектах, она может служить отправной точкой для оценки, насколько хороший данная стоившая/приведенная ситуация S проекта. Мы определяем неосуществленный потенциальный URP ситуации проекта как эвклидово расстояние от идеальной ситуации O к ситуации данного проекта S.
Использование эвклидово расстояние имеет преимущество, что измерение неосуществленного потенциала независимо от перевода и вращения системы координат, в которой измерен URP. Кроме того интеграция пути возможна для эвклидова расстояния. Это означает, что это - метрика расстояния, совместимая с измерением здравого смысла расстояний в космосе. Эти свойства привели Эйнштейна использовать эвклидово расстояние для комбинации пространства и времени. Математически неосуществленный потенциальный URP ситуации проекта. Таким образом URP определен как эвклидово расстояние от пункта O к ситуации данного проекта S. Ценности URP для всех задач с Энтропической функцией доходности можно увидеть на следующем рисунке:
Главный вопрос заключается в том, почему во многих проектах есть один подпроект, который производит приблизительно 80%-в доходов с 20 % общей стоимости. Рассмотрите ситуацию с наименьшим неосуществленным потенциалом, то есть задачу с самым маленьким расстоянием до идеальной ситуации U. На рисунке 3 мы можем видеть, что стоимость для этой ситуации, примыкают к 20 %, более точно это - 20.13 %. Измерение Энтропической Доходности этой ситуации приводит к урожаю 87.77 %, как видно на следующем рисунке.
В пределах ошибочных краев 10 % на доходность ситуация U со стоимостью/доходностью приблизительно (20 %, 88 %) может быть расценена как ситуация, с которой сталкиваются так часто, и приводят к формулировке закона Парето. Экономичная оптимизация информации или энтропии, произведенной подразделением проекта в подзадачи, функционирует как теоретический фонд 80/20 закона Парето.
7. Свойства неосуществленного потенциала
В этой главе мы цитируем некоторые свойства вышеупомянутой определенной неосуществленной потенциальной функции URP. Можно показать, что уменьшение URP означает оптимальную ситуацию проекта с точки зрения стоимости и дохода. Для математических доказательств заинтересованный читатель упомянутый в Ultsch 2001.
URP нуля означает, что ситуация равна O, теоретически лучшей ситуации. Для всех ситуаций, имеющих неосуществленный потенциал u, можно показать, что максимальная стоимость таких ситуаций может быть только столь же большой как u. Кроме того урожай этих ситуаций должен составить 100 % - u или больше (теорема 5 в (Ultsch 2001)). Если стоимость ситуации установлена, и u - уменьшения, то доходность увеличенной ситуации (теорема 6 в (Ultsch 2001)). Помимо стоимости и доходности ситуации также можно рассмотреть эффективность, то есть стоимость доходности. Если u минимизирован, можно показать, что минимальная эффективность ситуации увеличивается (теорема 8 в (Ultsch 2001)). Кроме того урожай ситуации с минимальными увеличениями эффективности. Если стоимость ситуации является постоянной и неосуществленные потенциальные уменьшения, то доходности и увеличения эффективности. Если доходности ситуации дан меньший неосуществленный потенциал приводит к лучшей эффективности. Для каждого данного u есть меньший u', таким образом, что эффективность всех ситуаций с u' безусловно больше (теорема 9 в (Ultsch 2001)). In summary minimizing URP means an economic optimization of a project's situation. If the URP is minimized yield and/or efficiency increase while costs are optimized.
8. Точные пределы для анализа ABC
В этой главе мы получаем пределы для анализа ABC. У задач в классе A анализа ABC должен быть максимальный доход с минимальными затратами. Это означает, что ситуация U является лучшим кандидатом на такую задачу. Следовательно предел стоимости 20.13 % - лучший предел для класса A.
Для задач в подпроекте B следующие ситуации были бы хороши:
(I) ситуация с максимальным частичным урожаем (100 %) или
(II) ситуация, где эффективность больше чем 100%
Можно показать, что для Энтропического Дохода условия (I) и (II) идентичны (Ultsch 2001). Лучшая ограничивающая стоимость для класса B - поэтому 37 %. Поскольку класс C остается остальной частью стоимости то есть 100 % - 20 % - 37 % = 43 %. Разделение с границами 20 %, между A и B и 57 % между B и C оптимально и может быть названо "Энтропическим анализом ABC". Для Энтропического анализа ABC есть точное определение значения классов: Класс A: Стоимость так же как доход оптимизирована в том смысле, что стоимости минимизированы, и доходы максимизированы. Оптимальный подпроект - тот, который прибывает самый близкий к 0% усилию и 100% доходу. Класс B: Доход должен быть больше чем затраты. Эффективность этого проекта должна быть по крайней мере 100 %. Класс C: остальная часть подпроектов, имеющих меньшую эффективность. 9. Применение неосуществленной потенциальной теории Во многих проектах доход определен через характер проекта например в денежном выражении. Для этих проектов теория, обрисованная в общих чертах выше, могла бы использоваться в качестве директивы, чтобы измерить качество подпроектов, используя URP. Полученные границы для энтропического анализа ABC могут использоваться в качестве отправных точек, чтобы идентифицировать полезные классы проектов. Если явное определение дохода не дано, может быть применен Энтропический Доход. Эта энергия, например, использоваться в • определение идеального ряда факторов, делающего основной составляющий анализ • определение идеального числа групп в кластерном анализе • расшифровка значения генетического кода • и другие В качестве примера рассматрим кластерный анализ. Кластерный анализ означает обнаружение однородных групп в высоких размерных наборах данных. Для данных мера по расстоянию должна быть определена, имея размеры (различие)подобие между данными точками. Для каждого пункта затраты могут быть определены пропорционально расстоянию между пунктами. Доход, может является числом других пунктов в близости пункта. Используя пункт U URP может быть определена местная плотность. Это может использоваться, чтобы найти группы так же как выбросы (Ultsch 2002). Энтропический анализ ABC обеспечивает точные границы, позволяющие определить принадлежит ли пункт группе или нет.
10. Обсуждение
В этой работе мы определим позицию, вопросом могла бы быть более глубокая причина столкновения вездесущности 80/20 закона Парето? Для этого мы расцениваем подразделение проекта в подзадачи. Общий бухгалтерский учет на доходность, потраченном на подзадачи проекта, является отчетом по проекту, имеющим символы (буквы, числа) для каждого частичного усилия, потраченного на задачу. Мы пытаемся измерить доход, произведенный подразделением проекта в подпроекты. Требования для такой функции дохода приводят естественно к аксиомам информации о Шанноне (см. (Ultsch 2001)).
То есть доход, полученный подразделением за подпроекты, мог бы быть идентифицирован с информацией или энтропией, содержавшейся в отчете по проекту. С правильным регулированием единиц для стоимости и дохода это приводит к определению Энтропического Дохода. 80/20 закон Парето следует из оптимизации стоимости и Энтропического Дохода для подпроектов. Эта теория для фонда 80/20-закона Парето делает ставку 20.13 % для стоимости. Это почти идентично с законом Парето. Теория, однако, подразумевает больший урожай 88 % вместо 80 %. Так как закон Парето был до сих пор только эмпирическим правилом, можно было бы признать, что в пределах 10 % ошибки наша теория совместима с наблюдением Парето. Вероятно, что для реалистических эффектов проектов как трение или точность измерения должны быть рассмотрены случаи, где эти явления могут быть игнорированы, могут служить (не)утверждают теорию в будущем. В примере южноафриканского землевладельца, которое было беспорядочно выбраны книги автора с книжной полки, интерполяция для области 20.13 % прибывает очень близко к теоретическому пункту U (рисунк 1). В рисунке 4 можно заметить, что U в относительно плоском разделе графа для URP. Поскольку обсуждение ошибочных краев U позволяло нам рассматривать следующий граф:
В этом графе URP связан с U в 20.13 %. Можно заметить что происхождение 10 % от U то есть интервала 18 %.. 22 % находятся в пределах 98 % оптимума. Происхождение 20 %, то есть интервал 16 %.. 24 %, все еще дает больше чем 90 % оптимального URP. 16 % стоимости приводят к 80 % Энтропического Дохода. Обрисованная в общих чертах теория может быть также важной для информационой и кодирующей теориям. Классические определения информации по Шаннону принимают источник информации, отсылающий различимые знаки, выбранные из конечного набора знаков. Наш подход вносит в эту теорию представление, что производство знака может быть связано с затратами. Поскольку условие для оптимизации данных, минимизация числа знаков, максимизируя переданную информацию может использоваться. Оптимальная частота передачи в этом смысле - pu = 20.13 %. Наша теория также проливает некоторый свет на физическую Энтропию термина согласно Болцману (Болцман 2000). Энтропия в физических системах, как можно полагать, как вероятность системы многих микроскопических частей была бы в определенном макроскопическом государстве. Энтропический Урожай можно было бы рассмотреть как доход, произведенный, решая проблему комбинацией случайных решений. Использование информации о Шанноне как своего рода доход, конечно, оправдано в таких ситуациях, где никакая другая функция дохода не определена проектом. Энтропический Доход мог бы также использоваться в проекте, где передача информации важна, например в маркетинге. Как применение теории мы получили точные пределы для анализа ABC. Частичные доходы для полученных классов составляют 32 %, 37 % и 36 %. В пределах ошибочных краев это совместимо с предложением некоторых практиков анализа ABC, чтобы установить границы, деля полный доход на три равных части (33% доход для всех классов).Во многих современных применениях анализа данных как интеллектуальный анализ данных, или открытие эвристических знаний правила используются, чтобы найти абстракции массы данных, как основные компоненты или группы. Энтропический анализ ABC мог бы служить теоретическим звуковым оправданием, чтобы сконцентрироваться на меньшем, но значащем представлении данных (Класс A).
11. Резюме
В этой работе часто встречаются возникновения 80/20 закона Парето дается теоретическая структура. Деление проекта в подзадачи производит информацию, которая может быть измерена, используя информацию по Шаннону.
Эту информацию рассматривают как форму дохода. Стоимость связана с усилием, потраченным в подзадаче. Оптимизация стоимости и дохода может быть выполнена, минимизируя точное определение неосуществленного потенциала ситуации со стоимостью/доходом проекта. Оптимальная ситуация, полученная этой теорией, составляет 20 % стоимости, приводящая к 88 % дохода. Сделанная ставка 20 % для стоимости идентична с законом Парето. Доход 88 % находится в том же самом порядке величины как в законе Парето.
С лишним доходом можно было бы столкнуться, когда трение игнорируется. Из нашей теории следуют точное определение границ классов для анализа ABC. Это дает классам точное математическое значение. Наш подход проливает некоторый свет на связь между физическим определением информацией по Шаннону и энтропии. Применение теории в области интеллектуального анализа данных, объединения в кластеры и биоинформатики очевидно.

Литература

  1. Aho, A.V. ,Hopcroft, J.E., Ullman, J.: Data Structures and Algorithms, Addison Wesley,1982
  2. Arthur L.J., Rapid Evolutionary Development - Requirements, Prototyping & Software Creation, John Wiley & Sons,1992
  3. Boltzmann, L.: Entropy and Probability, Harri Deutsch, Frankfurt, 2000
  4. Dyche, J.: The CRM Handbook: A Business Guide to Customer Relationship Management, Addison-Wesley, 2001
  5. Kimber, R. J., Grenier, Robert W., Heldt,Jj.J., Quality Management Handbook, Marcel Dekker, York, NY, 1997
  6. Pareto, V., Trattato di Sociologia Generale, Firenze,1916, Engl.: The Mind and Society, Dover, 1935
  7. Shannon, C.E., A Mathematical Theory of Communication, The Bell System Technical Journal, Vol 27, pp 379-423, 1948
  8. Sombart, W.: Die drei Nationalokonomien. Geschichte und System der Lehre von der Wirtschaft, Zeller Verlag, 1967 (in German)
  9. Ultsch, A., Justification of Pareto's 80/20 law, Technical Report, 30, Department of Computer Science, University of Marburg, Germany, 2001(in German).
  10. Ultsch, A., UPCluster: a Density Based Clustering Algorithm Based on a Proven Form of Pareto's 80/20 law, to appear, 2002.