Столяр Александра Игоревна Факультет: компьютерных информационных технологий и автоматикиКафедра: автоматизированных систем управленияСпециальность: информационные управляющие системы |
|||||||||||||||||||||||||
|
|||||||||||||||||||||||||
|
Тема выпускной работы:
Автореферат Содержание
Количество видов телекоммуникационных услуг постоянно растет, а их объемы варьируются от клиента к клиенту, изменяются во времени, подвержены сезонным изменениям и т.п. Взаимосвязи между объемами услуг разных видов неочевидны: существуют ли скрытые связи между услугами, какова «сила» этих связей и к чему приведут возможные изменения объемов оказываемых услуг? Ответ на эти и подобные вопросы имеет вполне определенное практическое значение, позволяющее предсказать изменение объемов и, соответственно, экономические эффекты, свойственные той или иной ситуации, складывающейся на рынке телекоммуникационных услуг [1]. Решение проблемы разработки моделей выявления скрытых закономерностей в телекоммуникационном трафике, позволяющих рационально перераспределять ресурсы оператора, является актуальной. Телекоммуникационным компаниям в сборе и исследовании данных о клиентах помогает система биллинга [2]. Применительно к телекоммуникационному бизнесу биллинг представляет собой автоматизированную систему учета предоставляемых компанией услуг, их тарификации и выставления счетов оплаты, которая обеспечивает оператору связи значительные ресурсные возможности. Информация об абоненте появляется в специальной клиентской базе с момента его подключения к телефонной сети. Помимо социально-демографических данных пользователя (пол, возраст, место проживания) биллинговая система может предоставить сведения о совершаемых платежах, активности пользования связью, тарифном плане, наличии тех или иных услуг, начислениях за расчетный период и о многом другом [3]. Информация, содержащаяся в клиентской базе, анализируется и систематизируется по различным критериям с использованием методов математического анализа. Специалисты могут сделать выгрузку необходимых данных во время планирования маркетинговых инициатив или просчитать эффективность уже существующих программ. Таким образом, биллинговая система дает возможность прогнозировать, отслеживать, корректировать и, в конечном итоге, оценивать любые маркетинговые продукты [4]. Существует внутрикорпоративная система статистики, которая включает в себя финансовую и маркетинговую отчетности. Эта всеобъемлющая статистика составляется по отдельным параметрам как регулярно, так и по мере необходимости. На ее основе формируются предложения массовому клиенту, так как с помощью данной отчетности очень многое можно смоделировать и спрогнозировать. Используя данные биллинга, сотрудники специализированного маркетингового отдела могут выделить одного конкретного клиента или группу абонентов, объединенных по каким-либо параметрам, для предложения им немассового продукта. Это позволяет компании решить две задачи. Во-первых, чтобы спрогнозировать профиль потребления новой услуги более многочисленной аудиторией, на некоторое время ею предлагают воспользоваться ограниченному числу лиц. В данном случае за ними просто наблюдают (отслеживают, сколько абонентов согласилось на подключение, как меняется потребление услуги), чтобы понять, как работает новое предложение [5]. Кроме того, обработка абонентской базы дает возможность проверить предположения маркетологов о зависимости между профилем потребления связи и дополнительными услугами, которые могут быть интересны пользователям. Таким образом, компания может напрямую предложить абоненту услугу, ориентированную либо конкретно на него, либо на достаточно узкий сегмент потребителей. В системе может быть определено неограниченное количество тарифов и тарифных планов. Каждая услуга может иметь несколько разных тарифов. Каждому клиенту может быть назначен индивидуальный тарифный план. Кроме того, отдельный тарифный план может быть назначен на каждый отдельный экземпляр заказанной клиентом услуги, связанный с определенным используемым клиентом ресурсом. Такой подход позволяет удовлетворить требования операторов, имеющих большое количество ресурсов разных типов. Таких как операторов телефонных фиксированных сетей, сетей сотовой радиотелефонной связи, сетей подвижной радиотелефонной и радиосвязи, сетей персонального радиовызова, сетей передачи данных, сетей доступа в Интернет, смешанных и других сетей [6]. С помощью одного и того же предоставляемого ресурса могут оказываться несколько видов услуг, которые могут тарифицироваться по-разному. Например, подключенный телефонный аппарат и соответствующая телефонная линия могут использоваться для предоставления местного, междугородного и международного соединения. В соответствии с этим, могут различаться и тарифы на предоставляемые услуги. Оплата же всех этих услуг производится по единому счету, что позволяет повысить эффективность работы системы. Для того чтобы оценить финансовый результат, который повлечет за собой изменение действующих тарифов либо внедрение новых тарифных пакетов, нам необходимо знать (спрогнозировать) несколько параметров. Во-первых, изменение числа пользователей в данном тарифе – сколько абонентов перейдет на новый тариф, сколько останется на действующем тарифном пакете. И, во-вторых, динамику объема потребляемых услуг абонентами в данном тарифе. Необходимость прогнозирования данных параметров очевидна, поскольку любые изменения в тарифах повлекут за собой финансовые результаты: денежные потери либо рост дохода [7]. 3. Связь работы с научными программами, планами, темами Квалификационная работа магистра выполнялась на протяжении 2008-2009 гг. в соответствии с научными направлениями кафедры «Автоматизированные системы управления» Донецкого национального технического университета. 4. Цель и задачи разработки и исследования Целью магистерской работы является создание компьютеризированной подсистемы прогнозирования доходов телекоммуникационного предприятия на основе данных биллинговой системы (системы ежемесячного расчета с абонентами за предоставленные услуги) в условиях ЗАО «Фарлеп – Телеком - Холдинг» Идеей работы является использование современных систем обработки данных и систем интеллектуального анализа данных, применение классических статистических методов прогнозирования и их модификации.
Предмет разработки и исследований: статистические данные, предоставляемые биллинговой системой. Объект разработки и исследований: изменение потребления абонентами услуг связи, а также динамика переходов клиентов из одного тарифа в другой. Методология и методы исследований. В процессе исследования будет применяться формальный аппарат теории нечетких множеств, а также теории нейронных сетей. Предполагаемая научная новизна состоит в используемом методе прогнозирования. В качестве основного метода планирования и прогнозирования доходов я считаю целесообразным использование модифицированного метода, объединяющего в себе теорию нечетких методов и нейронных сетей. Для повышения объективности прогнозирования используются технические индикаторы, представляющие собой математические модели анализа временных рядов различного уровня сложности. Разумеется, существуют методы прогноза, основанные на использовании более изощренных математических теорий. Но они не нашли своего широкого применения, и не в силу трудности понимания, а потому, что не дали на практике заметного выигрыша по сравнению со значительно более простыми и ставшими уже традиционными методами. Очень многие практики утверждают, что основа успеха - в четком и правильном использовании немногих простых методов, а усложнение прогноза ведет к ложной уверенности и, в результате, к убыткам. Выбранная методика позволит объединить достоинства всех входящих в неё методов и построить наиболее точную и эффективную прогнозную модель с наименьшей ошибкой прогноза данных.
7. Обзор исследований и разработок по теме На локальном уровне (в пределах ДонНТУ) портал магистров может предоставить информацию о 15 подобных работах, в которых решаются разнообразные задачи прогнозирования, но конкретно задача прогнозирования доходов предприятия не рассматривается При разработке алгоритма решения задачи учитывались такие требования как: отсутствие информации о возможных маршрутах прохождения трафика, быстрые изменения деловой среды рынка связи, связанные с развитием конкуренции, информационных технологий, возможность многовариантного моделирования производственных ситуаций. На рисунке 7.1 предложена схема взаимодействия оператора и абонента. Рисунок 7.1 - Схема взаимодействия абонента и оператора с использованием биллинговой системы На национальном уровне (в пределах Украины) и на глобальном уровне (общемировой) было разработано и исследовано: Регрессионно-когнитивное моделирование В качестве такой модели обычно используется так называемая когнитивная карта ситуации (А. Кулинич, Ф. Робертс, Д. Хейс), которая представляет известные эксперту основные законы и закономерности наблюдаемой ситуации в виде ориентированного знакового графа, в котором вершины графа – это факторы (признаки, характеристики ситуации), а дуги между факторами – причинно-следственные связи [8]. Графовая модель такой карты характеризуется наличием вершин-факторов и дуг, помеченных знаками «+» и «–». Такая разметка определяет положительные и отрицательные связи между факторами. Пример когнитивной карты некоторой ситуации для рынка телекоммуникационных услуг представлен на рисунке 7.2. Рисунок 7.2 - Пример когнитивной карты ситуации С учетом этих факторов создается модель исследуемой ситуации как совокупность гипотез, способных объяснить развитие системы. Кроме того, создаются гипотезы, способные объяснить механизмы влияния между теми или иными факторами системы и установить причинно-следственные связи между ними. Такие взаимосвязи, как правило, не очевидны, поэтому возникает вопрос: существуют ли скрытые связи между различными факторами, какова «сила» этих связей и к чему приведут возможные количественные изменения для каждого из факторов. Ответ на эти и подобные вопросы имеет вполне определенное практическое значение, позволяющее предсказать экономические эффекты, свойственные той или иной ситуации, складывающейся на рынке телекоммуникационных услуг [8]. Для анализа и прогнозирования взаимовлияний телекоммуникационных факторов предлагается использовать методологию регрессионно-когнитивного моделирования, которая дополняет когнитивный граф ситуации механизмами регрессионного анализа. Весь процесс регрессионно-когнитивного моделирования можно разделить на несколько этапов, представленных на рисунке 7.3.
Рисунок 7.3 - Этапы регрессионно-когнитивного моделирования На первом этапе регрессионно-когнитивного моделирования происходит представление всех имеющихся факторов в виде когнитивной карты, которая должна отражать общие представления о ситуации в виде определенных семантических категорий, под которыми понимаются признаки, факты, события, понятия, имеющие отношение к конкретной ситуации. На следующем этапе на основе имеющихся данных проводится количественный анализ взаимных влияний в сконструированном полносвязном графе. Для этого создается регрессионная модель для каждого из имеющегося набора факторов. Третий этап демонстрирует динамику развития РКМ, показывая хронологическую «борьбу» тенденций для сигнальной формы графа; вводит величину дельта t – интервал дискретизации, свойственного системе (так называемый принцип «?t» в имитационном моделировании). Общая постановка задачи целевого управления в рамках РКМ связана с выделением целевой вершины-фактора, значение которого желательно повысить, понизить или «вписать» в определенный диапазон значений. При этом структура РКГ остается прежней, а задача поиска заключается в таком подборе коэффициентов – дуг графа, при котором реализуется желаемая цель. Методология поиска решения в сочетании с РКМ в первую очередь полезна для моделирования варианта принимаемого решения, тактики или стратегии управления. Конструируемая модель поиска решения в совокупности с моделями РКМ позволит найти оптимальный вариант решения перехода от реального значения какого-либо фактора к желаемому, который может быть использован при принятии соответствующего решения. Метод имитационного моделирования В современных условиях управленческое моделирование бизнес-процессов становится не столько процессом сбора, анализа, обработки огромных массивов информации для выявления эффективного управленческого сценария, сколько процессом формирования и анализа проблемного поля по потенциальным рискам с целью повышения эффективности управления. Одним из универсальных методов проведения "эксперимента" на предмет принятия рационального решения является имитационное моделирование, в процессе которого формируется статистика возможных выходных параметров деятельности [10]. Применение данного метода позволяет использовать биллинговую систему для повышения обоснованности управленческих решений в телекоммуникационной компании, для разработки тарифных планов, для планирования и бюджетирования; даст возможность проанализировать ситуацию на новом наборе абонентов, услуг, измененной схеме маршрутизации вызовов. Далее на рисунке 7.4 приведен алгоритм формирования тарифов услуг организации. Рисунок 7.4 - Алгоритм формирования тарифов услуг организации В реальной жизни приходится сталкиваться с более сложными задачами; сложность принятия решения может быть обусловлена факторами ограниченности соединительных линий и факторами «тяготения» трафика. Перед внедрением подобных тарифов необходимо провести специальное исследование, позволяющее правильно подобрать значения тарифов и добиться оптимального распределения нагрузки. Интеграция имитационной модели и системы биллинга позволила реализовать задачу рациональных взаиморасчетов операторов и клиентов. С помощью метода функционального моделирования было произведено исследование процессов, проистекающих в системе, выявлены их недостатки и построена модель системы моделирования тарифных планов телекоммуникационной организации. Нагрузку оператора при взаимном использовании ресурсов для пропуска трафика можно представить в виде формулы:
Рисунок 7.5 - Имитационная модель поступления трафика и процесса тарификации Данная модель была разработана при использовании технологии структурного анализа и проектирования, позволяющей описать бизнес-процесс в виде иерархической системы взаимосвязанных функций, представленная модель отображает функциональную структуру объекта, производимые им действия и связи между этими действиями. Блоки в них представляют действия, а дуги – объекты, обрабатываемые системой [10]. Себестоимость транзитного трафика определяется как отношение разницы между расходами на пропуск трафика с учетом транзитного и без учета транзитного к количеству минут транзитного трафика. Аналогичным образом можно рассчитать и уменьшение расходов по пропуску трафика при его перемаршрутизации через более «дешевые» узлы.
На основе анализа трафика можно сделать выводы о непосредственной деятельности организации на будущие периоды, разработать тарифные планы, реализующие модель эффективности. В результате изменения входных данных модели поступления трафика и процесса тарификации существует возможность разработать методику планирования деятельности организации на основании прогнозирования доходов и расходов организации. С помощью подобной модели можно решить задачу повышения доходов организации и выравнивания нагрузки сети. Такая модель используется для разработки модуля планирования тарифных планов. Проведя подробное исследование услуг оказываемых операторами, можно промоделировать тарифные планы для абонентов и взаимодействующих операторов. Выходные данные используются для обоснования управленческих решений по определению оптимальной тарифной политики и стратегии развития предприятия. Нейронные сети для решения задачи прогнозирования На вход искусственного нейрона поступает некоторое множество сигналов x1, x2,…, xn, каждый из которых является выходом другого нейрона. Каждый вход умножается на соответствующий вес w1, w2,…, wn, и поступает на суммирующий блок, обозначенный ?. Суммирующий блок, соответствующий телу биологического элемента, складывает взвешенные входы алгебраически, создавая выход – NET. Простейшей нейронной сетью считается персептрон, который изображен на рисунке 7.6. По своей структуре он аналогичен нейрону, но на его выходах находится некоторый анализатор. И в зависимости от значения сформированной суммы, выходное значение анализатора будет равно "1", если сумма больше порогового значения и "0", если меньше.
Рисунок 7.6 - Персептрон – простейшая нейронная сеть
Для решения более сложных задач используют многослойные нейронные сети. Но для обучения многослойных нейронных сетей требуются более сложные алгоритмы обучения нейронных сетей. Схема такой многослойной сети изображена на рисунке 7.7. Рисунок 7.7 - Схема многослойной нейронной сети
Искусственная нейронная сеть обучается посредством некоторого процесса, модифицирующего ее веса. Если обучение успешно, то предъявление сети множества входных сигналов приводит к появлению желаемого множества выходных сигналов. Имеется два класса обучающих методов: детерминистский и стохастический [12]. Детерминистский метод обучения шаг за шагом осуществляет процедуру коррекции весов сети, основанную на использовании их текущих значений, а также величин входов, фактических выходов и желаемых выходов.
Стохастические методы обучения выполняют псевдослучайные изменения величин весов, сохраняя те изменения, которые ведут к улучшениям. Прогнозирование – это предсказание будущих событий. Целью прогнозирования является уменьшение риска при принятии решений. В большинстве случаев прогноз получается ошибочным, причем ошибка зависит от прогнозирующей системы и методов прогнозирования. Для уменьшения ошибки следует увеличивать количество ресурсов предоставляемых для прогноза. При некотором уровне ошибки можно добиться минимального уровня ресурсов для прогноза. Основной проблемой прогнозирования является выявление неточности прогноза. Обычно, решение, принимаемое на основании прогноза должно учитывать ошибку, о которой сообщает система прогнозирования. Таким образом, система прогнозирования должна обеспечить определение прогноза и ошибки прогнозирования. Большинство задач прогнозирования можно свести к предсказанию временного ряда. Предсказание временного ряда сводится к типовой задаче нейроанализа – аппроксимации функции многих переменных по заданному набору примеров – с помощью процедуры погружения ряда в многомерное пространство (Weigend, 1994). Согласно теореме Такенса: "Если временной ряд порождается динамической системой, т.е. значения D0 есть произвольная функция состояния такой системы, существует такая глубина погружения d (примерно равная эффективному числу степеней свободы данной динамической системы), которая обеспечивает однозначное предсказание следующего значения временного ряда" (Sauer, 1991). Таким образом, выбрав достаточно большое d можно гарантировать однозначную зависимость будущего значения ряда от его предыдущих значений: Xt=?(Xt-d) , т.е. предсказание временного ряда сводится к задаче интерполяции функции многих переменных. Нейросеть далее можно использовать для восстановления этой неизвестной функции по набору примеров, заданных историей данного временного ряда [12]. Результатом прогноза на НС является класс, к которому принадлежит переменная, а не ее конкретное значение. Формирование классов должно проводиться в зависимости от того каковы цели прогнозирования. Общий подход состоит в том, что область определения прогнозируемой переменной разбивается на классы в соответствии с необходимой точностью прогнозирования. Классы могут представлять качественный или численный взгляд на изменение переменной. Прогнозирование на нейронных сетях обладает рядом недостатков. Как правило, необходимо около 100 наблюдений для создания приемлемой модели. Это достаточно большое число данных и существует много случаев, когда такое количество исторических данных недоступно.
Однако необходимо отметить, что возможно построение удовлетворительной модели на нейронных сетях даже в условиях нехватки данных. Модель может уточняться по мере того, как свежие данные становится доступными. Другим недостатком нейронных моделей – значительные затраты по времени и другим ресурсам для построения удовлетворительной модели, известно, что обучение сети может занимать довольно много времени. Однако, несмотря на перечисленные недостатки, модель обладает рядом достоинств. Существует удобный способ модифицировать модель по мере того как появляются новые наблюдения. Применение нечеткой логики для решения задач прогнозирования
Одним из направлений совершенствования работы современных промышленных предприятий является логистический подход к прогнозированию и управлению материальными потоками предприятия. В общем случае, материальный поток представляет собой динамическое и непрерывное явление. Для упрощения разработки модели прогнозирования и управления, исходя из логистической концепции, материальный поток рассматривается на коротком временном отрезке, что позволяет его характеризовать как временную статистическую величину. Сложности построения моделей материальных потоков предприятий заключается в том, что между воздействующими факторами, как внешними, так и внутренними, существуют определенные, зачастую трудно выявляемые связи.
Нечеткие множества дают возможность формализовать величины, имеющие качественную основу, выявить причинно-следственные связи между регулируемыми параметрами и влияющими на них величинами и сформулировать нечеткий прогноз в условиях неопределенности параметров прогнозирования. Алгоритм построения математической модели, который изображен на рисунке 7.9, базируется на использовании теории нечеткой логики.
В соответствии с методами нечеткой логики выделяются основные этапы моделирования:
ymin, ymax - шкала измерения; ?i - значение функции принадлежности. Для построения модели необходимо все параметры информационной базы привести к одному виду - качественному или количественному. База нечетких знаний является носителем экспертной информации о причинно-следственной связи между входными и выходными данными. База знаний детерминирует систему логических выводов типа "если-то; если-или", которые связывают значения входных параметров Х1,:Хn с выходным параметром Y. Формирование базы нечетких знаний начинается с процедуры формирования начальной выборки, имеющей своей целью подготовку необходимого массива статистических данных по исследуемому объекту. Четкий прогноз материальных потоков современных предприятий затруднен по ряду причин объективного и субъективного характера. Представляется целесообразным прогнозирование материальных потоков осуществлять на базе методов нечеткой логики, используя нечеткие знания. Поставлена задача, структурирован процесс и разработана математическая модель прогнозирования материальных потоков промышленных предприятий на основе базы нечетких знаний. Нечеткие числа, получаемые в результате “не вполне точных измерений”, во многом аналогичны распределениям теории вероятностей, но по сравнению с вероятностными методами, методы нечеткой логики позволяют резко сократить объем производимых вычислений, что, в свою очередь, приводит к увеличению быстродействия нечетких систем. Недостатками нечетких систем являются:
Прогнозирование с использованием генетических алгоритмов Основные компоненты генетических алгоритмов – это стратегии репродукций, мутаций и отбор "индивидуальных" нейронных сетей (по аналогии с отбором индивидуальных особей). Важным недостатком генетических алгоритмов является сложность для понимания и программной реализации. Однако преимуществом является эффективность в поиске глобальных минимумов адаптивных рельефов, так как в них исследуются большие области допустимых значений параметров нейронных сетей. Другая причина того, что генетические алгоритмы не застревают в локальных минимумах – случайные мутации. Скорость сходимости градиентных алгоритмов в среднем выше, чем генетических алгоритмов. Генетические алгоритмы дают возможность оперировать дискретными значениями параметров нейронных сетей. Это упрощает разработку цифровых аппаратных реализаций нейронных сетей. При обучении на компьютере нейронных сетей, не ориентированных на аппаратную реализацию, возможность использования дискретных значений параметров в некоторых случаях может приводить к сокращению общего времени обучения [14]. Первый раздел. Обзор поставленной задачи: Прогнозирование дохода предприятия (телефонной компании) на основе анализа данных, предоставляемых биллинговой системой. В данном разделе будут описаны методы решения, а также математическая постановка задачи и выводы. Тут же необходимо определить параметры, на основании которых может производиться прогнозирование. Современные тенденции развития рынка телекоммуникаций, связанные с постоянно и быстро растущим многообразием видов предоставляемых услуг связи и их объемов, ставят перед операторами связи все более сложные задачи по организации процесса предоставления этих услуг своим клиентам. К таким задачам относятся обеспечение гибкой системы учета и тарификации оказываемых услуг, выставления счетов и учета оплаты (что составляет основу биллинговых систем или АСР - автоматизированных систем расчетов); обеспечение учета потребностей клиентов в различного вида услуг (CRM); поддержка различных способов оплаты (предоплаты в различных формах, оплаты по выставленным счетам и т.п.), и др. Были решены следующие задачи:
Важное замечание: При написании данного автореферата магистерская работа еще не завершена. Окончательное завершение - декабрь 2009 года. Полный текст работы и материалы по теме могут быть получени у автора или его руководителя после указанной даты.
|
||||||||||||||||||||||||
ДонНТУ | Портал магистров ДонНTУ | Автобиография | Библиотека | Ссылки | Отчет о поиске | Индивидуальное задание |