ДонНТУ   Портал магистров

Реферат по теме выпускной работы

Содержание

Введение

Современные телекоммуникационные сети характеризуются быстрым ростом объемов трафика. По мнению аналитической группы Тасс-Телеком на протяжении последних 5 лет объемы мирового рынка информационных технологий растут ежегодно на 10% [1]. Исследования Cisco Visual Networking Index показывают, что, IP-трафик будет возрастать на 29% с 2011 по 2016 год [2]. Последние годы всё больше наблюдается тенденция к конвергенции телекоммуникационных услуг, что создает дополнительные трудности при его передаче и обработке. Мультисервисный трафик требует приоретизации, и каждый класс предъявляет определенные требования к качеству обслуживания. В связи с этим необходимо обеспечить систему гибкого управления нагрузкой сети путем динамического перераспределения ресурсов канала связи (пропускной способности, скорости передачи и пр.). При этом необходимо учесть некоторые особенности современного мультисервисного трафика. Традиционные алгоритмы балансировки нагрузки могут быть существенно усовершенствованы за счет применения методов прогностического управления. В данной работе будет затронута возможность составления долгосрочных прогнозов, что в дальнейшем позволит проводить стратегическое планирование телекоммуникационной сети с точки зрения эффективного использования ее ресурсов и избежания перегрузок, ведущим к потерям информации.

1. Актуальность темы

До настоящего времени поставщикам телекоммуникационных услуг приходилось создавать и поддерживать отдельные сети для передачи голосовой информации, видеоизображения, трафика, необходимого для решения критически важных задач, и всего остального сетевого трафика. Но в современных условиях такой подход устаревает.

Долгое время считалось, что трафик сети передачи данных можно описать классическим пуассоновским распределением. Однако, в ходе исследований последних лет было обнаружено, что трафик в высокоскоростных сетях имеет всплески нагрузки, которые приводят к перегрузке сети. То есть, классические методы расчета сетей нецелесообразны для данных условий. Кроме того, была выявлена зависимость последующих событий от предыдущих, хотя и весьма отдаленных предыдущих. Мы и сами можем проследить, как меняется, например, нагрузка в сети мобильной связи в разное время суток, в разные дни недели. Существует определенная периодичность, например, ночью нагрузка на сеть обычно ниже, а днем можно выделить один или несколько пиков активности. Все это говорит о том, что трафик носит самоподобный характер.

«Самоподобие» представляет собой свойство процесса сохранять свое поведение и внешние признаки при рассмотрении в разном масштабе [3]. Самоподобный процесс выглядит менее сглаженным, более неравномерным (т.е. обладает большей дисперсией), чем чисто случайный процесс. Неравномерность самоподобного процесса изображена на рис. 1.

Временные реализации реального самоподобного трафика (слева) и пуассоновской модели(справа)

Рисунок 1 – Временные реализации реального сетевого (самоподобного) трафика (слева) и традиционной «не самоподобной» (пуассоновской) модели телетрафика (справа) при разных масштабах временной оси. Сверху вниз масштаб временной оси укрупняется.
(анимация: 6 кадров, задержка между кадрами 800 мс, количество циклов повторений - бесконечное, размер 110 кб, создана при помощи gifovina.ru)

Прогнозирование телетрафика играет значительную роль при разработке алгоритмов работы сети, повышающих качество передачи информации. Операторы и провайдеры телекоммуникационных услуг заинтересованы в возможностях долгосрочного прогнозирования загрузки сети для оптимального ее планирования и своевременного регулирования. Такой подход поможет своевременно предотвратить перегрузки в системе с нестационарным трафиком и не оставить недогруженными ее ресурсы.

2. Цель и задачи исследования, запланированные результаты

Целью данной работы является улучшение показателей качества предоставления телекоммуникационных услуг с эффективным использование ресурсов сети с помощью прогностической модели ARFIMA.

Основные задачи исследования:

  1. Анализ особенностей современных телекоммуникационных сетей и нагрузки.
  2. Постановка требований к трафику, подлежащего прогнозированию.
  3. Выбор метода, с помощью которого будет реализован прогноз.
  4. Определение порядка выбора параметров прогнозной модели.
  5. Исследование прогнозных значений и оценка эффективности выбранного метода.

Объект исследования: процессы в телекоммуникационных сетях.

Предмет исследования: трафик телекоммуникационной сети.

В рамках магистерской работы планируется получение актуального научного результата:

Планируется разработка прогностической ARFIMA-моделі, способной адекватно описывать процессы в телекоммуникационных сетях, обладающие свойством долговременной памяти.

3.Обзор исследований и разработок

Свойство самоподобия является определяющим в возможности составления прогноза сетевого трафика. Анализу мультисервисного трафика и подходам к его моделирования посвящено много работ за последние 20 лет. В 1999 г. описал модель самоподобного пакетного трафика и определил выражения для получения вероятности потерь пакетов такой модели Цыбаков Б.С. [4]. Нельзя не отметить книги Шелухина А.И. такие, как, например, «Самоподобие и фракталы. Телекоммуникационный приложение» [5] и «Мультифракталы. Инфокоммуникационные приложения» [6]. Анализом структуры сетевого трафика и определением влияния эффекта самоподобия на качество обслуживания занимался Петров В.В. [7].

Аналитический обзор методов прогнозирования наглядно представлен в научном руководстве Э.Е. Тихонова «Методы прогнозирования в условиях рынка» [8]. Авторегрессионные модели были исследованы авторами Box EPG, Jenkins GM, Reinsel GC в работе «Time series analysis: forecasting and control» [9]. Модель ARFIMA, представляющая из себя модель Бокса-Дженкинса с дробным порядком интегрированности, подробно рассматривается авторами Granger, C. W. J. и Joyeux, R.[10].

Также следует выделить некоторых магистров ДонНТУ, исследовавших подобные темы в своих квалификационных работах. Принципам моделирования самоподобного трафика посвящена работа Жалейко Е.В. [11]. Также, свойствами мультисервисного трафика занималась Шепеленко А.Г. [12]. В работе Чекункова А.С. [13] исследуется система балансировки нагрузки в конвергентной телекоммуникационной сети с прогнозированием трафика на основе нейросетей и авторегрессионной модели.

4. Применение метода ARFIMA(p,q,d) для прогнозирования мультисервисного трафика

Применение методов прогнозирования позволяет заранее узнать, какую пропускную способность нужно будет выделить для обслуживания поступающего трафика. Существует несколько общепризнанных методов прогнозирования временных рядов. Методы Бокса-Дженкинса (ARIMA), в отличие от других методик прогнозирования, не предусматривают какой-либо четкой модели для прогнозирования данной временной серии. Задается только общий класс моделей, описывающих временной ряд и позволяющих определенным образом выражать текущее значение переменной через ее предыдущие значения. Затем алгоритм, подстраивая внутренние параметры, сам выбирает наиболее подходящую модель прогнозирования. Подход ARFIMA позволяет прогнозировать процессы с долговременной памятью, то есть может быть использован для прогнозирования трафика, имеющего зависимость между достаточно удаленными во времени отсчетами. Для реализации этого метода оценивается стационарность процесса, при необходимости ряд преоразовывается к стационарному виду, затем определяются параметры авторегрессионной составляющей p, скользящего среднего q (по поведению нормированной АКФ) и дробно-интегрованной составляющей d (по методу Уиттла) [3, 14].

ARFIMA(p,q,d)-модель может быть описана как [3]:

Первым шагом при создании ARFIMA(p,q,d)-модели является определение параметров p, q, и порядка интегрированности ряда d. Параметр d может принимать все значения от 0 до 1. Случай d=0 отвечает короткой памяти ряда, при d=1 можно сделать вывод о бесконечной памяти. Для определения параметра d для ARFIMA-модели используется метод Виттла (Whittle), основанный на трансформации входних данних за за счет их аппроксимации. Метод основан на поиске минимума функции R(d) по формуле:

Основная проблема в процесcе прогнозирования временных рядом состоит в определении параметров данной модели. При расчете p и q используются характеристики нормированной АКФ. Другими словами, строится ARMA(p,q)-модель исследуемого временного ряда с заданными параметрами, а потом строится нормированная АКФ для этой реалізации. По поведению АКФ принимают решение о наилучшем выборе пары p и q. Желательным поведением нормированной АКФ является быстрое затухание. При этом также оценивается эффективность увеличения коэффициента затухания АКФ при изменении параметров p и q по причине того, что большие ее значения приводят к увеличению вычислительного процесса. Поэтому преимущество отдается моделям с наименьшим значением этих параметров. Рассчитанные параметы авторегрессионной составляющей и скользящего среднего модно использовать во всех вышеописанных моделях. Алгоритм выбора оптимпльного быстрого затухания нормированной автокорреляционной функции строится на расчете площади фигуры АКФ, которая должна быть минимальной.

В качестве трафика для анализа был выбран трафик HTTP запросов к веб-серверу космического центра Кеннеди, NASA в течение 1 месяца [15]. При рассмотрении трафика в исходном виде зависимость следующего значения от предыдущего практичеки невозможно проследить. Поэтому проагрегируем реализацию с разными периодами агрегации, где зависимость становится существенной. Наибольший показатель параметра Херста (0,9) получен для трафіка с периодом дискретизации 6 часов. Агрегированные данные представлены на рис. 2.

Рисунок 2 – График нагрузки на веб-сервер с периодом дискретизации 6 часов.

Как видим, такой трафик имеет заметную суточную и недельную цикличность. Т.е., имеет нестационарную нагрузку, которая характеризуется свойствами самоподобия и долгосрочной памяти. Для данних условий наиболее подходящей моделью прогнозирования является ARFIMA(p,q,d).

Для выбора параметров авторегрессионной составляющей p и скользящего среднего q была найдена площадь нормированной АКФ для каждой пары параметров: p[1; 10] и q[1; 10].

Рисунок 3 – График изменения площади нормированной АКФ от параметров p и q.

На рис. 3 видно, что наименьшая площадь, занимаемая АКФ, получена для значений p=6, q=10. Значенние параметра d для модели ARFIMA рассчитывается с использованием метода Виттла и зависит от входных данных. Рассчитанное значение q=0,161. С использованием рассчитанных значений параметров модели ARFIMA получено прогнозное значение месячного трафика с периодом дискретизации 6 часов и проведено сравнение с графиком реальной нагрузки (рис. 4).

Рисунок 4 – Сравнительный график реального и прогнозного трафика (синим цветом - график прогноза, красным - реальной нагрузки).

По приведенному графику можно увдеть высокое качество прогноза с использованием модели ARFIMA. Длительность достоверного прогноза для модели составляет больше 85 отсчетов с периодом дискретизации 6 часов, т.е. 510 часов или 21 сутки. Это подтверждает то, что ARFIMA-модели являются удобным инструментом анализа таких временных рядов с долгосрочной памятью. Для большей нагляжности результата на рис. 5 приведен график ошибки прогнозирования.

Рисунок 5 – График ошибки прогнозирования.

Видим, что прогнози является достоверным на достаточно большом промежутке времени. На основе приведенных выше размышлений можно рассматривать использование ARFIMA-моделей как один из наиболее современных и актуальных подходов к изучению временных рядов.

Выводы

Рассмотрено использование алгоритма ARFIMA для трафика HTTP запросов к веб-серверу космического центра. Анализ трафика выявил фрактальные свойства (схожесть АКФ при разных периодах агрегации) и долгосрочную память при плавно затухающей АКФ. Был определен показатель самоподобия для агргации с периодом дискретизации 6 часов - параметр Херста равен 0,9, что доказывает высокую степерь самоподобия процесса. Выбраны параметры модели ARFIMA p=6 и q=10 на основе площади АКФ, рассчитан параметр d=0,161 по методу Виттла и произведена программная реализация модели. Предложенный алгоритм дает достоверный прогноз на протяжении 21 суток, что говорит об эффективности использования метода ARFIMA для прогнозирования трафика мультисервисных сетей с высокой степенью самоподобия и долгосрочной памятью.

Перечень ссылок

  1. Рейтинг ТАСС-Телеком [электронний ресурс], 2012. – Режим доступа: http://tasstelecom.ru/news/one/14078.
  2. Cisco Visual Networking Index: Forecast and Metodology, 2011-2016 [электронний ресурс]. – Режим доступа: http://www.cisco.com/en/US/solutions/collateral/ns341/ns525/ns537/ns705/ns827/white_paper_c11-481360_ns827_Networking_Solutions_White_Paper.html.
  3. Костромицкий А.И. Подходы к моделированию самоподобного трафика / А.И. Костромицкий, В.С. Волотка // Восточно-Европейский журнал передовых технологий. – 2010.
  4. Цыбаков Б.С. Модель телетрафика на основе самоподобного случайного процесса/ Цыбаков Б.С. – Радиотехника-№5, 1999 г.
  5. Шелухин О.И. Самоподобие и фракталы. Телекоммуникационные приложения/ Шелухин О.И., Осин А.В., Смольский С.М. – М.: ФИЗМАТЛИТ. 2008. – 368 с.
  6. Шелухин, О. И. Мультифракталы. Инфокоммуникационные приложения приложения / О. И. Шелухин . – М.:Горячая Линия –Телеком, 2011. – 578 с.
  7. Петров В.В. Структура телетрафика и алгоритм обеспечения качества обслуживания при влиянии эффекта самоподобия : Диссертация на соискание ученой степени кандидата технических наук / Петров В.В. — М., 2004. — 199 с.
  8. Тихонов Э. Я. Методы прогнозирования в условиях рынка: Учебное пособие./ Тихонов Э. Я. – Невинномысск, 2006.– 221 с.
  9. Box E.P.G. Time series analysis : forecasting and control / Box E.P.G., Jenkins G.M., Reinsel G.C. — Prentice-Hall, 1994. — 598 p.
  10. Granger, C.W.J. An Introduction to Long-Memory Time Series Models and Fractional Differencing [Текст] / C.W.J. Granger, R. Joyeux // Journal of Time Series Analysis. – 1980. – N 1(1).
  11. Жалейко Е.В. Методы моделирования самоподобного трафика/ Жалейко Е.В.//Материалы 7-й Международной молодежной научно-технической конференции «Современные проблемы радиотехники и телекоммуникаций» (направление №2 – «Телекоммуникационные системы и сети»). – Севастополь, 2011.
  12. Шепеленко А. Г. Спосіб оцінки параметра Херста для трафіку IP-мереж /Шепеленко А. Г. Дегтяренко І. В.// Вісник Вінницького політехнічного інституту. – Вінниця, 2007. – №5(157). – С. 157-160.
  13. Чекунков О.С. Дослідження системи прогнозування навантаження на елементи телекомунікаційної мережі, побудованої на основі нейронної мережі прямого поширення/ Чекунков О.С. – Матеріали збірника наукових праць ХІI науково?технічної конференції аспірантів та студентів «Автоматизація технологічних об’єктів та процесів. Пошук молодих». – Донецьк, 2012. – С. 114-117.
  14. Перцовский О.Е. Моделирование валютных рынков на основе процессов с длинной памятью: Препринт WP2/2004/03 – М.: ГУ ВШЭ, 2003. – с. 15-17.
  15. Two traces contain two month's worth of all HTTP requests to the NASA Kennedy Space Center WWW server in Florida [электронный ресурс]. – Режим доступа: http://ita.ee.lbl.gov/html/contrib/NASA-HTTP.html.