Автор: Фелижанко А.
Источник: Журнал Первая миля
. – 2011. – №6. – С. 20-23
Фелижанко А. Использование возможностей MatLAB для моделирования и анализа физических каналов LTE. Автор описывает оптимизации мобильного трафика при помощи алгоритма TPO, реализованного в многофункциональной платформе Cisco ASR 5000 и позволяющего существенно улучшить качество предоставляемых услуг без модернизации оборудования радиосети
Полагаясь на надежность механизмов более низких уровней модели взаимодействия открытых систем, присущую проводным сетям, протокол TCP предполагает, что любая потеря пакетов данных вызвана сетевыми перегрузками (т.е. переполнением буферов сетевых устройств), и начинает предпринимать меры по их предотвращению. Базовый механизм борьбы с перегрузками в TCP основан на управлении размером так называемого окна перегрузки, то есть тем объемом данных, которое отправитель передает в сеть за один раз. В начальной фазе TCP прощупывает
полосу пропускания, доступную для соединения. В этот период работает алгоритм медленного старта, при котором размер окна перегрузки экспоненциально растет от начального значения, равного размеру одного максимального сегмента ТСР, до установленного порогового значения. Затем, в фазе предотвращения перегрузок, размер окна растет линейно. Если в течение определенного интервала (таймаута) передающее устройство не получило подтверждение приема пакета, новое пороговое значение устанавливается в половину текущего окна перегрузки, само окно перегрузки уменьшается до начального значения и работа алгоритма начинается сначала. Если потерь пакетов не происходит, размер окна перегрузки вырастает до размера окна, объявленного получателем, и отправитель начинает передавать в сеть объем данных, соответствующих возможностям их получателя. И так до очередной потери пакета. Очевидно, что чем чаще срабатывет базовый механизм борьбы с перегрузками, тем больше провалов в скорости передачи и тем менее эффективно используется доступная для соединения полоса пропускания.
В отличие от проводных сетей, в беспроводных каналах связи кратковременные периоды потерь пакетов или резкого роста задержки их доставки зачастую вызваны не перегрузкой сети. Они могут быть связаны с кратковременными изменениями условий в радиоканале, особенно с учетом мобильности абонентов. Это замирания, помехи, выход абонентов из зоны радиовидимости (например, при проезде через туннель или в лифте), перемещение абонентов между соседними базовыми станциями. Свою роль играют повторные передачи пакетов протоколами канального уровня; процедуры приоритезации трафика в промежуточных узлах, например в базовых станциях LTE (eNodeB), в результате чего остальные услуги могут испытывать вариацию задержки и т.п. Эти спорадические события приводят к включению достаточно консервативного базового механизма управления перегрузками TCP, что влечет заметное снижение эффективности его работы и негативно сказывается на фактической пропускной способности: растет время открытия веб-страниц, скачивания файлов и т.д., а полоса пропускания радиосети используется не полностью.
Одним из путей выхода из этой ситуации может быть установка некого посредника (прокси), который разбивает соединение TCP между клиентом на абонентском устройстве и сервером TCP на две независимые части – беспроводную
и проводную
. Этот посредник интеллектуально управляет перегрузками в беспроводной части соединения. Поскольку основной объем трафика в Интернете передается в направлении от сервера к клиенту, на беспроводной части соединения в сторону абонента отправитель TCP-потоков такого посредника волен применять любые алгоритмы управления размером своего окна перегрузки. Получателю TCP-потоков на абонентском устройстве до этого нет никакого дела, он ведет себя обычным образом, и каких-либо модификаций стандартного стека TCP в нем не требуется.
Именно на этих принципах основана реализация функциональности Traffic Performance Optimization (TPO) в многофункциональной платформе Cisco ASR 5000, когда она выступает в качестве шлюзового узла GGSN сети 3G или в качестве шлюза PDN Gateway (PGW) пакетного ядра сети LTE. В проводной части соединения между TCP-прокси на GGSN/PGW и сервером TCP в Интернете работает обычный протокол TCP. А на беспроводной между TCP-прокси и клиентом TCP на абонентском устройстве – оптимизированный TCP.
Оптимизация TCP затрагивает различные аспекты протокола, начиная от процедур установления соединения и медленного старта до управления перегрузками в различных ситуациях. Так, для управления размером окна перегрузки и выбора порогового значения для медленного старта после наступления таймаута используются методы TCP Reno, TCP Vegas или TCP Westwood+. Эти методы учитывают динамику изменения времени прохождения пакетов в прямом и обратном направлениях (RTT), а также оценку доступной для соединения полосы пропускания (как результат мониторинга интенсивности получения подтверждений доставки данных). Они по различным признакам пытаются предугадать момент наступления перегрузки, чтобы предпринять превентивные меры, а также понять причину потери пакета – действительно ли она произошла в результате перегрузки сети (переполнение буферов сетевых устройств) или это следствие аномалий в беспроводном канале. Для более тонкого управления перегрузками используются эвристические алгоритмы, учитывающие параметры качества обслуживания абонента, в частности величину гарантированной полосы пропускания (GBR) для конкретного соединения. Кроме того, работа алгоритмов корректируется при получении шлюзом PGW извещений о хэндовере абонента между базовыми станциями – как технологически одной и той же сети (например, переход между базовыми станциями LTE), так и между сетями с различными технологиями (например, из LTE в 3G).
Лабораторные исследования показывают, что при работе TPO при беспроводном соединении с задержкой 100 мс и полосой пропускания 1 Мбит/с при доле потерь пакетов 0,5% фактическая пропускная способность канала увеличивается более чем на 30% по сравнению с базовым алгоритмом ТСР и приближается к теоретической. При доле потерь пакетов 1% она увеличивается почти на 60%.
Другой аспект работы TPO в платформе Cisco ASR 5000 связан с оптимизацией трафика HTTP. Веб-страницы зачастую не адаптированы к особенностям беспроводных сетей, приложения на абонентских устройствах делают множество служебных запросов к серверам DNS для разрешения доменных имен в адреса IP, серверы контента не всегда понимают, что запросы идут от мобильных устройств и не подстраивают контент соответствующим образом. Логичным было бы оптимизировать трафик HTTP в шлюзах GGSN или PGW. Именно это и реализовано в Cisco ASR 5000. Если контент на веб-сервере текстовый, а браузер на абонентском устройстве способен принимать сжатые данные, TPO будет сжимать содержимое страниц HTML и передавать их в сторону абонента в формате gzip. Как показывает практика, экономия полосы пропускания в радиоканале от такой компрессии составляет в среднем 30–40%. Это с учетом того, что формат JPEG уже сжат: текстовые страницы без JPEG сжимаются до 70%.
Если страница HTML в ответе веб-сервера содержит ссылки на вспомогательные ресурсы, например на изображения JPEG, алгоритм TPO будет сам разрешать доменные имена в ссылках URL и переписывать их на адреса IP, чтобы минимизировать число обращений браузера на абонентском устройстве к серверу DNS. Если же в страницу встроена реклама в виде изображения или Flash-объекта, TPO будет ее блокировать с возможностью последующей загрузки по запросу (on-click). Эффективность этих методов во многом зависит от сайта, к которому обращается абонент. При включенной оптимизации HTTP время открытия страниц, например на сайте CNN.com, сокращается почти в полтора раза, число запросов DNS со стороны абонента – на треть, а эффект от компрессии страниц достигает 35%.
Еще один аспект оптимизации использования радиоресурсов связан с мобильным видео. В соответствии с исследованием Прогноз развития мирового мобильного трафика на 2010–2015 годы
компании Cisco, трафик видеоданных к 2015 году будет составлять 2/3 в общем мобильного трафика. Для распознавания видеозапросов со стороны абонентов шлюз мобильного видео в Cisco ASR 5000 использует глубокую инспекцию пакетов. Эти запросы могут быть переадресованы на вспомогательный сервер адаптации видеоконтента, причем шлюз может выполнять балансировку видеозапросов HTTP между серверами адаптации, входящими в кластер. Сервер адаптации контента передает в сторону абонента уже оптимизированное, например транскодированное, видео. В шлюзе также учитываются правила обработки видеотрафика, в которых может быть указано, какой трафик и для каких абонентов подлежит оптимизации средствами самого шлюза, а какие видеоклипы следует пропускать в исходном виде. Логично, что функциональность шлюза мобильного видео в сети 3G включается на GGSN, а в сети LTE – на PGW. Она дополняет алгоритм TPO и автоматически активирует функцию ТСР-прокси и оптимизации TCP, в том числе для оценки доступной полосы пропускания в беспроводной части соединения.
Среди процедур обработки видеотрафика, которые могут быть реализованы в аппаратуре шлюзов, отметим динамический трансрейтинг(transrating) и пэйсинг (video pacing). Трансрейтинг позволяет в реальном масштабе времени снижать скорость загружаемого видеопотока до величины, поддерживаемой конкретной беспроводной сетью. Например, этот механизм позволяет снижать частоту кадров с 25 и 30 кадров/с (для PAL и NTSC, соответственно,) до 8, 12 или 15, достаточных для воспроизведения видео на мобильном устройстве с относительно небольшим экраном без сколько-нибудь заметного ухудшения качества, но со значительной экономией полосы пропускания в радиосети.
Видеопэйсинг позволяет привести в соответствие скорость загрузки видео со скоростью его воспроизведения на мобильном устройстве. Речь идет о просмотре видеоклипов, прогрессивно загружаемых и просматриваемых через HTTP, например с YouTube. Как правило, видеоданные сначала загружается в буфер устройства, а затем при достаточном его заполнении начинают проигрываться. Если скорость загрузки превышает скорость воспроизведения, буфер в процессе просмотра заполняется полностью. Однако по статистике просмотров короткого (порядка 4 мин) видео, характерного для YouTube, 20% зрителей прекращает просмотр видеоклипов через 10 с или менее, треть – через 30 с и менее, 44% – через 1 мин, а 60% – через 2 мин просмотра. Как следствие, полоса пропускания в радиосети расходуется впустую. Видеопэйсинг же позволяет значительно сократить объем видеотрафика. Опытная эксплуатация шлюза мобильного видео на платформе Cisco ASR 5000 в сети одного из ведущих операторов мобильной связи США подтвердила, что только за счет видеопэйсинга объем видеотрафика в радиосети сократился на 26%, а общий объем мобильного трафика, в состав которого входил и видеотрафик, – на 6%. И все это без каких-либо нареканий на качество видео со стороны абонентов.
В заключение отметим, что в результате работы описанных методов оптимизации мобильного трафика у абонентов создается лучшее впечатление о качестве предоставляемых услуг. Кроме того, отодвигаются сроки или вообще ставится под сомнение целесообразность дополнительных инвестиций в немедленное увеличение мощности радиосети, что, как правило, является первой реакцией оператора на появление перегрузок и жалоб со стороны абонентов.