Реферат по теме выпускной работы

Содержание

Введение
1. Актуальность темы
2. Цель и задачи исследования
3. Обзор источников
3.1 Обзор русскоязычных источников
3.2 Обзор международных источниковв
4. Разработка структуры канала связи VoIP
4.1 Общая структура канала связи VoIP
4.2 Детектор речевой активности (VAD)
4.3 Оценка качества речи
Выводы
Список источников

Введение

Интерес различных субъектов рынка телекоммуникационных услуг (операторов связи, провайдеров Интернет, производителей оборудования и пользователей) к VoIP в последние годы необычайно возрос в связи с разработкой новых стандартов и протоколов, когда качество разговора через IP-сеть вплотную приблизилось к телефонному разговору по «классическим» телефонным сетям. Этот интерес объясняется тем, что IP-телефония позволяет существенно экономить требуемую полосу пропускания каналов, что неизбежно ведет к снижению тарифов, особенно на междугородные и международные телефонные разговоры. Также, при скоротечном развертывании сетей нового поколения (NGN), в которых предоставляется преимущественно услуга Triple Play (Передача данных, IPTV, VoIP), проблема качественной передачи голоса становится наиболее острой.

1. Актуальность темы

Для грамотного построения сети, где будет использоваться услуга VoIP, необходимо обеспечить все нормы параметров качества обслуживания (QoS). Также необходимо обеспечить безошибочную передачу речи в канале связи VoIP при разноплановых окружающих шумах.

Магистерская работа посвящена актуальной задаче выбора параметров сети, которые воздействуют на показатели качества обслуживания, а также улучшению специфических компонентов услуги VoIP, таких как эхокомпенсатор и детектор речевой активности (VAD).

2. Цель и задачи исследования

Целью исследования является повышение параметров качества предоставления услуги VoIP за счет выработки рекомендаций по настройке параметров элементов телекоммуникационной сети.

Основные задачи исследования:

Анализ существующих решений по организации услуги VoIP.
Выбор математического аппарата и средств имитационного моделирования канала связи VoIP.
Разработка и исследование модели канала связи VoIP.
Исследование критериев оценки качества предоставления услуги VoIP.
Оценка эффективности разработанных средств и предоставление рекомендаций.

Объект исследования: модель речевого канала связи VoIP.

Методы исследования. В работе используется имитационное моделирование работы речевого канала связи VoIP. Также используется математический аппарат вейвлет-преобразования для улучшения эхокомпенсатора и детектора речевой активности. Используется аппарат спектрального анализа. Используются методы планирования и анализа результатов эксперимента.

Планируемая научная и техническая новизна:

Создание имитационной модели речевого канал связи VoIP, учитывающей влияние показателей качества обслуживания.
Разработка критериев оценки качества услуги VoIP, учитывающих показатели качества обслуживания (MOS, E-model, функции полезности, комбинированный метод).
Предоставление рекомендаций по настройке параметров речевого канала VoIP.

3. Обзор источников

3.1 Обзор русскоязычных источников

Анализ работы речевого канала связи VoIP проводится в работах Рослякова А.В., Полканова Е.И., Галичского К. [1–3], где описывается общая структура канала связи VoIP, излагается принцип работы основных протоколов, по которым работает IP-телефония. Также в публикации Кофанова Н.С. «Расчет пропускной способности канала связи VoIP трафика с использованием различных кодеков» [4] приводится ряд показателей пропускной способности разнообразных речевых кодеков. В работе Бобрицкого С.М. «Алгоритм оценки качества передачи речи с анализом характеристик эффективных потерь пакетов на основе вейвлет-преобразования» [5] приводятся различные критерии оценки качества речи в канале связи VoIP.

3.2 Обзор международных источников

В англоязычных источниках по данной теме посвящено большее количество работ. В публикации К. Салаха «Deploying VoIP in Existing IP Networks» [6] приводится специфика внедрения услуги VoIP в уже существующую IP-сеть. В работе Н. Унут «What Affects Voice Quality in VoIP Calls» [7] описываются компоненты, которые влияют на качество передаваемой речи. В работе Л. Динга «Speech Quality Prediction in VoIP Using the Extended E-Model» [8] описывается один из объективных методов оценки качества речи (E-модель).

4. Разработка структуры канала связи VoIP

4.1 Общая структура канала связи VoIP

Для оценки качества предоставляемой услуги VoIP необходимо разработать математическую модель речевого канала связи. Типовая структура канала связи VoIP приведена на рисунке 1.

Рисунок 1 – Структура речевого канала в сети VoIP
(анимация: 12 кадров, 7 циклов повторения, 30 килобайт)

Аналоговый речевой сигнал, поступающий от микрофона абонента А, при помощью аналого-цифрового преобразователя (ADC) преобразуется в цифровой поток (обычно со скоростью 64 кбит/с). На последующей стадии происходит удаление шумов и процесс эхоподавления. Далее данные в цифровой форме сжимаются кодирующим устройством до скоростей 16, 8 или 6,3 кбит/c. Формируются пакеты, к которым добавляются заголовки протоколов, и передаются через IP-сеть в систему IP-телефонии абонента Б. Сначала происходит накопление пакетов в джиттер-буфере для устранения влияния джиттера, возникающих при прохождении пакетов через IP-сеть, стираются заголовки. Если часть пакетов было потеряно, то происходит интерполяция серии пакетов, поступивших в накопитель. Далее речевые данные декодируются, преобразуются в аналоговую форму с помощью цифро-аналогового преобразователя (DAC) и поступают на динамик абонента Б [1].

Каждый из компонентов речевого канала связи VoIP, так или иначе, будет вносить определенные коррективы в показатели качества обслуживания (QoS). На речевой сигнал, при прохождении через систему, будут влиять такие параметры, как задержка, джиттер и вероятность потерь. Следует отметить, что показатель пропускной способности в данной работе не учитывается – им можно пренебречь, так как пропускная способность современных каналов связи гораздо больше требуемой для услуги VoIP. Специфическими проблемами предоставления услуги VoIP являются шумоподавление и эхокомпенсация.

4.2 Детектор речевой активности (VAD)

Для шумоподавления используется устройство детектирования голосовой активности (Voice Activity Detection, VAD). VAD представляет собой апаратний или программный модуль, который фиксирует голос на входном акустическом канале и отделяет его от фонового шума. VAD также способствует экономии ресурсов канала: если речевой сигнал в данный момент времени не поступает, то данные в сеть не передаются. В противном случае, при отсутствии VAD, в сети передаются данные о шуме, который увеличивает объем передаваемой информации в канале.

Область применения детекторов речевой активности также включает устройства для аудио конференций, слуховые аппараты, бортовые системы безопасности полетов. Типовая структурная схема VAD изображена на рисунке 2.

Рисунок 2 – Структурная схема VAD

На вход системы поступает входящий речевой сигнал с микрофона f(t). Элемент «Определение наличия шума» определяет наличие шума во входном сигнале. Эта процедура выполняется с помощью различных алгоритмов обнаружения порога шума и речи. Примером являются алгоритмы, основанные на информационном подходе (применение расчета энтропии сигнала) или статистической модели (постановка гипотез о наличии шума или языка). После того, как шум обнаружено, рассчитывается его спектр и происходит вычитание спектра шума от спектра входного сигналу. На выходе системы получаем сигнал f '(t), который содержит только язык.

Общим свойством VAD-алгоритмов является то, что они включают в себя обучение (вычисление характеристик шума) и спектральное вычитание. Чаще всего в качестве признаков, определяющих начало и конец слова, избираемых энергетические и спектральные характеристики сигнала, а также число переходов через нуль [8–9].

Модель VAD с использованием вейвлет-преобразования была разработана в среде matlab (Приложение А). Также использовался wavelet toolbox данной среды. На вход модели поступает зашумленный звуковой wav сигнал с частотой дискретизации 44100 Гц – это слова «you'll see very soon», произнесенные женским голосом.

Длительность сигнала – 3 секунды. Каждый фрейм содержит 454 отсчета (20 мс при частоте дискретизации 44100 Гц). В качестве шума в программе используется функция matlab awgn с вариативным равным отношение сигнал-шум (SNR).

Алгоритм работы модели выполняется в три этапа (рис. 3).

Рисунок 3 – Схема работы модели

На блок «Обучение системы» поступает входящий зашумленный сигнал f (t). В качестве шума используется Гауссов белый шум. Известно, что первые пять фреймов сигнала содержат языка и представляют собой шум. На этом этапе определяется среднее значение спектральной энтропии H(f_threshold) первых пяти фреймов и обозначается как предельное.

В блоке «Классификация фреймов» рассчитывается спектральная энтропия следующих фреймов и сравнивается по предельному значению:

где – спектральная плотность k-ой компоненты спектра, Xk – спектральные коэффициенты БПФ, или вейвлет-коэффициенты [4–5].

где n – спектральная энтропия n-го фрейма.

В блоке «Вычитание спектра шума» происходит вычитание детализирующих коэффициентов шума из входного сигнала.

В качестве критерия эффективности в работе выступает вероятность верного определения фрейма, содержащий голос, при заданном уровне отношения сигнал- шум:

В ходе эксперимента изменялось значение отношения сигнал-шум от 0 до 50 dB с шагом 5 dB. Результаты исследования изображены на рисунке 4.

Рисунок 4 – График зависимости вероятности верного определения голосового фрейма P_voice от отношения сигнал-шум (SNR)

Как видно из результатов исследования, выигрыш применения вейвлет-преобразования вместо быстрого преобразования Фурье в энтропийном методе распознавания речи составляет до 20%. Этот выигрыш замечается при относительно шумном сигнале – при отношении сигнал-шум менее, чем 15 dB. Однако, более комплексный подход расчета порога детектора G.729 дает выигрыш до 20% над предложенной в данной работе системой.

4.3 Оценка качества речи

Субъективная оценка качества обслуживания при передаче речи.

Первичным критерием качества аудио- и видеоинформации является восприятие качества услуги пользователем. Определение качества услуг может базироваться как на субъективных, так и на объективных оценках. Наиболее широко используемая методика субъективной оценки качества описана в Рекомендации МСЭ Р.800 (первоначальная редакция относится к 1993 г.) и известна как методика MOS (Mean Opinion Score). В СЕТИ Вестник связи № 2’2008 2 соответствии с ней качество речи, получаемое при прохождении сигнала от говорящего (источник) через систему связи к слушающему (приемник), оценивается как арифметическое среднее от всех оценок, выставляемых экспертами после прослушивания тестируемого тракта передачи.

Экспертные оценки определяются в соответствии со следующей пятибалльной шкалой: 5 — отлично, 4 — хорошо, 3 — приемлемо, 2 — плохо, 1 — неприемлемо. Оценки 3,5 балла и выше соответствуют стандартному и высокому телефонному качеству, 3,0 — 3,5 — приемлемому качеству, 2,5 — 3,0 — синтезированному звуку. Для передачи речи с хорошим качеством целесообразно ориентироваться на значения MOS не ниже 3,5 баллов.

Хотя методика MOS, основанная на субъективных оценках, является достаточно надежным инструментом в телефонных сетях, в ней отсутствует возможность количественно учесть влияющие на качество речи факторы. В частности, не учитываются:

Сквозная (end-to-end) задержка между говорящим по телефону и слушающим.
Влияние вариации задержки (джиттера).
Влияние потерь пакетов.

Объективная оценка качества обслуживания при передаче речи в пакетных сетях.

Для преодоления указанных недостатков в 1998 г. МСЭ принял Рекомендацию G.107, в которой был описан подход к объективной оценке качества услуг в телекоммуникациях. В его основу положена так называемая Е-модель, которая открыла новое направление в оценке качества услуг, связанное с измерением характеристик терминалов и сетей. После создания Е-модели было проведено большое число испытаний, в которых менялся уровень воздействия искажающих сетевых факторов. Данные этих тестов были использованы в Е-модели для вычисления объективных оценок. Результатом вычислений в соответствии с Е-моделью является число, называемое R-фактором («коэффициентом рейтинга»). Значения R-фактора однозначно сопоставляются с оценками MOS (см. рис. 5).

Рисунок 5 – Зависимость между оценками MOS и R-фактором

В соответствии с E-моделью R-фактор определяется в диапазоне значений от 0 до 100, где 100 соответствует самому высокому уровню качества. При расчете R-фактора учитываются 20 параметров, в числе которых:

Однонаправленная задержка.
Коэффициент потери пакетов.
Потери данных из-за переполнения буфера джиттера.
Искажения, вносимые при преобразовании аналогового сигнала в цифровой и последующем сжатии (обработка сигнала в кодеках).
Влияние эхо и др.

Таким образом, Е-модель и R-фактор могут быть использованы для объективной оценки качества передачи речи в технологии VoIP. Как только R-фактор получен, могут быть вычислены соответствующие оценки MOS. Вычисление R-фактора начинается для случая, когда искажения сигнала в канале не учитываются, а принимаются во внимание искажения, которые имеют место при преобразовании реальной речи в электрический сигнал (и обратно). Теоретическое значение R-фактора уменьшается от 100 до 93,2, что соответствует оценке MOS, равной 4,4. Таким образом, при использовании Е-модели оценка 4,4 в системе MOS является максимально возможной оценкой качества речи в сети без искажений. Величина R-фактора меняется от 0 до 93,2, что соответствует изменению оценок MOS от 1 до 4,4. Значение R-фактора определяется по следующей формуле:

R = Rо — Is — Id — Ie + A,

где: Ro = 93,2 — исходное значение R-фактора; Is — искажения, вносимые кодеками и шумами в канале; Id — искажения за счет суммарной сквозной задержки («из конца в конец») в сети; Iе — искажения, вносимые оборудованием, включая и потери пакетов; А — так называемый фактор преимущества.

Выводы

Для качественного представления услуги VoIP в современных сетях необходимо обеспечить все требования качества обслуживания (QoS). Для этого необходимо дать ряд рекомендаций по настройки сети, а также модернизировать специфические компоненты, присущие данной услуги (детектор речевой активности, эхокомпенсатор).

В рамках проведенных исследований выполнено:

Разработана модель речевого канала связи VoIP.
Разработана и исследована модель речевого детектора (VAD) с использованием вейвлет-преобразования.
Рассмотрены существующие методы оценки качества передаваемой речи.

Дальнейшие исследования направлены на следующие аспекты:

Разработка и исследование эхокомпенсатора.
Комплексная оценка качества предоставления услуги VoIP, предоставление рекомендаций по настройке сети.

На момент написания данного реферата квалификационная работа магистра еще не завершена. Дата окончательного завершения работы: декабрь 2012 года. Полный текст работы и материалы по теме могут быть получены у автора или его руководителя после указанного срока.

Список источников

Росляков А.В., Самсонов М.Ю., Шибаева И.В. IP-телефония // Эко-Трендз, 2-е издание. – 2003. – 468 с.
Полканов Е.И., Шнепс-Шнеппе М.А., Крестянинов С.В. Интеллектуальные сети и компьютерная телефония // Радио и связь – 2001. – 240 с.
Галичский К. Компьютерные системы в телефонии // BHV Санкт-Петербург. – 2002. – 400 с.
Кофанов Н.С. Расчет пропускной способности канала связи VoIP трафика с использованием различных кодеков. [Электронный ресурс]. – Режим доступа: http://www.sworld.com.ua/index.php/ru/technical-sciences....
Бобрицкмй С.М.«Алгоритм оценки качества передачи речи с анализом характеристик эффективных потерь пакетов на основе вейвлет-преобразования. [Электронный ресурс]. – Режим доступа: http://scipeople.ru/publication/107179.
Salah K. Deploying VoIP in Existing IP Networks. [Электронный ресурс]. – Режим доступа: http://www.techrepublic.com/whitepapers....
Unuth N. What Affects Voice Quality in VoIP Calls. [Электронный ресурс]. – Режим доступа: http://voip.about.com/od/voipbasics....
Ding. L. Speech Quality Prediction in VoIP Using the Extended E-Model. [Электронный ресурс]. – Режим доступа: http://ieeexplore.ieee.org/xpl....
Kung-Ching Wang. Robust Voice Activity Detection Based on Discrete Wavelet // Department of Information Technology & Communication. – Shin Chien University. – 2007. – 13 с.
R. Venkatesha Prasad, Abhjeet Sangwan, Vishal Guarav. Comparsion of Voice Activity Detection Algorithms for VoIP // CEDT. – Indian Institute of Science. – 2002. – 6 с.
Добеши И. Десять лекций по вейвлетам // Регулярная и хаотическая динамика. – Ижевск. – 2001. – 464 с.
Смоленцев Н.К. Основы теории вейвлетов. Вейвлеты в Matlab // – ДМК. – Москва. – 2005. – 304 с.

Будишевский Денис Сергеевич

Факультет компьютерных иформационных технологий и автоматики

Кафедра автоматики и телекоммуникации

Специальность «Телекоммуникационные системы и сети»

Разработка и исследование речевого канала связи в сетях VoIP

Научный руководитель: к.т.н., доц. Дегтяренко Илья Вячеславович