ДонНТУ   Портал магістрів

Реферат за темою випускної роботи

Зміст

Вступ

Інтерес різних суб’єктів ринка телекомунікаційних послуг (операторів зв’язку, провайдерів Інтернет і користувачів) до VoIP в останні роки надзвичайно зріс у зв’язку з розробкою нових стандартів і протоколів, коли якість зв’язку через IP-мережу впритул наблизився до телефонної розмови по “класичним” телефонним мережам. Цей інтерес пояснюється тим, що IP-телефонія дозволяє значно економити необхідну смугу пропускання каналів, що неминуче веде до зниження тарифів, особливо на міжміські та міжнародні телефонні розмови. Також, при швидкому розгортанні мереж нового покоління (NGN), в яких надається переважно послуга Triple Play (Передача даних, IPTV, VoIP), проблема якісної передачі мови стає найбільш гострою.

1. Актуальність теми

Для грамотної побудові мережі, де буде використовуватися послуга VoIP, необхідно забезпечити всі норми параметрів якості обслуговування (QoS). Також необхідно забезпечити безпомилкову передачу мови в каналі зв’язку VoIP при різнопланових оточуючих шумах.

Магістерська робота присвячена актуальній задачі вибору параметрів мережі, які впливають на показники якості обслуговування, а також поліпшенню специфічних компонентів послуги VoIP, таких як ехокомпенсатор і детектор мовної активності (VAD).

2. Мета і задачі дослідження

Мета роботи: підвищення параметрів якості надання послуги VoIP за рахунок вироблення рекомендацій з налаштування параметрів елементів телекомунікаційної мережі.

Задачі роботи:

  1. Аналіз існуючих рішень по організації послуги VoIP.
  2. Вибір математичного апарату і засобів імітаційного моделювання каналу зв’язку VoIP.
  3. Розробка і дослідження моделі каналу зв’язку VoIP.
  4. Дослідження критеріїв оцінки якості надання послуги VoIP.
  5. Оцінка ефективності розроблених засобів і надання рекомендацій.

Об’єкт дослідження : модель мовного каналу зв’язку VoIP.

Методи дослідження. У роботі використовується імітаційне моделювання роботи мовного каналу зв’язку VoIP. Також використовується математичний апарат вейвлет-перетворення для поліпшення показників ехокомпенсатора і детектора мовної активності. Використовується апарат спектрального аналізу. Використовуються методи планування й аналізу результатів експерименту.

Передбачувана наукова і технічна новизна:

  1. Імітаційна модель мовного канал зв’язку VoIP, що враховує вплив показників якості обслуговування.
  2. Критерії оцінки якості послуги VoIP, що враховують показники якості обслуговування (MOS, E-model, функції корисності, комбінований метод).
  3. Надання рекомендацій по налаштуванню параметрів мовного каналу VoIP.

3. Огляд джерел

3.1 Огляд російськомовних джерел

Аналіз роботи мовного каналу зв’язку VoIP проводиться в роботах Рослякова А.В., Полканова Є.І., Галицького К. [1–3], де описується загальна структура каналу зв’язку VoIP, викладається принцип роботи основних протоколів, за якими працює IP-телефонія . Також в публікації Кофанова Н.С. “Розрахунок пропускної здатності каналу зв’язку VoIP трафіку з використанням різних кодеків” [4] наводиться ряд показників пропускної спроможності різноманітних мовних кодеків. У роботі Бобрицького С.М. “Алгоритм оцінки якості передачі мови з аналізом характеристик ефективних втрат пакетів на основі вейвлет-перетворення” [5] наводяться різні критерії оцінки якості мови в каналі зв’язку VoIP.

3.2 Огляд міжнародних джерел

В англомовних джерелах по даній темі присвячено більшу кількість робіт. У публікації К. Салаха “Deploying VoIP in Existing IP Networks” [6] наводиться специфіка впровадження послуги VoIP в уже існуючу IP-мережу. У роботі Н. Унут “What Affects Voice Quality in VoIP Calls” [7] описуються компоненти, які впливають на якість переданої мови. У роботі Л. Дінго “Speech Quality Prediction in VoIP Using the Extended E-Model” [8] описується один з об’єктивних методів оцінки якості мови (E-модель).

4. Розробка структури каналу зв’язку VoIP

4.1 Загальна структура каналу зв’язку VoIP

Для оцінки якості наданої послуги VoIP необхідно розробити математичну модель мовного каналу зв’язку. Типова структура каналу зв’язку VoIP приведена на рисунку 1.

Рисунок 1 – Структура мовного каналу в мережі VoIP
(анімація: 12 кадрів, кількість циклів 7, розмір 30 Кбайт)

Аналоговий мовний сигнал від мікрофона абонента А за допомогою аналого-цифрового перетворювача (ADC) перетворюється у цифровий потік, за звичаєм 64 кбит/с. Далі дані у цифровій формі стискаються кодуючим пристроєм до швидкостей 16, 8 або 6,3 кбит/c. Формуються пакети, к яким додаються заголовки протоколів, та передаються через IP-мережу в систему IP-телефонії абонента Б. Спочатку відбувається накопичування пакетів для усунення негативних ефектів, виникаючих при проходженні пакетів скрізь IP-мережу, стираються заголовки. Якщо частину пакетів було втрачено, то відбувається інтерполяція серії пакетів, які поступили у накопичувач. Стисненні мовні дані надходять на експандер – пристрій, який розширяє дані до первісної форми. Далі мовні дані перетворюються в аналогову форму за допомогою цифро-аналогового перетворювача (DAC) і надходять до телефону абонента Б [1].

Кожен з компонентів мовного каналу зв’язку VoIP, так чи інакше, буде вносити певні корективи в показники якості обслуговування (QoS). На мовний сигнал, при проходженні через систему, будуть впливати такі параметри, як затримка, джиттер і ймовірність втрат. Слід зазначити, що показник пропускної здатності в даній роботі не враховується – їм можна знехтувати, оскільки пропускна здатність сучасних каналів зв’язку значно більше необхідної для послуги VoIP. Специфічними проблемами надання послуги VoIP є шумозаглушення і ехокомпенсаціі.

4.2 Детектор мовної активності (VAD)

Для шумозаглушення використовується пристрій детектування голосової активності (Voice Activity Detection, VAD). VAD являє собою апаратний або програмний модуль, який фіксує голос на вхідному акустичному каналі і відокремлює його від фонового шуму. VAD також сприяє економії ресурсів каналу: якщо мовний сигнал в даний момент часу не надходить, то дані в мережу не передаються. В іншому випадку, за відсутності VAD, в мережі передаються дані про шум, який збільшує обсяг переданої інформації в каналі.

Область застосування детекторів мовної активності також включає пристрої для аудіо конференцій, слухові апарати, бортові системи безпеки польотів. Типова структурна схема VAD зображена на рисунку 2.

Рисунок 2 – Структурна схема VAD

Рисунок 2 – Структурна схема VAD

На вхід системи надходить вхідний мовний сигнал з мікрофону f (t). Елемент “Визначення наявності шуму” визначає наявність шуму у вхідному сигналі. Ця процедура виконується за допомогою різних алгоритмів виявлення порога шуму й мови. Прикладом є алгоритми, засновані на інформаційному підході (застосування розрахунку ентропії сигналу) або статистичної моделі (постановка гіпотез про наявність шуму або мови). Після того, як шум виявлено, розраховується його спектр і відбувається віднімання спектра шуму від спектра вхідного сигналу. На виході системи одержуємо сигнал f ’(t), який містить лише мову.

Загальною властивістю VAD-алгоритмів є те, що вони включають в себе навчання (обчислення характеристик шуму) і спектральне віднімання. Найчастіше в якості ознак, що визначають початок і кінець слова, обираються енергетичні та спектральні характеристики сигналу, а також число переходів через нуль [8–9].

Модель VAD з використанням вейвлет-перетворення була розроблена в середовищі matlab. Також використовувався wavelet toolbox даного середовища. На вхід моделі поступає зашумлений звуковий wav сигнал з частотою дискретизації 44100 Гц – це слова “you’ll see very soon”, вимовлені жіночим голосом.

Тривалість сигналу – 3 секунди. Кожен фрейм містить 454 відліку (20 мс при частоті дискретизації 44100 Гц). В якості шуму у програмі використовується функція matlab awgn з варіативним рівним відношення сигнал-шум (SNR).

Алгоритм работы модели выполняется в три этапа (рис. 3).

Рисунок 2 – Схема роботи моделі

Рисунок 3 – Схема роботи моделі

На блок “Навчання системи” надходить вхідний зашумлений сигнал f (t). В якості шуму використовується Гаусів білий шум. Відомо, що перші п’ять фреймів сигналу не містять мову і являють собою шум. На цьому етапі визначається середнє значення спектральної ентропії H_ (f_threshold) перших п’яти фреймів і позначається як граничне.

У блоці “Класифікація фреймів” розраховується спектральна ентропія наступних фреймів і порівнюється за граничним значенням:

де – спектральна щільність k-ой компоненти спектра, Xk – коефіцієнти БПФ, або вейвлет-коефіцієнти [4–5].

де n – спектральна ентропія n-го кадру.

У блоці “Віднімання спектра шуму” відбувається віднімання деталізуючих коефіцієнтів шуму з вхідного сигналу.

В якості критерію ефективності в роботі виступає ймовірність вірного визначення фрейму, що містить голос, при заданому рівні відносини сигнал-шум:

У ході експерименту змінювалось значення відношення сигнал-шум від 0 до 50 dBз кроком 5 dB. Результати дослідження зображені на рисунку 4.

Рисунок 4 – Графік залежності ймовірності вірного визначення голосового фрейму P_voiceвід відношення сигнал-шум (SNR)

Рисунок 4 – Графік залежності ймовірності вірного визначення голосового фрейму P_voiceвід відношення сигнал-шум (SNR)

Як видно з результатів дослідження, виграш застосування вейвлет-перетворення замість швидкого перетворення Фур’є в ентропійному методі розпізнавання мови становить до 20%. Цей виграш помічається при відносно шумному сигналі – при відношенні сигнал-шум менш, ніж 15 dB.

4.3 Оцінка якості мови

Суб’єктивна оцінка якості обслуговування при передачі мови.

Первинним критерієм якості аудіо- та відеоінформації є сприйняття якості послуги користувачем. Визначення якості послуг може базуватися як на суб’єктивних, так і на об’єктивних оцінках. Найбільш широко використовувана методика суб’єктивної оцінки якості, яка описана в Рекомендації МСЕ Р.800 (первісна редакція відноситься до 1993 р.) і відома як методика MOS (Mean Opinion Score). Відповідно до неї якість мови, що отримується при проходженні сигналу від мовця (джерело) через систему зв’язку до слухача (приймач), оцінюється як арифметичне середнє від усіх оцінок, виставлених експертами після прослуховування тестового тракту передачі.

Експертні оцінки визначаються у відповідності з наступною п’ятибальною шкалою: 5 – відмінно, 4 – добре, 3 – задовільно, 2 – погано, 1 – незадовільно. Оцінки 3,5 бала і вище відповідають стандартному і високому телефонному якості, 3,0 – 3,5 – задовільної якості, 2,5 – 3,0 – синтезованого звуку. Для передачі мови з гарною якістю доцільно орієнтуватися на значення MOS не нижче 3,5 балів.

Хоча методика MOS, заснована на суб’єктивних оцінках, є досить надійним інструментом в телефонних мережах, в ній відсутня можливість кількісно врахувати фактори, які впливають на якість мови. Зокрема, не враховуються:

  1. Наскрізна (end-to-end) затримка між мовцем по телефону і слухачем.
  2. Вплив варіації затримки (джиттера).
  3. Вплив втрат пакетів.

Об’єктивна оцінка якості обслуговування при передачі мови в пакетних мережах.

Для преодоления указанных недостатков в 1998 г. МСЭ принял Рекомендацию G.107, в которой был описан подход к объективной оценке качества услуг в телекоммуникациях. В его основу положена так называемая Е-модель, которая открыла новое направление в оценке качества услуг, связанное с измерением характеристик терминалов и сетей. После создания Е-модели было проведено большое число испытаний, в которых менялся уровень воздействия искажающих сетевых факторов. Данные этих тестов были использованы в Е-модели для вычисления объективных оценок. Результатом вычислений в соответствии с Е-моделью является число, называемое R-фактором ("коэффициентом рейтинга"). Значения R-фактора однозначно сопоставляются с оценками MOS (см. рис. 5).

Рисунок 5 – Зависимость между оценками MOS и R-фактором

Рисунок 5 – Зависимость между оценками MOS и R-фактором

Відповідно до E-моделі R-фактор визначається в діапазоні значень від 0 до 100, де 100 відповідає найвищому рівню якості. При розрахунку R-фактора враховуються 20 параметрів, серед яких:

  1. Односпрямована затримка.
  2. Коефіцієнт втрати пакетів.
  3. Втрати даних через переповнення буфера джиттера.
  4. Спотворення, що вносяться при перетворенні аналогового сигналу в цифровий і наступному стисканні (обробка сигналу в кодеках).
  5. Вплив відлуння і ін.

Таким чином, Е-модель і R-фактор можуть бути використані для об’єктивної оцінки якості передачі мови в технології VoIP. Як тільки R-фактор отриманий, можуть бути обчислені відповідні оцінки MOS. Обчислення R-фактора починається для випадку, коли спотворення сигналу в каналі не враховуються, а приймаються до уваги спотворення, які мають місце при перетворенні реальної мови в електричний сигнал (і назад). Теоретичне значення R-фактора зменшується від 100 до 93,2, що відповідає оцінці MOS, що дорівнює 4,4. Таким чином, при використанні Е-моделі оцінка 4,4 в системі MOS є максимально можливою оцінкою якості мови в мережі без спотворень. Величина R-фактора змінюється від 0 до 93,2, що відповідає зміні оцінок MOS від 1 до 4,4. Значення R-фактора визначається за наступною формулою:

R = Rо — Is — Id — Ie + A,

де: Ro = 93,2 - вихідне значення R-фактора; Is - спотворення, що вносяться кодеками і шумами в каналі; Id - спотворення за рахунок сумарної наскрізний затримки ("з кінця в кінець") в мережі; Iе - спотворення, що вносяться обладнанням , включаючи і втрати пакетів; А - так званий фактор переваги.

Висновки

Для якісного надання послуги VoIP в сучасних мережах необхідно забезпечити всі вимоги якості обслуговування (QoS). Для цього необхідно дати ряд рекомендацій по налаштування мережі, а також модернізувати специфічні компоненти, властиві даної послуги (детектор мовної активності, ехокомпенсатор).

У рамках проведених досліджень виконано:

  1. Розроблено модель мовного каналу зв’язку VoIP.
  2. Розроблено та досліджено модель мовного детектора (VAD) з використанням вейвлет-перетворення.
  3. Розглянуто існуючі методи оцінки якості переданої мови.

Подальші дослідження:

  1. Розробка і дослідження ехокомпенсатора.
  2. Комплексна оцінка якості надання послуги VoIP, надання рекомендацій з налаштування мережі.

На момент написання даного автореферату кваліфікаційна робота магістра ще не завершена. Дата остаточного завершення роботи: грудень 2012 року. Повний текст роботи та матеріали по темі можуть бути отримані у автора роботи або його наукового керівника після зазначеного терміну.

Перелік посилань

  1. Росляков А.В., Самсонов М.Ю., Шибаева И.В. IP-телефония // Эко-Трендз, 2-е издание. – 2003. – 468 с.
  2. Полканов Е.И., Шнепс-Шнеппе М.А., Крестянинов С.В. Интеллектуальные сети и компьютерная телефония // Радио и связь – 2001. – 240 с.
  3. Галичский К. Компьютерные системы в телефонии // BHV Санкт-Петербург. – 2002. – 400 с.
  4. Кофанов Н.С. Расчет пропускной способности канала связи VoIP трафика с использованием различных кодеков. [Электронный ресурс]. – Режим доступа: http://www.sworld.com.ua/index.php/ru/technical-sciences....
  5. Бобрицкмй С.М. Алгоритм оценки качества передачи речи с анализом характеристик эффективных потерь пакетов на основе вейвлет-преобразования. [Электронный ресурс]. – Режим доступа: http://scipeople.ru/publication/107179.
  6. Salah K. Deploying VoIP in Existing IP Networks. [Электронный ресурс]. – Режим доступа: http://www.techrepublic.com/whitepapers....
  7. Unuth N. What Affects Voice Quality in VoIP Calls. [Электронный ресурс]. – Режим доступа: http://voip.about.com/od/voipbasics....
  8. Ding. L. Speech Quality Prediction in VoIP Using the Extended E-Model. [Электронный ресурс]. – Режим доступа: http://ieeexplore.ieee.org/xpl....
  9. Kung-Ching Wang. Robust Voice Activity Detection Based on Discrete Wavelet // Department of Information Technology & Communication. – Shin Chien University. – 2007. – 13 с.
  10. R. Venkatesha Prasad, Abhjeet Sangwan, Vishal Guarav. Comparsion of Voice Activity Detection Algorithms for VoIP // CEDT. – Indian Institute of Science. – 2002. – 6 с.
  11. Добеши И. Десять лекций по вейвлетам // Регулярная и хаотическая динамика. – Ижевск. – 2001. – 464 с.
  12. Смоленцев Н.К. Основы теории вейвлетов. Вейвлеты в Matlab // – ДМК. – Москва. – 2005. – 304 с.