Магистр ДонНТУ Снисарь Николай Александрович

Снисарь Николай Александрович

Донецкий национальный технический университет
Факультет компьютерных информационных технологий и автоматики, група ЭлС-07

Тема магистерской работы:

Передача данных посредством голосового канала GSM сети в системах коммерческого учета электроэнергии.

Научный руководитель: к.т.н. доц. кафедры «ЭТ» Кочин А. Е.

Библиотека

Источник: Сапожков М.А. "Речевой сигнал в кибернетике и связи." - М.: Государственное издательство литературы по вопросам связи и радио, 1963. - 450с.

 

1.3. Теория разборчивости речи и связь её с теорией информации

     Теория разборчивости речи [273, 85] основывается на статистической теории приёма сигналов. Именно поэтому между теорией информации и теорией разборчивости существует тесная связь [79].
     Не останавливаясь на изложении основ теории разборчивости, которые подробно освещены в ряде других изданий [40, 11. 60, 37, 85, 72, 35, 36, 59], рассмотрим нх только в аспекте основяых положений теории информации. Само собой разумеется, что при таком рассмотрении не надо забывать того, что приёмником речевого сигнала является (в этом случае) слух человека, имеющий характеристики, сильно отличающиеся от характеристик обычно используемых приёмников электрических сигналов.
     Следующим моментом, который необходимо учитывать при анализе условий передачи речи, является разница в оценке её: в одних случаях речь оценивают только с точки зрения её понятности, а в других — с точки зрения н разборчивости н качества звучания. Промежуточным случаем может явиться такой, при котором, кроме понятности речи, необходима н узнаваемость голоса. Конечно, между этими оценками имеется связь, и в случае непреобразованной речи эта связь почти без исключений однозначная. Для преобразованной речи нельзя утверждать, что такая связь однозначна, но всё же довольно часто пытаются оценивать качество передачи речи только по величине её разборчивости. В дальнейшем на этом вопросе придётся остановиться несколько подробнее в связи с рассмотрением конкретных устройств преобразования речи. В данном разделе под понятием качества передачи речи мы будем подразумевать качество разборчивости речи.
     Исследования, проведённые ВКАС и рядом НИИ [10, 59] по Определению зависимости между качеством передачи речи и её разборчивостью на различных линиях связи показали, что для непреобразованной речи эта зависимость однозначна. Для введённых оценок «отлично», «хорошо», «удовлетворительно» и «предельно допустимо» в результате массовых испытаний (участвовало несколько сотен слушателей с разнообразной подготовкой и развитием) было установлено, что абсолютное большинство слушателей (не менее 90%) давало оценку «отлично» при словесной разборчивости не менее 98%, оценку «хорошо» при словесной разборчивости не менее 93%, оценку «удовлетворительно» при 87%, оценку «предельно допустимо» при 75%. Кроме того, профессором Быковым [10] была введена оценка "срыв связи", которая соответствовала словесной разборчивости (по данным ВКАС) 60%. Если к этим градациям качества передачи речи добавить ещё оценку «идеальная передача», под ко-торой подразумевать такую, при которой ни один нз слушателей не замечает искажений, то по словесной разборчивости будем иметь следующие пределы:
идеально — 100—99%' отлично — 99—98% хорошо — 98—93% удовлетворительно — 93—87% предельно допустимо — 87—77% срыв связи — 77—60%
Пересчитаем эти величины словесной разборчивости W на формантпую разборчивость А1. Для этого воспользуемся найденными ВКАС статистическими зависимостями W = f (S) (см. рис. 5.4) и S = f (А), где S — слоговая разборчивость, с уточнением её соответственно работе (рис. 1.3). b результате имеем следующие пределы по формантной разборчивости:


     На основании этих данных, приходим к выводу, что равные относительные изменения формантной разборчивости соответствуют равным абсолютным изменениям качества передачи речи. Так, изменение с любого качества на смежное с ним соответствует изменению форматной разборчивости в 1,4 раза. Следовательно, по формант пой разборчивости можно с одинаковой точностью оценить любое качество передачи.
     Из тех же данных видим, что для практически используемых диапазонов разборчивости абсолютные и относительные изменения формантной разборчивости по своим величинам значительно больше, чем для соответствующих им изменениям звуковой, слоговой и словесной разборчивости. Это означает, что точность измерений по формантной разборчивости будет обычно выше, чем по другим видам разборчивости. Заметим, что общее изменение формантной разборчивости от верхнего предела до нижнего — 8-кратное, т. е. непреобразованная речь может быть принята даже при 8-кратном ухудшении её.
     С другой стороны, одной из основных эксплуатационных характеристик трактов передачи речи является пропускная способность тракта, точнее, время, необходимое для передачи определённого ооъёма текста при условии полной понятности этой передачи. Очевидно, чем ниже качество передачи речи, тем большее время требуется для полного понимания её.
     Статистические исследования [72] зависимости между величиной разборчивости речи и временем Т, необходимым для полного понимания всего её объёма, в самых разнообразных условиях передачи речи показали, что величина разборчивости формант обратно пропорциональна этому времени, т. е. что

     (1.22)

     Для иллюстрации этого положения в табл. 1.2 приводятся средние данные большого числа экспериментальных исследований.

     При этих исследованиях использовалась следующая методика, практически применяемая связистами. После передачи текста (или части его) в зависимости от понятности производится или переспрос от слов или проверка всего переданного текста, непонятные слова передаются по буквам и т. п.
     Следовательно, разборчивость формант представляет своего рода относительную вели чину предельно возможной скорости передачи. Это свойство разборчивости формант даёт непосредственную возможность количественно характеризовать тракт по его основной эксплуатационной характеристике — пропускной способности тракта речевой передачи, включая в понятие тракта и слух человека. Именно поэтому формантная разборчивость является наиболее показательным видом разборчивости.
     Как известно, [68, 73] разборчивость формант определяется законами распределения вероятностей формант по частотному и динамическому диапазонам речи, а именно

     (1.23)

     m(fk) — интегральная вероятность формант в диапазоне 0--fk;
     (Е ) связана линейно с уровнем ощущения, а именно: интегральная вероятность формант с уровнями интенсивности от порога слышимости в заданных условиях до пикового, т. е. с уровнями ощущения формант от нуля до Е) (иногда эта величина называется коэффициентом разборчивости); плотность вероятности формант на частоте f.

     Следовательно, разборчивость формант интерпретируется площадью, ограниченной пиковым уровнем интенсивности формант, принятым за нулевой уровень, и кривой частотнои зависимости уровня интенсивности на пороге слышимости относительно нулевого уровня. При этом частоты и уровни по ординате должны быть отложены в масштабе равномерной плотности вероятности (см. рис. 1.4) по уровню (w) и по частоте (т).
     Из исследований русской и английской речи [10, 59, 273, 284] известно, что в основном диапазоне частот (300—3000 гц) плотность вероятности формант в зависимости от частоты изменяется не более, чем в 2—2,5 раза. Например, ширина полос равной разборчивости для русской речи [59] находится в пределах 150—300 гц. Ввиду этого с достаточной для практики степенью точности можно положить плотность вероятности формант независимой от частоты, т. е. считать, что

     (1.24)

     где F — ширина частотного диапазона речи при условии равномерной плотности вероятности формант, f~3500 гц.
     Из тех же исследований известно, что для широкого диапазона уровней ощущения формант интегральная вероятность

     (1.25)

     где dE и E0—постоянные для данной речи (для русской и английской речи dE=6 Дб,E0=30 Дб). Поскольку, согласно теории разборчивости речи, пиковый уровень ощущения формант

     (1.26)

где Bp' — пиковый уровень спектра речи на входе тракта,
Вn' — уровень спектра помех, приведённый ко входу тракта (для сложных спектров помех он представляет эквивалентный по маскирующему действию уровень помех со сплошным равномерным спектром [11]), D — эффективный динамический диапазон речи по входу тракта, то, учитывая (1.25) и (1.26), из (1.24) получаем

(1.27)

     где Dcp—средняя величина эффективного динамического диапазона речи по входу тракта, F — ширина пропускаемого трактом частотного диапазона речи, 1/k =E0 F0= 1,05*105 дб/гц.

     Итак, величина формантной разборчивости в условиях практики с достаточной степенью точности определяется произведением ширины частотного диапазона (в герцах) и средней величины эффективного динамического диапазона речи (в децибелax).
     Это свойство разборчивости формант выгодно отличает её от Других видов разборчивости.
Если учесть соотношения (1.22) и (1.27), то получается интересный вывод: количество принимаемых сведений (информации) прямо пропорционально произведению пропускаемых трактом частотиого, среднего динамического диапазона и времени передачи;

     (1.28)

     т. е. пропорционально произведению формантной разборчивости на время передачи.
     Согласно теории информации, речь без искажений (в условиях флуктуационных помех) может быть передана, если пропускная способность тракта составляет

     (1.29)
     Если считать, что основной речевой диапазон составляет 5000 гц. а средний динамический диапазон около 30 дб, то

     В то же время известно, что для некомпрессированной импульсно-квантованной речи срыв связи наступает при скорости передачи 6000 бит/сек, а предельно допустимое качество получается при 8000 6ит/сек. Следовательно, с теми допущениями, которые были нами сделаны ранее, можно сказать, что пропускная способность тракта, выраженная в битах в секунду, пропорциональна величине формантной разборчивости. Таким образом, отличное качество передачи будет прн скорости 35 000— 26 000 бит/сек, удовлетворительное—при 17500—12 500 бит/сек и т. п. К этому выводу приходят и другие исследователи [79].
     Конечно, если не делать ранее указанных допущений, то полосы частот, расположенные в области низких частот, будут всегда более эффективны, чем полосы в области верхних частот. В отношении динамического диапазона можно сказать, что наиболее эффективна область его среднего участка, т. е. что динамический и частотный диапазоны всё же неравнозначны для разборчивости речи. Эта неравнозначность, например, легко обнаруживается при передаче клиппированного сигнала: для получения хорошей разборчивости требуется пропускная способность тракта связи примерно в два раза меньше, чем для обычной передачи речи. Видимо, остальная часть пропускной способности тракта используется, в основном, для передачи качественных характеристик речевого сигнала. Ввиду этого в ряде случаев при переходе от объёма сигнала к разборчивости необходимо вводить в величину динамического диапазона поправочный коэффициент.

...


© ДонНТУ, Снисарь Николай Александрович, 2008

ДонНТУ ДонНТУ