.
Для того, чтобы лучше понять природу цифрового звука, нужно познакомиться с процессами преобразования звука из аналоговой формы в цифровую и наоборот. Имея даже весьма примерное представление о том, что происходит в вашей звуковой карте, вы убережетесь от множества ошибок.
Итак, звуковые волны при помощи микрофона превращаются в аналоговый переменный электрический сигнал. Этот сигнал проходит через звуковой тракт и попадает в аналого-цифровой преобразователь (АЦП) - устройство, которое переводит сигнал в цифровую форму. В упрощенном виде принцип работы АЦП можно описать так: он измеряет через определенные промежутки времени амплитуду сигнала и передает дальше, уже по цифровому тракту, последовательность чисел, несущих информацию об изменениях величины амплитуды.
Во время аналого-цифрового преобразования на самом деле никакого физического преобразования не происходит. С электрического сигнала как бы снимается отпечаток или образец, являющийся цифровой моделью колебаний напряжения в аудиотракте. На рис. ниже, под номером 2, эта модель представлена в виде последовательности столбиков, каждый из которых соответствует определенному числовому значению.
Рис.1 Аналого-цифровое преобразование
.На этой схеме видно, что цифровая модель не совсем точно соответствует форме аналогового сигнала. Поэтому говорят, что цифровой сигнал по своей природе дискретен - то есть, прерывист. Собственно, дискретность цифрового звука и вызывает до сих пор споры о том, какая технология лучше: аналоговая или цифровая. Многие аудиофилы и звукорежиссеры утверждают, что отлично слышат разницу между аналоговым оригиналом и цифровой копией, сделанной даже при помощи очень дорогих преобразователей.
Действительно, на высококлассных студийных и бытовых Hi-End (хай-энд) акустических системах эта разница слышна. Однако в большинстве случаев дискретность цифрового звука проявляется в мельчайших деталях звуковой картины, которые интересны лишь специалистам. Поэтому для подавляющего большинства слушателей все эти проблемы мало интересны - к музыке они не имеют никакого отношения.
Промежуток времени между двумя измерениями амплитуды аналогового сигнала называется семплом. С английского слово Sample дословно переводится как «образец». Поэтому это слово в мультимедийной и профессиональной звуковой терминологии имеет несколько значений.
Кроме промежутка времени семплом называют любую последовательность цифровых данных, полученных в результате аналого-цифрового преобразования, а сам процесс преобразования - семплированием.
В традиционном русском техническом языке принята другая терминология. Например, процесс преобразования называется дискретизацией. В современных публикациях можно встретить такой термин как частота семплирования. Фактически, это тоже самое, что и частота дискретизации.
Вывод цифрового звука осуществляется при помощи цифро-аналогового преобразователя (ЦАП), который на основании поступающих цифровых данных в соответствующие моменты времени генерирует электрический сигнал необходимой амплитуды (номер 3 на рис. выше). А в акустических системах этот сигнал преобразуется в звуковые волны, которые мы слышим.
Одним из двух ключевых параметров процесса оцифровки является частота семплирования - количество измерений амплитуды аналогового сигнала в секунду. Так как диапазон колебаний звуковых волн лежит в пределах от 20 Гц до 20 кГц, то количество измерений сигнала в секунду должно быть больше, чем количество колебаний звуковой волны за тот же промежуток времени. На рисунке ниже показано, что происходит, если частота семплирования гораздо ниже, чем частота звуковой волны: за время между измерениями амплитуда сигнала успевает несколько раз измениться, в результате чего цифровой отпечаток несет хаотичный набор данных.
Рис.2 Частота сэмплирования ниже, чем частота звуковой волны.
При цифро-аналоговом преобразовании такой семпл выдаст только шум, а основной сигнал передаваться не будет. Поэтому для качественного преобразования применяют частоты, более чем в два раза превышающие верхнюю границу частотного диапазона: 44.1 и 48 кГц. А в DVD применяется частота семплирования 96 кГц. То есть за 1 секунду сигнал измеряется 96 тысяч раз! В мультимедийных приложениях очень часто применяют меньшие частоты: 11, 22 и 32 кГц для экономии места на жестком диске. Но с уменьшением частоты семплирования сразу уменьшается слышимый диапазон частот, а то, что слышно, довольно сильно искажается.
На следующем рисунке представлены четыре графика, показывающие с одинаковым масштабом один и тот же звук высотой 1 кГц (этой частоте примерно соответствует нота До седьмой октавы фортепиано), но семплированный с разной частотой (нижняя часть синусоиды на всех рисунках не показана).
Рис. 3 Сэмплирование с разной частотой
Одно деление на горизонтальной оси, показывающей время, соответствует 10 семплам. Вы видите, что на частоте 11 кГц на каждые 50 семплов приходятся примерно 5 колебаний звуковой волны, то есть один период синусоиды отображается всего лишь при помощи 10 значений. При таком отображении ни о какой точной передаче говорить не приходится. Зато при частоте оцифровки 44 кГц на каждый период синусоиды приходится уже почти 50 семплов - такая точность отображения позволяет получить сигнал хорошего качества.
Подведем черту. Процесс аналого-цифрового преобразования называется семплированием. Одним из ключевых параметров этого процесса является частота семплирования - количество измерений амплитуды аналогового сигнала в секунду. Для того, чтобы оцифровка была действительно качественной, нужно использовать частоту семплирования, которая более чем в два раза превышает частоту верхней границы звукового диапазона. Если частота семплирования будет меньше, то начнут происходить потери на высоких частотах. Исходя из этих соображений, стандартной выбрана частота 44.1 кГц.
Теперь давайте разберемся с другим ключевым параметром цифрового преобразования - разрядностью сэмплирования. Этот параметр указывает, с какой точностью происходят измерения амплитуды аналогового сигнала. Посмотрите еще раз на первый рисунок. Точность, с которой при оцифровке передается значение амплитуды сигнала в каждый из моментов времени (столбики на первом рисунке, схема №2), фактически определяет качество сигнала после цифро-аналогового преобразования. От этой точности зависит достоверность восстановления формы волны.
Любое цифровое устройство, в том числе и компьютер, на аппаратном уровне может оперировать только с двоичным кодом. Этот код позволяет представить любую информацию в виде нулей и единиц. Минимальной информационной единицей в двоичной системе является бит. Он может принимать два значения - 0 и 1, то есть одним битом можно представить два десятичных числа. Двумя битами - уже четыре числа (используя все возможные комбинации нолей и единиц: 00, 01, 10, 11). Тремя битами - восемь чисел и т.д. Именно такой принцип и применяется для кодирования значения амплитуды сигнала. Обычно используется 8, 16 или 24-битное представление значений амплитуды.
Давайте остановимся на этом моменте подробней. Если при оцифровке используется 8-битное кодирование, то измерения амплитуды аналогового сигнала будут производиться с точностью до 1/256 от динамического диапазона цифрового устройства (8 бит позволяют представить 28 чисел - 256). Такая точность недостаточна для достоверного восстановления исходного сигнала: будут велики нелинейные искажения. Поэтому 8-битное кодирование применяется преимущественно в мультимедиа - приложениях, где не требуется высокое качество звука. Если же мы повысим разрядность представления значений амплитуды аналогового сигнала до 16 бит, то точность измерения возрастет не в два раза, а в 256. Ведь 16 бит позволяют закодировать уже 216=65536 значений амплитуды. Такая точность кодирования позволяет свести к минимуму нелинейные искажения.
Однако, на данный момент стандартом является 24 бит, а это уже 16777216 значений. Зачем же тк много? Здесь надо остановиться и поговорить об одной особенности оцифровки. Все приведенные выше данные справедливы только для сигнала, имеющего максимальный уровень 0 дБ. Если семплируется сигнал, имеющий уровень -6 дБ с разрядностью 16 бит, то реально для кодирования его амплитуды будет оставаться 15 бит. Для сигнала с уровнем -12 дБ эта цифра будет составлять 14 бит. То есть с уменьшением уровня сигнала будет уменьшаться разрядность его оцифровки и, соответственно, увеличиваться уровень нелинейных искажений (в технической литературе эти искажения иногда называются шумом квантования). Уменьшение уровня на каждые 6 дБ будет «съедать» 1 бит. В результате, для кодирования амплитуды сигнала с уровнем -90 дБ у нас останется всего 1 бит.
Из всего сказанного следует важный практический вывод: когда вы работаете с цифровым звуком, уровень записи должен быть максимально возможным, если вы хотите получить звук действительно хорошего качества. А любую обработку нужно начинать только после приведения вашей записи к уровню 0 дБ для того, чтобы цифровые алгоритмы работали с разрядностью, близкой к 16 битам, а не 10 или 8. Для этого в любой компьютерной программе записи и редактирования «живого» звука есть соответствующие алгоритмы.
Таким образом, разрядность семплирования показывает точность представления значений амплитуды аналогового сигнала. Чем выше разрядность, тем меньше нелинейных искажений в сигнале после цифро-аналогового преобразования. Одним из недостатков цифровой записи является ухудшение качества звука, записанного с малыми уровнями. Для борьбы с этим эффектом лучше оцифровывать звук с максимально возможным уровнем. А при выборе цифровых устройств следует отдавать предпочтение тем из них, на которых установлены преобразователи повышенной разрядности.