Звук, который мы слышим, представляет из себя волну с постоянно меняющейся амплитудой (A) и частотой (w). Чем выше амплитуда, тем громче кажется звук. Чем больше частота, тем звук выше (писк комара имеет бОльшую частоту, чем, например, мяуканье кошки).
|
Рис. 1
|
Временная развёртка звука
|
Люди смогли придумать способ заставить компьютер "слышать" и "говорить", т.е. запоминать и воспроизводить звук.
За оцифровку, т.е. преобразование звука (понятного человеку) в числа (понятные компьютеру) отвечает Аналогово-Цифровой Преобразователь (сокращённо АЦП).
Декодирование, т.е. преобразование чисел (понятных компьютеру) в звук (понятный человеку) делают с помощью Цифро-Аналогового Преобразователя (сокращённо ЦАП).
|
Рис. 2
|
Функции ЦАП и АЦП
|
Оба этих устройства содержатся в так называемой звуковой карте.
Рассмотрим подробнее процесс оцифровки звука.
Непрерывный сигнал с микрофона поступает на Аналогово-Цифровой Преобразователь (АЦП). АЦП измеряет амплитуду сигнала несколько тысяц раз в секунду, каждый раз запоминая число.
|
Рис. 3
|
Амплитудно-импульсная модуляция
|
Таким образом, вместо гладкой функции получаются "ступеньки". Числа есть уровни громкости.
Характеристики оцифрованного звука.
Их всего две:
Глубина кодирования звука (S) - количество бит, используемые для хранения одной выборки.
Например. Если бит всего 2, то различных уровней громкости :
Двоичное представление |
Десятичное представление |
00 |
0 |
01 |
1 |
10 |
2 |
11 |
3 |
Итого - 4 разных уровня громкости |
Табл. 1
|
Уровни громкости для глубины кодирования в 2 бита
|
Количество различных уровней громкости (N) равно 2 в степени глубины дискретизации.
|
Рис. 4
|
Связь количества уровней громкости с глубиной кодирования звука
|
Современные аудиоплаты поддерживают 24-битный звук. Это значит, что всего уровней громкости:
N=2S=224=16 777 216
.
Т.е "ступеньки" будут иметь почти 17 миллионов уровней. Это очень качественный звук.
Второй характеристикой является частота дискретизации (D). Эта величина показывает сколько раз в секунду АЦП отсылает в компьютер число.
Эта величина измеряется в Герцах. Если, например, частота дискретизации D равна 4 кГц, это значит, что звук "забирается" с микрофона 4 000 раз в секунду.
Если, например, говорится, что звук измеряется каждые 0,0001 секунды, значит
D = 1/0,0001=10 000 Гц = 10 кГц
Чтобы вычислить Объём звуковой информации (I) (объём, занимаемый звуком в памяти компьютера), нужно умножить длительность звука (t) (в секундах) на частоту дискретизации (D)(в герцах) на глубину кодирования звука (S) (в битах).
I = D * S * t
Например, есть такая задача:
Звук воспроизводится в течении 10 секунд при частоте дискретизации 22,05 кГц и притом звуковая плата работала в режиме с 256 уровнями громкости. Найти объём, занимаемый звуковым файлом (в байтах).
Решение:
Нужно найти объём звука в байтах. Формула для нахождения:
I = D * S * t, где
I - Объём звуковой информации;
t - Длительность звука;
S - Глубина кодирования звука;
Известны все величины, кроме глубины кодирования. Но у нас есть количество уровней громкостей N.
Чтобы найти N, воспользуемся формулой:
N = 2S;
256 = 2S;
Если подобрать S на калькуляторе, можно получить число 8;
Подставляем в итоговую формулу:
I = D * S * t = (22,05 * 1000) * 8 * 10 = 1764000 бит = (1764000 / 8) байт = 220500 байт;
Ответ: Объём звука - 220500 байт;
Cкачать всю статью целиком можно тут:
|