Двоичное кодирование звука

💻 Информатика · 9 класс

Двоичное кодирование звука

Звук — это непрерывная (аналоговая) волна давления воздуха. Чтобы компьютер мог хранить, передавать и обрабатывать звук, его нужно превратить в набор чисел — то есть выполнить дискретизацию. Этот процесс называют двоичным кодированием звука. В результате получается цифровая копия, которая лишь приближённо повторяет исходную волну, но достаточно точно для слуха человека.

Дискретизация и квантование

Через равные промежутки времени измеряют уровень сигнала — это дискретизация по времени. Каждое измеренное значение округляют до одного из доступных уровней — это квантование по уровню. Чем чаще делают измерения и чем больше доступно уровней, тем точнее цифровая копия передаёт оригинал.

Параметр	Что задаёт	Единица
Частота дискретизации	число измерений в секунду	герц (Гц)
Глубина кодирования	число бит на одно измерение	бит

Число уровней громкости

Если на одно измерение отводится i бит, то число различимых уровней громкости равно N = 2^i. Например, при глубине кодирования 16 бит число уровней составляет 2^16 = 65536. Это та же формула, что связывает мощность алфавита и вес символа, только здесь «алфавит» — это набор уровней громкости.

Объём звукового файла

Информационный объём моноаудио (одна звуковая дорожка) вычисляют по формуле:

V = f * i * t

где f — частота дискретизации в герцах, i — глубина кодирования в битах, t — время звучания в секундах. Для стереозвука результат умножают на 2, потому что записываются два канала — левый и правый.

Разбор задачи

Пусть частота дискретизации равна 8000 Гц, глубина кодирования 8 бит, время звучания 10 секунд, звук монофонический. Тогда объём вычисляется так:

V = 8000 * 8 * 10 = 640000 бит 640000 / 8 = 80000 байт 80000 / 1024 ≈ 78,1 Кбайт

Видно, что даже короткий звук занимает заметный объём, поэтому на практике звук дополнительно сжимают специальными алгоритмами.

Качество цифрового звука

Качество записи напрямую зависит от двух параметров. Чем выше частота дискретизации, тем точнее передаются высокие тоны: для речи достаточно нескольких тысяч измерений в секунду, а для музыки используют десятки тысяч. Чем больше глубина кодирования, тем тоньше передаются переходы громкости и тем меньше слышимых искажений. Однако повышение любого из параметров увеличивает объём файла, поэтому всегда ищут разумный баланс между качеством звучания и размером записи. Именно из-за большого исходного объёма были придуманы форматы сжатия, которые уменьшают размер файла, почти не ухудшая звучание для человеческого уха.

Частые ошибки. Путают биты и байты (1 байт = 8 бит); забывают умножить объём на число каналов для стереозвука; смешивают частоту дискретизации и глубину кодирования; используют множитель 1000 вместо 1024 при переводе в килобайты.

Кратко о главном

Звук кодируют дискретизацией по времени и квантованием по уровню.
Частота дискретизации — измерения в секунду, глубина — биты на измерение.
Число уровней громкости равно N = 2^i.
Объём моноаудио: V = f * i * t, для стерео — вдвое больше.
При переводе в килобайты используют множитель 1024.

← Предыдущая тема

Поиск элемента в массиве

Следующая тема →

Растровая и векторная графика