Содержание

AC3

Dolby AC3.

AC-3 (Audio Code number 3) — это технология сжатия мультиканальных аудиоданных, разработанная компанией Dolby Laboratories. Целью этой цифровой технологии сжатия было создание цифрового представления аудиосигнала, который бы при декодировании и последующем воспроизведении при минимуме цифровой информации (битрейте) у сжатого сигнала, звучал бы также, как и оригинальный источник, и обеспечивал реальный звук окружения.

Ранее Dolby Laboratories приняла термин Dolby Digital для обозначения этой цифровой системы в кинопроизводстве и индустрии кинотеатров, а для рынка домашних кинотеатров компания выбрала термин Dolby Surround AC-3. На практике обе системы являются вариациями технологии AC3, различие в которых заключается в небольшой разнице объемов данных, поэтому для устранения возможной путаницы среди потребителей компания решила назвать кино- и домашие системы одним названием — Dolby Digital.

5.1-канальный звук вокруг

Как работает AC-3?

Как и MP3 или AAC, AC-3 использует определенные свойства звука и человеческого слуха для сжатия аудиоданных.

AC3 Encoder

Следующий абзац взят с ferra.ru

Используемая в Dolby Digital схема компрессии данных AC3 обладает очень высокой эффективностью (коэффициент сжатия может быть более 12:1, поддерживаемые битрейты от 32 до 640 кбит/с, в кино используется 320 кбит/с) и при этом довольно высоким субъективным качеством звука. AC3, как и все современные схемы сжатия данных звуковых потоков (в частности, MP3), использует в своей работе особенности слухового восприятия человека, или психоакустическую модель. Например, в присутствии громкого сигнала некоторой частоты более тихие и имеющие немного более высокую или низкую частоту звуки маскируются громким сигналом, то есть не слышны или слышны очень плохо. Также маскируются сигналы, звучащие после и даже перед громким звуком. Это явление позволяет не кодировать или кодировать с меньшей разрядностью маскируемые звуки. Компрессия данных осуществляется также путем недеструктивного избавления от избыточной информации, примерно по тем же алгоритмам, которые применяются в архиваторах ZIP или RAR. Для реализации этих схем входящий поток аудиоданных разбивается во времени (на перекрывающиеся блоки (фреймы) по 512 сэмплов, при частоте дискретизации 48 кГц это составляет 10,66 мс, если же в сигнале присутствуют резкие перепады уровня, то размер блока уменьшается вдвое, чтобы качественно передать эти быстрые скачки) и по частоте (весь звуковой диапазон в 24000 Гц разбивается на 256 сегментов, что дает ширину каждой полосы в 93,75 Гц). Затем звуковая информация в каждой частотной полосе из блока данных переводится в формат числа с плавающей запятой (количество бит в целочисленной мантиссе и экспоненте является переменным), и по определенной психоакустической модели производится обработка входящих значений (какие-то частотные полосы вообще не несут значимой информации и не кодируются, какие-то нужно закодировать с большей разрядностью, какие-то с меньшей), результатом которой является существенное уменьшение потока данных. Интересно, что психоакустическая модель, используемая кодером, может меняться, так как параметры модели передаются в потоке AC3 и затем могут использоваться декодером для восстановления исходного звучания. Еще одним способом уменьшения потока данных является объединение данных из разных каналов. В реальной многоканальной фонограмме в нескольких каналах звуковая информация зачастую пересекается, и ее можно закодировать один раз для всех, а не для каждого канала в отдельности. Эта техника применяется только для частот выше 10 кГц, что позволяет сохранить локализацию источников звука, а при том, что в распоряжении кодера есть целых пять полноценных звуковых каналов и, соответственно, широкое поле для маневра, поток данных этим способ можно уменьшить довольно значительно.

Внешние ссылки