Различия

Здесь показаны различия между двумя версиями данной страницы.

--- codecs:lossy:ac3 [2007/03/26 08:59]
Spike создано
+++ codecs:lossy:ac3 [2007/03/26 08:01] (текущий)
@@ Строка 14: / Строка 14: @@
 Как и [[codecs:lossy:MP3]] или [[codecs:lossy:AAC]], AC-3 использует определенные свойства звука и человеческого слуха для сжатия аудиоданных.
-{{codecs:lossy:ac3_enc.png|}}
+{{codecs:lossy:ac3_enc.png|AC3 Encoder}}
 //Следующий абзац взят с ferra.ru//
@@ Строка 20: / Строка 20: @@
 Используемая в Dolby Digital схема компрессии данных AC3 обладает очень высокой эффективностью (коэффициент сжатия может быть более 12:1, поддерживаемые битрейты от 32 до 640 кбит/с, в кино используется 320 кбит/с) и при этом довольно высоким субъективным качеством звука. AC3, как и все современные схемы сжатия данных звуковых потоков (в частности, MP3), использует в своей работе особенности слухового восприятия человека, или психоакустическую модель. Например, в присутствии громкого сигнала некоторой частоты более тихие и имеющие немного более высокую или низкую частоту звуки маскируются громким сигналом, то есть не слышны или слышны очень плохо. Также маскируются сигналы, звучащие после и даже перед громким звуком. Это явление позволяет не кодировать или кодировать с меньшей разрядностью маскируемые звуки. Компрессия данных осуществляется также путем недеструктивного избавления от избыточной информации, примерно по тем же алгоритмам, которые применяются в архиваторах ZIP или RAR. Для реализации этих схем входящий поток аудиоданных разбивается во времени (на перекрывающиеся блоки (фреймы) по 512 сэмплов, при частоте дискретизации 48 кГц это составляет 10,66 мс, если же в сигнале присутствуют резкие перепады уровня, то размер блока уменьшается вдвое, чтобы качественно передать эти быстрые скачки) и по частоте (весь звуковой диапазон в 24000 Гц разбивается на 256 сегментов, что дает ширину каждой полосы в 93,75 Гц). Затем звуковая информация в каждой частотной полосе из блока данных переводится в формат числа с плавающей запятой (количество бит в целочисленной мантиссе и экспоненте является переменным), и по определенной психоакустической модели производится обработка входящих значений (какие-то частотные полосы вообще не несут значимой информации и не кодируются, какие-то нужно закодировать с большей разрядностью, какие-то с меньшей), результатом которой является существенное уменьшение потока данных. Интересно, что психоакустическая модель, используемая кодером, может меняться, так как параметры модели передаются в потоке AC3 и затем могут использоваться декодером для восстановления исходного звучания. Еще одним способом уменьшения потока данных является объединение данных из разных каналов. В реальной многоканальной фонограмме в нескольких каналах звуковая информация зачастую пересекается, и ее можно закодировать один раз для всех, а не для каждого канала в отдельности. Эта техника применяется только для частот выше 10 кГц, что позволяет сохранить локализацию источников звука, а при том, что в распоряжении кодера есть целых пять полноценных звуковых каналов и, соответственно, широкое поле для маневра, поток данных этим способ можно уменьшить довольно значительно.
-(article reproduced from http://www.mp3-tech.org)
 ===== Внешние ссылки =====
-  * [[ha>AC3]AC3 на Hydrogenaudio]
+  * [[ha>AC3|AC3 на Hydrogenaudio]]
   * [[http://www.stel.ru/multimedia/help/item/item_ferra.php|Звуковое кружево, или Долби всё вокруг!]]
   * [[http://www.atsc.org/standards/a_52a.pdf|Стандарт AC3]]

foobar2000

Инструменты пользователя

Инструменты сайта

Различия

Инструменты страницы