Инструменты пользователя

Инструменты сайта


codecs:lossy:ac3

Различия

Здесь показаны различия между двумя версиями данной страницы.

Ссылка на это сравнение

Следующая версия
Предыдущая версия
codecs:lossy:ac3 [2007/03/26 08:59]
Spike создано
codecs:lossy:ac3 [2007/03/26 08:01] (текущий)
Строка 14: Строка 14:
 Как и [[codecs:​lossy:​MP3]] или [[codecs:​lossy:​AAC]],​ AC-3 использует определенные свойства звука и человеческого слуха для сжатия аудиоданных. ​ Как и [[codecs:​lossy:​MP3]] или [[codecs:​lossy:​AAC]],​ AC-3 использует определенные свойства звука и человеческого слуха для сжатия аудиоданных. ​
  
-{{codecs:​lossy:​ac3_enc.png|}}+{{codecs:​lossy:​ac3_enc.png|AC3 Encoder}}
  
 //​Следующий абзац взят с ferra.ru// //​Следующий абзац взят с ferra.ru//
Строка 20: Строка 20:
 Используемая в Dolby Digital схема компрессии данных AC3 обладает очень высокой эффективностью (коэффициент сжатия может быть более 12:1, поддерживаемые битрейты от 32 до 640 кбит/​с,​ в кино используется 320 кбит/​с) и при этом довольно высоким субъективным качеством звука. AC3, как и все современные схемы сжатия данных звуковых потоков (в частности,​ MP3), использует в своей работе особенности слухового восприятия человека,​ или психоакустическую модель. Например,​ в присутствии громкого сигнала некоторой частоты более тихие и имеющие немного более высокую или низкую частоту звуки маскируются громким сигналом,​ то есть не слышны или слышны очень плохо. Также маскируются сигналы,​ звучащие после и даже перед громким звуком. Это явление позволяет не кодировать или кодировать с меньшей разрядностью маскируемые звуки. Компрессия данных осуществляется также путем недеструктивного избавления от избыточной информации,​ примерно по тем же алгоритмам,​ которые применяются в архиваторах ZIP или RAR. Для реализации этих схем входящий поток аудиоданных разбивается во времени (на перекрывающиеся блоки (фреймы) по 512 сэмплов,​ при частоте дискретизации 48 кГц это составляет 10,66 мс, если же в сигнале присутствуют резкие перепады уровня,​ то размер блока уменьшается вдвое, чтобы качественно передать эти быстрые скачки) и по частоте (весь звуковой диапазон в 24000 Гц разбивается на 256 сегментов,​ что дает ширину каждой полосы в 93,75 Гц). Затем звуковая информация в каждой частотной полосе из блока данных переводится в формат числа с плавающей запятой (количество бит в целочисленной мантиссе и экспоненте является переменным),​ и по определенной психоакустической модели производится обработка входящих значений (какие-то частотные полосы вообще не несут значимой информации и не кодируются,​ какие-то нужно закодировать с большей разрядностью,​ какие-то с меньшей),​ результатом которой является существенное уменьшение потока данных. Интересно,​ что психоакустическая модель,​ используемая кодером,​ может меняться,​ так как параметры модели передаются в потоке AC3 и затем могут использоваться декодером для восстановления исходного звучания. Еще одним способом уменьшения потока данных является объединение данных из разных каналов. В реальной многоканальной фонограмме в нескольких каналах звуковая информация зачастую пересекается,​ и ее можно закодировать один раз для всех, а не для каждого канала в отдельности. Эта техника применяется только для частот выше 10 кГц, что позволяет сохранить локализацию источников звука, а при том, что в распоряжении кодера есть целых пять полноценных звуковых каналов и, соответственно,​ широкое поле для маневра,​ поток данных этим способ можно уменьшить довольно значительно. Используемая в Dolby Digital схема компрессии данных AC3 обладает очень высокой эффективностью (коэффициент сжатия может быть более 12:1, поддерживаемые битрейты от 32 до 640 кбит/​с,​ в кино используется 320 кбит/​с) и при этом довольно высоким субъективным качеством звука. AC3, как и все современные схемы сжатия данных звуковых потоков (в частности,​ MP3), использует в своей работе особенности слухового восприятия человека,​ или психоакустическую модель. Например,​ в присутствии громкого сигнала некоторой частоты более тихие и имеющие немного более высокую или низкую частоту звуки маскируются громким сигналом,​ то есть не слышны или слышны очень плохо. Также маскируются сигналы,​ звучащие после и даже перед громким звуком. Это явление позволяет не кодировать или кодировать с меньшей разрядностью маскируемые звуки. Компрессия данных осуществляется также путем недеструктивного избавления от избыточной информации,​ примерно по тем же алгоритмам,​ которые применяются в архиваторах ZIP или RAR. Для реализации этих схем входящий поток аудиоданных разбивается во времени (на перекрывающиеся блоки (фреймы) по 512 сэмплов,​ при частоте дискретизации 48 кГц это составляет 10,66 мс, если же в сигнале присутствуют резкие перепады уровня,​ то размер блока уменьшается вдвое, чтобы качественно передать эти быстрые скачки) и по частоте (весь звуковой диапазон в 24000 Гц разбивается на 256 сегментов,​ что дает ширину каждой полосы в 93,75 Гц). Затем звуковая информация в каждой частотной полосе из блока данных переводится в формат числа с плавающей запятой (количество бит в целочисленной мантиссе и экспоненте является переменным),​ и по определенной психоакустической модели производится обработка входящих значений (какие-то частотные полосы вообще не несут значимой информации и не кодируются,​ какие-то нужно закодировать с большей разрядностью,​ какие-то с меньшей),​ результатом которой является существенное уменьшение потока данных. Интересно,​ что психоакустическая модель,​ используемая кодером,​ может меняться,​ так как параметры модели передаются в потоке AC3 и затем могут использоваться декодером для восстановления исходного звучания. Еще одним способом уменьшения потока данных является объединение данных из разных каналов. В реальной многоканальной фонограмме в нескольких каналах звуковая информация зачастую пересекается,​ и ее можно закодировать один раз для всех, а не для каждого канала в отдельности. Эта техника применяется только для частот выше 10 кГц, что позволяет сохранить локализацию источников звука, а при том, что в распоряжении кодера есть целых пять полноценных звуковых каналов и, соответственно,​ широкое поле для маневра,​ поток данных этим способ можно уменьшить довольно значительно.
  
- 
-(article reproduced from http://​www.mp3-tech.org) 
  
  
 ===== Внешние ссылки ===== ===== Внешние ссылки =====
-  * [[ha>AC3]AC3 на Hydrogenaudio]+  * [[ha>AC3|AC3 на Hydrogenaudio]]
   * [[http://​www.stel.ru/​multimedia/​help/​item/​item_ferra.php|Звуковое кружево,​ или Долби всё вокруг!]]   * [[http://​www.stel.ru/​multimedia/​help/​item/​item_ferra.php|Звуковое кружево,​ или Долби всё вокруг!]]
   * [[http://​www.atsc.org/​standards/​a_52a.pdf|Стандарт AC3]]   * [[http://​www.atsc.org/​standards/​a_52a.pdf|Стандарт AC3]]
  
codecs/lossy/ac3.1174885164.txt.gz · Последние изменения: 2007/03/26 07:59 (внешнее изменение)