Разное о музыкальных форматах

«Как оно работает»

altПопытка объяснить принципы работы и отличия способов кодирования современных аудио форматов будет не проще, чем объяснение школьнику младших классов доказательства теоремы Гаусса. Все же попробуем…

При работе любого кодека исходный звук обрабатывается в два больших этапа. Первый – психоакустическое сжатие, при котором по сложным алгоритмам из файла выделяется и удаляется информация, которую кодек считает избыточной. Понятно, что чем совершеннее психоакустическая модель кодера, тем больше лишней информации будет удалено из потока и тем меньше пострадает слышимая часть. При этом некоторые ограничения накладывает и формат файла. Например, MP3 просто технически неспособен обрабатывать некоторые звуки без ошибки, что требует от разработчиков кодека больших усилий для сохранения приемлемого качества, в то время, как даже относительно простые AAC кодеры, используя менее совершенную психоакустическую модель, могут достигать лучших результатов.

Вторым этапом обработки является loseless сжатие, при котором вся информация дополнительно «дожимается» при помощи алгоритмов, схожих с теми, что используются в привычных нам архиваторах.

Так какая же информация считается «лишней»? Не секрет, что знакомый нам со школы постулат о способности человеческого слуха слышать частоты 20Гц-20кГц несколько льстит ушам многих из нас. Да, экспериментально доказано, что человек слышит (скорее, ощущает) частоты ниже и выше этого диапазона, только вот к музыке они имеет мало отношения. В действительности, даже владельцы особо чувствительных, «золотых» ушей не способны отличить музыкальную композицию с «обрезанными» до 19 килогерц частотами от оригинала, что уж говорить об обычных людях, для многих из которых к 30 годам этот порог опускается до 16 килогерц (вспомним, что CD способен хранить звуки вплоть до 22кГц). Плюс к тому чувствительность уха во всем спектре неоднородна (наиболее важен диапазон 1-4 кГц, соответствующий речи). Плюс эффект маскировки, благодаря которому мы с трудом различаем тихий звук мобильного телефона, находясь в шумном людном месте. Плюс инертность слуха уха, плюс… К слову, обмануть даже такой сложный и чувствительный инструмент, как человеческое ухо, проще, чем это может показаться.

Читать так же:  Musepack (MPEG plus),Real Audio

Располагая информацией о том, какие звуки мы слышим лучше, какие хуже, а какие не слышим вообще, кодек может значительно (при коэффициенте сжатия 1:5 большинство lossy кодеков может добиться результата, не отличимого на слух от оригинала) «облегчить» исходный файл. Разумеется, для более сильного сжатия приходится идти на компромиссы и жертвовать качеством, что, впрочем, может пройти незаметно для пользователя, ведь не все из вас могут сходу отличить MP3 файлы, кодированный с битрейтами 128 и 256 кбит/с.

Статьи по теме

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *

Back to top button