Сравнение аудиоформатов: MP3, WMA, OGG
В девяностые годы 20-го века формат MP3 приобрел огромную популярность, отобрав пальму первенства у модульной (трекерной) музыки. И это не удивительно, ведь благодаря ему стало возможным записывать на один компакт-диск 12 часов музыки (при битрейте 128kbit/s). Но технологии не стоят на месте и появилось множество других форматов: MP3 Pro, Real Media Audio, Windows Media Audio, Ogg Vorbis и другие. Цель данной статьи сравнить три формата, пользующихся наибольшей популярностью, с точки зрения «размер / качество».
Методика сравнения
Для тестов использовалось следующее программное обеспечение:
- Sound Forge 7.0 — для извлечения музыки с аудио-компакт диска, сохранения ее в различных форматах и проведения спектрального анализа
- Adobe Premiere Pro 7.0 — для сохранения музыки в WMA с двухпроходным сжатием.
Музыкальная композиция переписывалась на жесткий диск в формат WAV. Затем производился спектральный анализ (эталон). После этого WAV файл преобразовывался в другие форматы с различными параметрами, повторно производился спектральный анализ и результат сравнивался с эталоном.
Спектральный анализ позволяет просмотреть частотные характеристики композиции. Горизонтальная шкала — частота, вертикальная — уровень громкости соответствующей частотной составляющей в децибелах. Сравнение графиков позволяет определить насколько тот или иной формат соответсвует эталону.
Сравнение
Для начала рассмотрим возможности исследуемых форматов:
MP3 | WMA 9 | OGG | |
---|---|---|---|
Максимальный битрейт | 320 | 500 | |
Постоянный битрейт | + | + | + |
Переменный битрейт | + | + | + |
Сжатие без потерь | — | + | — |
Двухпроходное сжатие | — | + | — |
Максимальная частота дискретизации | 48KHz | 96KHz | 48KHz |
Поддержка более двух каналов | — | + | + |
Как можно заметить, максимальный битрейт для WMA не указан. Дело в том, что он завит от настроек. Так, например, при постоянном битрейте, максимальное значение 320. При сжатии без потерь он колеблется от 500 до 1000 Kbit/s. Вообще же, при переменном битрейте пиковые значения ограничены сверху 10000 Kbit/s.
Начнем сравнение. Рассмотрим результат спектрального анализа оригинальной композиции (WAV):
Как видно в композиции присутсвутют звуки с частотой вплоть до 20000KHz, но нас интересуют частоты до 18000KHz, т.к. согласно данным исследований, большинство людей способно слышать звуки от 20Hz до 18000KHz. А теперь посмотрим, что станет после преобразования композиции в формат MP3 (CBR, 256Kbit/s):
Полный провал после 16000KHz. Но если если разница такая сильная, да еще в диапазоне, который слышит человеческое ухо, почему на слух разница незаметна? Дело в особенности слухового аппарата человека. Так, например, после громкого низкочастотного звука, человек какое-то время не способен услышать высокочастотный звук, и т.д. Именно на этом и основывается сжатие в формате MP3: удаляется «избыточная» информация, различить которую среднестатический человек не способен. Однако такой метод может давать промахи.
Может если выбрать переменный битрейт станет лучше? Проверим (MP3-VBR 80).
Вот так сюрприз. Стало только хуже, хотя и не сильно. А размер файла такой же как и MP3-CBR 256. Попытка увеличить битрейт до максимально возможного помогает, но не сильно.
А как дела у WMA? Итак, проверяем однопроходной WMA-CBR-256, но сначала приведем спектральный анализ оригинала, чтобы было удобнее сравнивать:
Результат лучше, чем у MP3. Спад начинается в районе 16000, но он не такой резкий как у MP3. Ситуация в переменным битрейтом такая же как и у MP3 — результат получается хуже, чем при постоянном битрейте. И что самое интересное, разницы между однопроходным и двухпроходным сжатием не видно.
Ну и теперь рассмотрим OGG (AVB-256):
OGG стал явным лидером по соотношению «размер файла / качество». Отличия от оригинала при битрейте 256Kbit/s начинаются только после 17000KHz, и дальнейщий спад идет плавно. Как у предыдущих форматов, переход на VBR снижает качество.
Заключение
Сюрпризом стало то, что переход на переменный битрейт при таком же размере конечного файла снижает качество.
Явный аутсайдер — MP3. Что же касается победителя, то тут не все так ясно. Да, при равных битрейтах, лидер — OGG. Но:
- заметить на слух разницу между OGG и WMA будет весьма затруднительно;
- OGG проигрывает по своим техническим возможностям WMA. Так, например, он не поддерживат сжатия без потерь;
- WMA — родной формат для ОС Windows и Windows Media Player. Тогда как для OGG требуется установка дополнительных средств, и к сожалению полностью подружить его с Windows Media Player не получится.