Что мы знаем о технологиях, использующихся для передачи звука в цифровом телевидении и радио? Обычно в разговорах о цифровых телевизионных стандартах основное внимание уделяют формату и качеству собственно изображения, в то время как звук воспринимается как нечто само собой разумеющееся. С другой стороны, нередки случаи фанатичного отношения к форматам звуковых дорожек, способам их воспроизведения и другим вещам, связанным с качеством звучания, доходящие до потери не только объективизма суждений, но и всяческого здравого смысла.

Истина, как обычно, находится где-то посередине. С одной стороны, в звуковых технологиях нет ничего таинственного или сверхъестественного, ведь на данный момент эта область науки уже изучена довольно хорошо, да и основное количество информации человек всё-таки получает визуально, а не посредством слуха. Однако неоднозначностей и недопонимания в вопросах передачи звука в цифровом телевидении тоже хватает, в том числе и среди людей, обладающих правом принятия решения об использовании той или иной вещательной технологии.

Как известно, цифровые телевизионные стандарты позволяют вдобавок к видеоряду передавать не только одну, но и несколько звуковых дорожек, которые могут нести в себе как разные языковые версии телепередачи, так и одинаковые по содержанию варианты одной и той же звуковой дорожки в различных форматах (например, закодированная в Dolby Digital пятиканальная дорожка и её обычный стереофонический аналог). Необходимость передачи одной и той же версии звукового сопровождения в нескольких разных стандартах может возникнуть из-за того, что не все приёмные устройства способны декодировать те или иные стандарты звука.

Именно о разнообразии этих стандартов и пойдёт речь в данной статье.

Как и в мире музыки, в цифровом телевидении самым вездесущим форматом звука является привычная нам стереофония. Причём если во времена аналоговых технологий возможность работы со стереозвуком присутствовала далеко не везде, то в цифровом оборудовании поддержка как минимум двух звуковых каналов имеется в абсолютно любом звене цепи создания и распространения телевизионного контента. Как не существует монофонических звуковых компакт-дисков (при необходимости записать на CD монофонический звук, одну и ту же монодорожку просто помещают и в левый, и в правый стереоканал), так и при цифровом вещании монофонических телеканалов звуковую дорожку, как правило, передают в форме стереопары, у которой оба канала несут одинаковое содержимое. И хотя техническая возможность передавать моно как моно теоретически и существует, на практике передавать моно как стерео оказывается даже проще.

Собственно, распространённые в нашей стране монофонические телеканалы на сегодняшний день являются таковыми лишь по старой привычке: проблема только в том, что большинство телезрителей до сих пор смотрит их через устаревшие аналоговые передатчики эфирного телевидения, обновлять которые для поддержки стереозвука нет смысла, ведь дни аналогового телевидения и так сочтены. Как только в нашей стране появится полноценное (а не экспериментальное) цифровое эфирное вещание, у каналов появится стимул для более полноценного использования того оборудования, которое у них уже и так есть.

Итак, какие же стандарты компрессии стереозвука используются в цифровом телевидении DVB?

Как и в случае с видео, для сжатия которого на сегодняшний день применяются два основных стандарта, старый MPEG-2 и более современный MPEG-4, для сжатия звука может использоваться как современный стандарт MPEG-4 AAC, так и устаревший MPEG-1 Layer II. Стандарт MPEG‑4 AAC (вместе с его низкобитрейтной версией HE AAC) на сегодняшний день является самым совершенным стандартом сжатия звука в мире.

По своей сути, это – улучшенная версия хорошо всем нам знакомого MP3. Хотя первая версия стандарта AAC появилась на свет ещё в 1997 году (на шесть лет позже, чем MP3), широко известным он стал лишь в 2003-м, когда фирма Apple объявила его «родным» форматом для плееров iPod и магазина музыки iTunes. В том же году в Японии было запущено цифровое эфирное телевизионное вещание, использующее AAC для передачи звука. В 2003 году появилось расширение HE AAC, призванное улучшить качество звука при низких (например, ниже 128 кбит/с) битрейтах, а в 2006 году увидел свет HE AAC v2, обратно совместимый с HE AAC кодек для ещё более низких битрейтов. В цифровом телевидении «поколения MPEG‑4» обычно используют именно HE AAC, и все AAC-совместимые DVB-приёмники его обязательно поддерживают.

MPEG-1 Layer II, более старый из использующихся в DVB-вещании стандартов сжатия звука, является полной противоположностью AAC. Если AAC – это улучшенная версия MP3, то MPEG-1 Layer II – его ухудшенная версия, причём ухудшенная в буквальном смысле этого слова: аббревиатура «MP3» расшифровывается как MPEG-1 Layer III, а вот MPEG-1 Layer II – это его упрощённый, менее ресурсоёмкий вариант.

Ресурсоёмкость была важной проблемой в те времена, когда даже тысячедолларовый персональный компьютер не обладал достаточным быстродействием для воспроизведения MP3 в реальном времени. Это сегодня способностью декодировать MP3 обладают даже самые простые электронные устройства, но пятнадцать лет назад ситуация была совсем иной. Времена изменились, а стандарт MPEG-1 Layer II так и остался «заточен» сугубо под потребности пятнадцатилетней давности.

Таким образом, для того, чтобы получить уровень качества звука аналогичный 192 кбит/с для MP3, при использовании AAC нам понадобится битрейт 128 кбит/с, а MPEG-1 Layer II – целых 320 кбит/с! Но самая главная беда даже не в этом. Казалось бы, ладно уж – давайте использовать битрейт 320 кбит/с и жить-не тужить. В конце концов, не такая уж это и растрата по сравнению с битрейтом видеопотока. Но проблема в том, что на практике никто не использует с MPEG-1 Layer II такие высокие битрейты, как 320 кбит/с. В реальной жизни на битрейте экономят, порой даже очень сильно, и это значит, что при использовании MPEG-1 Layer II качество звука страдает практически всегда.

К сожалению, не все ещё понимают, насколько устаревшим является MPEG‑1 Layer II, а учитывая то, как безответственно в нашей стране любят принимать ответственные решения, есть вполне реальный риск того, что кто-то вдруг решит использовать для украинского DVB-T не AAC, а MPEG‑1 Layer II. Мотивироваться это может разве что тем, что до сих пор тестовое вещание DVB-T велось именно в этом формате, и кто-то уже мог успеть обзавестись несовместимым с AAC приёмным оборудованием. Такая аргументация не выдерживает никакой критики: людей, смотрящих сейчас DVB-T, вообще чрезвычайно мало, а подавляющее большинство ресиверов DVB-T/MPEG-4 всё-таки поддерживают AAC. Поэтому обрекать всю страну на низкое качество звука из-за такой мелочи было бы просто глупо. Кстати, чем раньше будет осуществлён перевод тестового вещания DVB‑T/MPEG‑4 с MPEG‑1 Layer II на MPEG-4 AAC, тем меньшее будет «обиженных» после того, как это случится. А благоразумные поставщики «железа» уже сейчас завозят в Украину только те модели DVB-T ресиверов, которые поддерживают формат AAC, ведь они понимают, что вещание в устаревшем формате MPEG‑1 Layer II может быть переведено на AAC в любой момент, а после этого не работающие с этим форматом сет-топ-боксы просто никто не купит.

Разумеется, технические возможности звукового сопровождения цифрового телевидения не ограничиваются обычным двухканальным стереозвуком, и многоканальные форматы окружающего звучания (а-ля Dolby Digital) уже давно вошли в мировую телевизионную жизнь. Такой звуковой дорожкой может оснащаться любой цифровой канал – как обычной чёткости изображения, так и высокой (HDTV). Среди неспециалистов бытует ошибочное мнение, что звуковое сопровождение HDTV (телевидения высокой чёткости) обязательно должно быть многоканальным, и что многоканальный звук является частью понятия HDTV наряду с высоким качеством изображения. На самом же деле HD-каналы вполне могут сопровождаться и обычной стереодорожкой, ведь далеко не во всех случаях дополнительные затраты на производство телепередач с «окружающим» звуковым сопровождением могут быть оправданы.

Немало заблуждений связано и с самими форматами многоканального звука. Вообще-то, разобраться с ними лишь немного сложнее, чем с обычным стереозвуком: главное – понять, что один и тот же «комплект» из определённого количества каналов звука (например, пяти) может быть «упакован» в любой из возможных алгоритмов сжатия, и сама суть этих звуковых каналов от этого не изменится. Выбор алгоритма сжатия многоканального звука (Dolby Digital, DTS и т.п.) влияет, как и в случае со стереозвуком, исключительно на количество вносимых компрессией при том или ином битрейте искажений, причём нередко этот выбор определяется даже не техническими, а маркетингово-политическими соображениями.

Что же касается выбора количества каналов звука, то для звукового сопровождения телевизионных трансляций используются (и ожидается, что будут использоваться в обозримом будущем) только два формата объёмного звучания: 5.1 и 7.1. Число перед точкой означает количество полноценных каналов звука, а число после точки – количество так называемых каналов низкочастотных эффектов (low-frequency effect, LFE). Это каналы, частотный диапазон которых чрезвычайно ограничен: как следует из названия, они могут передавать только низкие частоты, что составляет, грубо говоря, одну десятую от полосы пропускания полноценного звукового канала. Именно поэтому низкочастотный канал обозначается как одна десятая от обычного канала, и именно поэтому формат 5.1 правильнее называть не шестиканальным, а пятиканальным.

Надо сказать, что на сегодняшний день низкочастотный канал представляет собой почти что атавизм: изначально формат звука 5.1 предназначался для кинотеатров (не домашних, а настоящих), в системе звукового оборудования которых низкочастотный канал был напрямую соединён с сабвуфером, отдельной акустической системой, предназначенной исключительно для воспроизведения низких частот. Так как в кинотеатрах демонстрируется только тщательно подготовленный специально для кинотеатров материал, дополнительных вмешательств в звуковой сигнал при такой схеме не требуется. Однако бытовые системы окружающего звучания гораздо разнообразнее кинотеатральных – например, сабвуфер в них может попросту отсутствовать. Не менее разнообразен и материал, который на них проигрывается, поэтому перед тем, как направить сигнал LFE-канала на сабвуфер, бытовой системе необходимо подмешать в него ещё и извлечённую из других каналов низкочастотную составляющую. На английском языке этот процесс называется bass management, «управление басом». В расчете на него при мастеринге многоканального звукового сопровождения для телепередач канал низкочастотных эффектов нередко просто оставляют пустым, поручая извлечение низких частот системе bass management звуковоспроизводящего устройства.

В случае использования формата 5.1 пять основных каналов располагаются следующим образом: два из них являются основными (фронтальными) – по сути, это привычная нам стереопара. Акустические системы ещё двух каналов располагаются сзади от слушателя – именно они добавляют тот самый эффект объёмности, ради которого это всё и затевалось. Пятый канал – центральный: он располагается в непосредственной близости от экрана телевизора или кинотеатра, так, чтобы идущий из него звук воспринимался как идущий от экрана. Зачем он нужен, спросите вы, ведь если подать звук одновременно в правый и левый фронтальные каналы, то он будет слышаться точно по центру и без никаких дополнительных динамиков? А вот и нет: такой приём будет работать только для зрителя, сидящего строго по центру между фронтальными АС, а если зритель сместится влево или вправо, то идущий из фронтальных каналов звук перестанет восприниматься как звучащий из экрана. А ведь такое соответствие очень важно для таких существенных элементов звуковой дорожки, как речь изображаемых на экране людей: она должна звучать именно из экрана, независимо от расположения зрителя в комнате. И как раз для этого и предназначен центральный канал.

dolbyDigital

Формат 7.1 отличается от 5.1 только тем, что к пяти перечисленным выше каналам добавляются ещё два боковых, для более точного позиционирования окружающих зрителя звуковых эффектов. В случае отсутствия дополнительных боковых акустических систем, семиканальный звук можно легко преобразовать в пятиканальный, просто смешав боковые каналы с теми, что есть. Подобным же образом можно и из многоканальной звуковой дорожки при необходимости получить обычное стерео: никаких сложностей здесь нет.

В настоящее время некоторые каналы из платных спутниковых пакетов (в основном, фильмовые) снабжаются многоканальной звуковой дорожкой в формате Dolby Digital вдобавок к обычной стереодорожке в формате MPEG-1 Layer II. Dolby Digital в данном случае используется по причине того, что до недавнего времени только этот формат должным образом поддерживался массовыми моделями недорогих спутниковых ресиверов и декодеров «домашнего кинотеатра», а также интерфейсами соединения между ними. Других достоинств у такого подхода нет: битрейт нерационально расходуется как самой дорожкой Dolby Digital (из-за того, что это далеко не самый современный стандарт сжатия звука), так и необходимостью использования дублирующей стереодорожки, закодированной в ещё более устаревший MPEG-1 Layer II.

Более новое, современное и эффективное решение этой задачи уже существует, и называется оно MPEG Surround. Идея MPEG Surround заключается в том, чтобы вдобавок к обычной стереодорожке передавать компактный набор специальной служебной информации, используя которую из стереодорожки можно восстановить исходный набор из любого количества каналов окружающего звучания. При этом основная стереодорожка может быть закодирована каким угодно кодеком (MPEG-1 Layer II, MPEG-4 AAC или любым другим), таким образом оставаясь совместимой с теми устройствами, которые ничего не знают о MPEG Surround. Объём такой добавочной информации впечатляюще мал: звук 5.1 хорошего качества можно уместить всего лишь в 32 кбит/с добавочного битрейта! Например, при использовании аудиокодека HE AAC для основной стереопары, MPEG Surround позволяет уместить окружающий звук формата 7.1 всего в 160 кбит/с, сохраняя при этом совместимость с ресиверами, «понимающими» только обычный стереозвук. Сравните это с 384 кбит/с для Dolby Digital, вдобавок к которому понадобится также нести и обычную стереодорожку.

Для того, чтобы использовать MPEG Surround на практике, его поддержка должна быть зашита в DVB-ресивер, а передавать многоканальный звук на усилитель (ресивер домашнего кинотеатра) можно будет в уже декодированном и разложенном по каналам виде по HDMI или какому-нибудь другому современному интерфейсу. Кстати, преимущества MPEG Surround дают возможность многоканальному звуку занять и некоторые другие новые ниши, например, он замечательно подойдёт и для цифрового радио. В автомобилях четыре акустических системы уже давно являются базовым набором – почему бы не использовать их под окружающий звук?

Подписывайтесь на наши сообщества в Viber и Telegram