Преимущества и принцип работы кодека HikVision H.264+

Logo
26 Декабря 2018г
- 2 голоса

Просматривая спецификации современных камер HikVision, пытливый читатель непременно обратит внимание на заявленную поддержку стандарта сжатия видео H.264+. Подробное описание лицензируемого кодека H.264, также обозначаемого в специальной литературе, как AVC (Advanced Video Coding), можно отыскать даже в Википедии, но что же скрывается за красующимся справа знаком «плюс»: принципиально новые возможности, или все это — не более, чем маркетинговый трюк? Попробуем разобраться.

Предпосылки к разработке кодека H.264+

Стандарт сжатия H.264+ был разработан на основе алгоритмов H.264/AVC. Инженеры HikVision адаптировали популярный кодек под специфику задач, решаемых современными системами видеонаблюдения, и существенно улучшили компрессию без ущерба для качества изображения. Благодаря этому эксплуатация аппаратуры с поддержкой H.264+ позволяет снизить нагрузку на сеть, а также сократить объем видеоархива, оптимизировав затраты на построение и обслуживание охранной инфраструктуры.

В отличие от традиционной съемки, видеонаблюдение имеет три важные отличительные черты:

  1. фон сцены статичен и остается неизменным в течение продолжительного промежутка времени;
  2. практический интерес представляют только движущиеся объекты, появление которых в кадре может быть неравномерным;
  3. наблюдение ведется в круглосуточном режиме, в условиях непостоянного освещения.

С учетом данных особенностей, разработчикам кодека H.264+ удалось дополнительно повысить степень сжатия видеоданных за счет использования ряда инновационных технологий, ключевыми из которых являются кодирование с предсказанием на базе цифровой модели фона и динамическое управление видеопотоком. Рассмотрим перечисленные приемы по отдельности.

Принцип работы кодирования с предсказанием

Практически все актуальные алгоритмы обработки видео параллельно задействуют два метода сжатия: внутрикадровое и межкадровое. При внутрикадровом каждый кадр обрабатывается, как обособленное изображение, вследствие чего такой подход оказывается малоэффективным, так как в отличие от текстовой информации графика очень плохо поддается компрессии. Напротив, при межкадровом сжатии учитываются только динамические элементы в двух соседних кадрах. То есть, потенциально видеозапись статического изображения, в котором за время съемки не происходит никаких изменений, можно сжать до объема одного-единственного начального кадра.

При обработке видео формируются следующие типы кадров:

  • I-кадры (от английского «Intra-coded frames», их также принято называть опорными или ключевыми) — содержат информацию о статичных объектах, не меняющихся на протяжении длительного времени, и подвергаются внутрикадровой обработке;
  • P-кадры («Predicted frames», предсказанные кадры, также именуемые разностными) — несут в себе данные об участках сцены, претерпевших изменения, а также ссылки на соответствующие I-кадры. P-кадры подвергаются межкадровому сжатию;
  • B-кадры («Bi-predicted frames», или двунаправленные предсказанные кадры) — могут ссылаться на I-, P- и даже другие B-кадры (в соответствии со стандартом H.264, их число может достигать 32), причем как на предыдущие, так и на последующие.

Применительно к видеонаблюдению нетрудно догадаться, что в качестве опорных используются фоновые изображения, а в P-кадрах сохраняются данные о движущихся объектах. При этом ключевые кадры подвергаются максимально возможному сжатию, тогда как движущиеся объекты обрабатываются таким образом, чтобы их изображение оставалось качественным, а мелкие детали — хорошо различимыми.

Кстати, P-кадры называют «предсказанными» не случайно: дело в том, что для сокращения временной избыточности содержание последующего кадра вычисляется на основании данных, полученных из предыдущего. Разумеется, предсказание не может быть абсолютно точным, поэтому сцена корректируется исходя из разности между истинным изображением и предсказанным (эту погрешность принято называть «сигнал ошибки»). С первого взгляда такой подход кажется сложным, однако именно он позволяет добиться максимальной компрессии, тем более, что в ряде сценариев предсказание оказывается чрезвычайно точным (например, когда речь заходит о видеонаблюдении за проезжей частью, так как автомобили перемещаются линейно), позволяя дополнительно сэкономить вычислительные ресурсы.

В свою очередь, использование B-кадров расширяет возможности записи и воспроизведения. Поскольку они могут ссылаться не только на предыдущие, но и на последующие кадры, видеопоток, несущий информацию об однообразных, повторяющихся движениях (вращение колеса авто) можно дополнительно сжать. Кроме того, B-кадры позволяют в несколько раз сократить время доступа к видеоархиву, что особенно заметно при поиске конкретной сцены, так как для ее отображения понадобится распаковать лишь каждый второй или третий кадры, тогда как если бы кодек оперировал только I- и P-кадрами, то потребовалась бы декомпрессия всей последовательности изображений.

Интеллектуальное управление видеопотоком

Следующей особенностью кодека H.264+ является поддержка динамического изменения размера видеопотока в зависимости от времени суток, что особенно актуально для систем круглосуточного видеонаблюдения. Фирменные алгоритмы HikVision отслеживают динамику нагрузки на камеру в течение 24 часов, рассчитывая величину среднесуточных флуктуаций и корректируя степень сжатия видео с привязкой к прогнозируемой активности в кадре.

На приведенной схеме пиковая активность в кадре приходится на временной промежуток C (между 12 и 18 часами), тогда как утром и ночью снимаемая сцена статична (зоны A и B). Поток обрабатываемых данных при этом оказывается ниже практически на 95%, что помогает существенно сэкономить дисковое пространство. Конечная экономия зависит от количества движущихся объектов, интенсивности их перемещения и размера статичных участков, используемых при формировании I-кадров.

Чтобы лучше сориентироваться, можно воспользоваться следующей таблицей, позволяющей оценить перспективы использования кодека H.264+ в различных ситуациях.

Зона интереса Размер статичного фона Уровень активности в кадре Потенциальная экономия
Небольшой частный магазин малый средний 50%
Оживленная улица в дневное время средний высокий 65%
Промзона в ночное время суток большой минимальный 95%

Благодаря всему вышеперечисленному, кодек H.264+ оказывается идеальным решением для создания системы видеонаблюдения с применением камер высокой четкости (с разрешением Full HD и выше) на объектах, где необходимо вести непрерывную видеофиксацию, а возможности детекции движения допустимо задействовать лишь в сценариях видеоаналитики. Современный стандарт компрессии изображения позволяет существенно сократить издержки, связанные с архивацией и хранением данных, не жертвуя при этом качеством записи. Результаты можно оценить по следующему ролику, специально подготовленному специалистами HikVision.

Hikvision H.264+ Solution

Как видно, интеллектуальные алгоритмы делают H.264+ значительно эффективнее по сравнению с обычным H.264/AVC. И что немаловажно, при его использовании сохраняется обратная совместимость с аппаратным и программным обеспечением, поддерживающим стандарт H.264: таким образом вы нисколько не будете стеснены при подборе оборудования и прикладного ПО.

Преимущества и принцип работы кодека HikVision H.264+