Главная страница
Форматы файлов мультимедиа и их хранение
Подробно о выбранном формате *.avi и параметрах видеосжатия


    Перезапись видео с видеокассет в компьютер (видеозахват), процесс из нелегких, поэтому необходимо кое-что знать о принятых форматах. IASA (International Association of Sound and Audiovisual Archives) рекомендует оцифровывать в формат MPEG-2 (контейнер mpg),1 в Фонограммархиве ИЯЛИ захват осуществляется в формат DV (контейнер avi).

     Вообще, в видеоформатах есть два подхода к сжатию видео. Один из них представляет видеофайл фильма как набор кадров, фотографий JPG, другой только с приходом ключевого кадра (по-умолчанию каждый 10 - 15 кадр) вставляет фотографию, а во всех остальных кадрах "дорисовывает" лишь изменившиеся участки изображения. С применением второго подхода (MPEG-4) достигается высокая степень сжатия исходного материала, но здесь есть свои минусы. К первому типу относят кодеки DV, MJPEG, ко второму x264, Xvid. Если в процессе воспроизведения возникнет некоторый сбой, то на экране фильма DV почти незаметно пропадет кадр. При сбое в воспроизведении MPEG4 на экране появится "мусор" из различных точек, которые пропадут спустя некоторое время (до следующего ключевого кадра). Сотрудники IASA считают, что для фольклорно-этнографического видео хранение в таком формате не допускается. Но, времена меняются и развитие информационных технологий способно менять некоторые рекомендации.

     Вообще, говоря о сохранении видео, по приезду из экспедиции необходимо сразу же защитить файлы фильма программой ICEECC. Затем просмотреть все видеозаписи и убедиться, что изображение в порядке (просмотр в любом случае необходим для составления описи). Теперь можно не опасаться сбоев, видеофайлы надежно защищены. С применением ICEECC уже нет разницы в каком формате хранятся экспедиционные записи в MPEG-4, или MPEG-2.

     Путей получения цифрового видео несколько, один из них, видеозахват кассет с видеозаписями. Обилие форматов видеокассет и стандартов записи привносят определенную сложность при видеозахвате, но в основном, кассеты DV, MiniDV, VHS, или S-VHS оцифровываются в формат DV (контейнер avi) с размерами кадра 720 х 576 (иногда 768 x 576) точек и скоростью воспроизведения 25 кадров в секунду (50 полукадров). В результате объем получающегося файла довольно велик - 13 Гигабайт на час видео. При захвате трехчасовой видеокассеты файлы заполнят 40 Гигибайт дискового пространства. Такое видео с успехом можно сжать видеокодеком "x264", уменьшив размер файла более чем вдвое, но при этом немного пострадает качество изображения.

     Без применения дополнительного сжатия2, на трехчасовую видеокассету потребуется упаковка (туба) из 10 DVD+R дисков для хранения оригиналов и столько же дисков для ECC-копий, полученных в программе ICEECC. Здесь собиратель сам должен решить насколько ему ценны записи и стоит ли их сжимать (кодировать с помощью x264), но серьезный архив может себе позволить дополнительные расходы на DVD-диски, поэтому видео оставляют в оригинале. В ходе экспериментов по сжатию, в Фонограммархиве удалось получить почти двукратное уменьшение размера файла после сжатия видео (кодек x264). При этом, потеря качества не наблюдалась невооруженным взглядом. Вооружившись же графической программой, глаз тут же обнаружил потерю насыщенности цвета для отдельных точек видеокадра (кодек в первую очередь пытается приглушить цвет, чтобы соседние точки изображения стали немножко похожи друг на друга и потому легко упаковывались). Однако, двукратное сжатие это мало, учитывая потерю качества. С таким можно было бы мириться получая трех, или четырехкратное уменьшение размера файла, поэтому решено было в архиве размещать только оригиналы. К счастью, видеокассет в архиве не более пятидесяти, поэтому такие расходы вполне допустимы учитывая ценность фольклорно-этнографического материала. Для тех кто не имеет возможности приобрести большое количество дисков DVD+R можно порекомендовать вышеуказанный вариант с уменьшением объема видео вдвое. В качестве утешения можно отметить, что говорить о высоком качестве оцифрованного видео не приходится в силу отсутствия профессионального оборудования для видеозахвата. Даже если оцифровать видеокассету дважды на одном и том же оборудовании, то видеофайлы все равно будут друг от друга отличаться.

     Видеозахват ведется в программе Pinnacle Studio-9 при использовании видеомонтажной платы от самой же Pinnacle. Можно захватывать видео с помощью телевизионных тюнеров, но здесь все снова упирается в степень ценности материалов, поскольку ТВ-тюнер в первую очередь рассчитан на прием телевизионного сигнала в компьютер, а Pinnacle изначально ориентируется на оцифровку. Компоненты платы ТВ-тюнера подбирались без учета качественной цветопередачи, поэтому при захвате с этого устройства не гарантируется высокое качество воспроизведения. Другая программа для видеозахвата - бесплатная VirtualDub (разумеется при использовании платы от Pinnacle). Сегодняшние версии достаточно стабильны, хотя при захвате наблюдались некоторые проблемы с видеокодеками, в основном, при захвате материала с MiniDV камер.
     Дело в том, что при съемке на видеокамеру стандарта MiniDV, на ленту, кроме видеоизображения записывается тайм-код. Тайм-код, это дата и время съемки. Если эти параметры не нужны, то оцифровку можно осуществлять в сторонних программах (даже Adobe Premiere).

     Однако, цель архивного хранения, это сохранение всех составляющих, поэтому тайм-код необходим!

     Pinnacle Studio имеет несколько версий, из которых 8 и 9 достаточно надежны. Десятая и последующие версии предъявляют особые требования к вычислительной мощности компьютера и если случится недостача таковых, то при захвате будут пропущены кадры (Drop Frames), что недопустимо для архивного фольклорно-этнографического материала. В последнее время (январь 2014 г.) я стал осторожно осваивать версию 10, поскольку 12...14 сильно "нагружали" центральный процессор. Однако, пока еще рекомендовать остерегаюсь, необходимо поработать месяц-другой. Pinnacle Studio рекомендуется также потому, что с ее помощью было проведено множество успешных экспериментов по видеозахвату. На выходе программа создает видеофайл формата DV в контейнере AVI.

     Для захвата использовался компьютер с параметрами: Core2Duo, 3 GHz, 2 Gb RAM, под управлением операционной системы Windows XP SP2. В системе Windows-7 не было замечено сбоев в работе, но во избежание каких-либо нештатных ситуаций Фонограммархив производит видеозахват в Windows XP. Не удалось проверить захват в системе Windows 8.1, но на первый взгляд, по скорости работы, эта система превосходит Windows-7.

     В операционных системах компьютера было создано множество аудио и видеокодеков. В последнее время прочное лидерство держит MPEG4 (AVC) с видеокодеком h264 (x264) и аудиокодеком AAC (Free AAC). Контейнер, это то, каким образом видео и аудиопоток будут складываться файл, а кодек это способ, которым будет сжиматься аудио и видеопоток. Например, контейнер avi и видеопоток, сжатый кодеком mjpeg - это чередование фотографий (кадров) и фрагментов звука (mp3, wav). Контейнер MP4 и видеопоток x264 это хранение в видеофайле ключевых кадров (целых фотографий) и отдельных фрагментов видеокадра, отличающихся от ключевого кадра. Звук может быть в формате mp3, но рекомендуется AAC (или AC3). Видеозапись, сжатую кодеком x264, со звуком mp3 можно поместить и в контейнер avi. Проигрыватели смогут воспроизвести такой фильм, но лучше придерживаться некоторых стандартов (см. "Воспроизведение видео на компьютере" и "Кодеки и контейнеры"). Расширение видеофайла как правило и определяет контейнер. В некоторых случаях невозможно определенный кодек разместить в каком-то контейнере. Так, звук в формате PCM WAV не разместить в контейнере mp4.

     В качестве краткого итога отметим, что видеозахват осуществляется в программе Pinnacle Studio, или VirtualDub в формате видео - DV и звука PCM WAV, несжатый (uncompressed), т.к. сжатие при захвате может привести к потере кадров независимо от мощности компьютера. К такой же потере может привести и запуск сторонних программ во время процесса видеозахвата. Поэтому отключаются мобильные телефоны, компьютер перезагружается. Запускается программа видеозахвата и ничего более. Полученные видеофайлы обрабатываются приложением ICEECC, после чего записываются на диски DVD+R. Для удобства мониторинга можно посчитать файлы контрольных сумм (MD5, SHA) для видеофайлов и разместить их на диске с оригиналами.

     Однако, судя по расчетам становится понятно, что полученный файл 40 Гбайт на диск объемом 4,5 Гбайт не записать. Верно, поэтому оцифровка ведется фрагментами, максимум по 18 (иногда 20) минут каждый. Если в пределах от 15 до 18 в видеозаписи был останов съемок, например, окончен опрос информанта, или поменялся вид съемки видео (смена плана), то это удачная позиция останова захвата. Необходимо подождать еще 5 - 7 секунд и остановить оцифровку. Последующую сессию захвата необходимо начать за 5-7 секунд до смены плана (оцифровка внахлест). Если сюжет не заканчивается (продолжительный опрос), а время оцифровки приближается к 18, то начиная с 17-й минуты в кадре ищут движения. Например, информант моргнул глазами, поднял руку, повернулся. По этим изменениям в кадре при монтаже можно будет объединить оба фрагмента. Последующий захват должен начинаться на 5 - 7 секунд раньше обнаруженного движения. Такой метод видеозахвата удобен при последующем монтаже фильма. Кроме того, легче отыскать начало и конец записи. Час видеозаписи делится примерно на три части (13 Гбайт/3 = 3.4 Гбайт) и вмещается на диск DVD+R. В некоторых случаях (иногда довольно часто) продолжительность фрагментов составляет 5 - 10 минут. Это даже лучше, файлы будут иметь объем от 1 до 2 Гб. Кроме удобства записи на диск, такой метод видеозахвата позволяет избежать рассинхронизации видео и звука, которая может возникнуть при кратковременной потере сигнала с магнитной ленты (в силу разных причин программы видеомонтажа не считают это за выпадение кадра).

     После видеозахвата видеофайлы не редактируют. Обрезка начала и конца видеозаписи, полученной с камеры MiniDV в программе VirtualDub приводит к потере тайм-кода. То же самое происходит при редактировании в Pinnacle Studio. К счастью, тайм-код можно сохранить в текстовый файл, например, программой DV_Time (присутствует в каталоге файла-архива subtitlesoft.zip). Однако, встроить обратно в фильм можно только при последующем размещении в контейнере MKV (или MP4). Этот контейнер сегодня становится популярным, но программ, работающих с ним еще очень мало. Некоторые проигрыватели умеют "подхватывать" текстовый файл субтитров, имеющий то же имя файла, что и файл видеозаписи, поэтому контейнер для видео в принципе может быть любым. Когда вопрос заходит о сохранении субтитров (тайм-код), многие программы его просто игнорируют. Что касается записей VHS и Super-VHS, то на ленте тайм-кода нет и с установленной опцией Direct Stream Copy, начало и конец видеозаписи можно обрезать в приложении Virtual Dub. В Фонограммархиве ИЯЛИ в ходе эксперимента было установлено отсутствие искажения источника при редактировании в режиме Direct Stream Copy (файлы проверяли побайтно, изменяется только заголовок, дата создания файла, длина видео и пр.).

     В некоторых случаях, при неудачном видеозахвате, всю работу приходится делать заново, потеряв предыдущие 18 минут работы. С другой стороны, если материал не представляет особой ценности, такой щепетильной работы проводить не нужно. Здесь же рассматривается по-возможности точный перевод в электронную форму видеозаписей, представляющих культурное наследие (с учетом степени качества имеющегося оборудования).

Фонд использования
     Видео оцифровали и записали на диски DVD+R. После обработки исходного материала приложением ICEECC, получили файлы с теми же объемами, что и первоисточник (Redundancy со значением 100%) и также записали их на DVD+R. Поскольку в научной работе оригиналами пользуются редко, видеозаписи подвергают сжатию (например, кодек VP8, или x264). После обработки, вместо 13 Гигабайт, файл может занимать от 300 до 800 Мегабайт. Такой видеофильм уже можно скопировать на флеш-накопитель, чтобы описывать его дома. Как и в случае с аудиофайлами3, воспользуемся бесплатным приложением ffmpeg (сайт ffmpeg.zeranoe.com). Строка bat-файла будет следующей: for %%a in ("*.mov","*.mts","*.avi","*.mp4") do ffmpeg.exe -i "%%a" -qmin 4 -qmax 24 -ar 32000 -aq 0 -ac 2 -f webm -y "%%~na.webm"
Обработка видеозаписей может занимать до десяти и более часов, в зависимости от количества и качества видеозаписей, а также мощности компьютера. После обработки, рядом с оригиналами будут созданы файлы с расширением WEBM. За качество здесь отвечает фрагмент "-qmin 4 -qmax 24". Можно установить "-qmin 25 -qmax 35" и ухудшить качество видео, но при этом в два раза уменьшить размер файла4. Размер кадра устанавливают добавлением параметра "-s", например "-s 360x288". Изображение по всему видео будет масштабировано до указанного числа точек. Обычно, размер сторон делят на двое, что при разрешении 720x576 точек составит 360x288 точек. Для видеозаписей высокого разрешения 1920x1080 подойдет 960х540, или 640x360 точек (делим каждую сторону на 3). Уменьшение размера кадра позволяет воспроизводить фильм на маломощных компьютерах и дополнительно уменьшает размер видеофайла. Альтернативный вариант кодирования выглядит так: for %%a in ("*.avi", "*.mov", "*.mp4", "*.mkv", "*.mp*g") do ffmpeg.exe -i "%%a" -c:v libvpx -b:v 300k -acodec libvorbis -aq 1 -ac 2 -strict -2 -f webm -y "%%~na.webm"
За качество отвечает параметр "-b:v 300k" (рекомендуемые к тестированию значения от 50k до 1500k, от худшего к лучшему).
     Файлы контейнера webm появились сравнительно недавно. Свободный видеоформат (кодек VP8 от Google) интересен тем, что воспроизводится не только в проигрывателях, но и в браузерах. Такой видеофайл уже готов к размещению на вэб-страничке, при этом никаких программ для воспроизведения не требуется (всего одна-две строки html5-кода).

     Второй путь получения цифрового видео - цифровые фотоаппараты и видеокамеры. Качество получаемого видео зависит от настроек и профессионального уровня самой камеры. Эти файлы безо всяких преобразований отправляют в архив, предварительно создавая страховой фонд с помощью ICEECC. Записывают на лазерные диски, после чего создают фонд использования. Именно для таких записей я предполагал осуществлять пересжатие в один из распространенных форматов с целью избежать устаревания форматов и в какой-то мере защитить видеофайл (пересжатие выполняется с параметрами качества не хуже оригинала несмотря на расход дискового пространства).

     Но в действительности форматы файлов, получаемых с видеокамер достаточно распространены, а при использовании ICEECC проблема архивного сохранения самоликвидировалась.


1 IASA почему-то не сообщает, что "Использование стандартов MPEG-2 требует уплаты лицензионных отчислений держателям патентов через MPEG Licensing Association. Тексты стандартов MPEG-2 распространяются свободно, но не бесплатно" (см. сайт ISO).
2 Формат DV, это тоже сжатие, многократный повтор которого ведет к постепенной утрате качества изображения в кадре.
3 См. Подробно о выбранном формате *.wav и параметрах звукозаписи
4 Для желающих удалить у себя все оригиналы, предварительно упаковав видео в современный формат, можно рекомендовать параметр "-qmin 12 -qmax 16", при котором, например, мой глаз не заметил ухудшения качества изображения. По получающимся объемам можно кратко указать, что минутный образец с параметрами изображения 1920 на 1080 точек и 50 кадров в секунду "ужался" со 178 Мегабайт до 75 Мегабайт (более чем в половину) при параметрах "-qmin 12 -qmax 16" и до 18 Мб при "-qmin 30 -qmax 45" (почти в 10 раз!). Но сжатие уничтожает тайм-код! Его предварительно сохраняют (см. программу DV-Time и похожие).
(C) Бовин В.Б.
Внесение изменений: 01.02.2012, 09.08.2015