Главная страница
Форматы файлов мультимедиа и их хранение
Подробно о выбранном формате *.jpg и параметрах сжатия изображения


    Практически в любую экспедицию собиратель брал и берет с собой фотоаппарат. Во второй половине XX века это были пленочные фотоаппараты, сегодня цифровые.
     Когда Фонограммархив ИЯЛИ начинал работу над сканированием документов на пленочной и бумажной основе, то в качестве формата для хранения выбирался TIFF. Очень многие рекомендуют после сканирования документы сохранять в этот формат (типография предпочитает такой формат). О формате JPEG отзываются негативно, дескать при сохранении в JPG теряется качество. Все хорошо кроме одного - большие объемы получающихся TIF-файлов. Мы начали поиски.
     Существует формат JPEG2000 и его бесплатный аналог OpenJPEG "open-jpeg". Программа упаковывает исходное изображение (например TIF) в JPEG так, чтобы при обратном преобразовании получить исходный TIF. В параметрах формата был найден прогрессивный режим (JPEG Progressive) его еще называют Interlaced (чрезстрочный, что более точно описывает алгоритм). Суть в том, что при загрузке такой фотографии из Интернет сначала отображается некоторая часть фотографии, состоящая из редких горизонтальных линий. На следующем этапе линий становится больше и так до тех пор, пока не будет нарисована вся картинка. Уже на начальном этапе загрузки фотофайла можно в общих чертах рассмотреть изображение и решить, ожидать ли окончательной его загрузки, или перейти к просмотру другой фотографии. Такой прием применяется в формате GIF. Но свойства Progressive оказались привлекательными для архива. Выяснилось, что незначительные повреждения Progressive-файла фотографии, не приводят к полной потере архивной единицы хранения. В изображении некоторая часть рисунка становится слегка размытой (из-за потери определенного числа горизонтальных полос). Остальные форматы (кроме JPEG Progressive, PNG Progressive) при таких разрушениях не открыть и не просмотреть. По объему файл J2k ненамного больше JPG. Формат OpenJPEG открыт, значит и нет проблем с устареванием форматов.
     С освоением технологии хранения файлов ecc (ICEECC, "Подготовка и хранение файлов фольклорно-этнографического материала на внешних носителях"), сохранять файлы в формате J2K теперь нет необходимости. Но формат TIF велик, а что же PNG? Да, это современный формат, упаковывающий фото без потери качества. Размер фото PNG иногда в три раза меньше фото TIF. И здесь нас снова постигла некоторая неудача. Это появилось в процессе выявления параметра DPI при сканировании. С какими размерами (разрешением) необходимо сканировать документы, чтобы при последующей печати получить близкий к оригиналу документ? А тем временем часть документов уже была отсканирована в TIF, другая в PNG. Неудача в том, что для PNG потребуется достаточно много дисков DVD+R, а для TIF раза в три больше. Жесткие диски быстро заполняются, фотографии необходимо "скидывать" на какие-то носители долговременного хранения.
     При увеличении разрешения при сканировании, ухудшение картинки при сохранении ее в обычный формат JPEG незаметно. Потерю насыщенности цвета не обнаружить в огромном блоке, но она хорошо видна в малом. При сохранении в JPEG фотографии с разрешением 2048x1536 изменения обнаружить можно, а при 5000x6000 разве что на уровне программных инструментов.

     Таким образом, в зависимости от насыщенности цвета оригинального документа и разрешения при сканировании, допускается сохранение в формат JPEG с параметрами качества 100% (иногда и 99%). При сканировании с низким разрешением используют PNG. Во всех случаях можно отказаться от параметра Progressive, если это ведет к увеличению размера получающегося графического файла. Если есть сомнения JPG, или PNG, следует выбирать PNG.
     Почему же выбор пал на JPG, ведь потеря насыщенности, это в своем роде утрата оригинального качества единицы хранения. То есть правило сохранения оригинала не соблюдается. В Фонограммархиве ИЯЛИ при работе по проекту "Создание информационной системы по фольклорному рукописному архиву Института ЯЛИ КарНЦ РАН." были приобретены сканеры. Сканирование одной и той же фотографии на двух в общем-то одинаковых сканерах давало разный результат. Причем различия были гораздо более тех потерь насыщенности о которых здесь шла речь. Что же влияет на качество сканирования документов?
1. Отсутствие высокоточного, профессионального сканера.
2. Наличие частиц пыли (отпечатков пальцев) на стекле.
3. Степень разогретости освещающей лампы.
4. Другие, неучтенные факторы.

     Уже этих причин достаточно, чтобы понять что применение JPEG не так "губительно" для фотографий как уровень качества сканирующей аппаратуры, степень подготовки к сканированию и сам процесс перевода документов в электронный вид. На каждом сканере получающийся документ будет выглядеть по-разному.

     Разрешение при сканировании выбирается высокое. Это необходимо для последующей реставрации документа в графических редакторах. Считается, что профессиональная фотопленка 35 мм, это фото с разрешением 20 мегапикселей. В XX веке у собирателей такой фотопленки практически не было, поэтому выбрав разрешение сканирования фотонегатива (или слайда) даже 15 mpix, можно получить хорошие фото. При сканировании листа формата A4 картина уже меняется. Это огромные площади и в большинстве случаев сканер откажется захватить картинку с высоким разрешением. В некоторых ситуациях разрешение 4800 для листа A4 установить довольно проблематично. Продолжительность сканирования документа при таком разрешении - несколько минут. О выполнении какого-либо плана можно позабыть (особенно в рамках гранта). При вместительном архиве работа затянется на годы и десятилетия. Необходимо искать компромисс, уменьшать разрешение и использовать PNG, либо JPEG с качеством 100% .


(C) Бовин В.Б.
Внесение изменений: 01.02.2012, 10.08.2015