Главная страница
Составление описей (метаданных)
Опыт создания страховой копии фонда использования рукописных материалов архива.1


     Библиотека, или архив, сформированные до ХХI века, хранят документы в основном на бумажных носителях и лишь в последнее время комплектуются электронными. В силу того, что бумага постепенно ветшает, а чернила выцветают, срок хранения таких документов ограничен. Таким образом, вопрос о переводе материалов в электронную форму всегда актуален.

Электронными, документы на бумажной основе становятся в результате сканирования, после чего, пройдя учет и систематизацию2 могут использоваться в научной работе. При распечатке полученных материалов на профессиональном оборудовании, можно в какой-то степени воссоздать оригинальный документ.


Планетарный сканер.

     Сканирование требует больших затрат по времени, определенных финансовых вложений, а также, достаточного количества квалифицированных сотрудников. В небольших архивах, или библиотеках, практически лишенных финансовой поддержки со стороны государства, и вынужденных искать финансирование за счет грантов, очень сложно организовать профессиональное сканирование. Один из способов выйти из сложившейся ситуации, это осуществить полистную фотосъемку архивных материалов. Такой ход позволит ученым ввести материалы в научный оборот и вместе с этим сберечь бумажные первоисточники.
     Следует заметить, что идея использования сфотографированных текстов не нова, поскольку «....ввод данных (библиографических или музейных описаний) с клавиатуры крайне трудоемок и занимает много времени. Для того, чтобы избавиться от этих недостатков как библиотеки, так и музеи используют технологию ретроконверсии, которая обеспечивает быстрое и качественное наполнение БД».3


Старые тетради описей.

     Опыт работы по оцифровке фондов Фонограммархива Института языка, литературы и истории показал, что для более эффективной работы под рукой необходимо иметь описи, помогающие сверять соответствие текста с аудиозаписями. Описи Фонограммархива представляют собой большие канцелярские тетради. Их начали вести с пятидесятых годов XX века. За десятилетия активной эксплуатации бумага состарилась, поэтому в восьмидесятых, первые две тетради были полностью переписаны от руки. В 2009 году было выполнено копирование страниц журналов на лазерном копировальном аппарате. К сожалению, оптимальный вариант – сканирование в цифровой графический формат, не состоялся в виду отсутствия средств и достаточного количества сотрудников. Заняться такой работой и сегодня не представляется возможным.


Разворот описи (1975 г.).

     Фотографирование (фотокопирование), это как раз тот случай, когда предоставляется возможность очень быстро создать электронную копию архивных канцелярских книг. Здесь, в тексте, такая копия названа страховой, поскольку в некотором роде выполняет эту функцию.4 В действительности страховой фонд пополняется материалами, по качеству очень близкими оригиналу. Фотоаппарат, вследствие оптических искажений и низкого качества «матрицы» (т.е. прибора с зарядовой связью) не может дать хорошего снимка листов тетради. Судя по всему, полученные документы правильней будет отнести к фонду использования, поскольку они идентичны оригиналам по содержимому и мало отличаются визуально.

     Фотокопирование предъявляет низкие требования к осуществляемому проекту, предполагая наличие недорогого цифрового фотоаппарата и хорошо освещенного рабочего места. Фотоаппарат настраивают таким образом, чтобы текст на полученном фотоснимке страниц журнала свободно читался. Страница канцелярской тетради имеет формат А4, с размерами 30 на 21 сантиметр (примерно), а разворот — А3, соответственно 30 х 42.

     В Фонограммархиве ИЯЛИ фотосъемка осуществлялась с предустановленными размерами фотоснимка 2816 х 2112 точек. Такое разрешение составляет 6 mpix (6 000 000 пикселей, или точек, формирующих электронное изображение) и соответствует максимальному разрешению использовавшегося фотоаппарата Canon.


Цифровой фотоаппарат Canon PowerShot A-540.

     Если произвести расчет (например, программой dpi-counter5), то при плотности печати 300 dpi, документ будет качественно распечатан с размерами 29 х 22 сантиметра. Хотя указанные размеры далеки от используемых при архивном сканировании, для применения в научной работе этого вполне достаточно.


Ввод топонимов с карточек в базу данных.

     В Институте языка литературы и истории находится сектор языкознания, где работают топонимисты, создавшие обширную картотеку топонимов Карелии. И хотя, по целому ряду грантов РГНФ и Президиума РАН карточки постепенно набираются в электронную базу данных, автор данной статьи счел необходимым произвести экспериментальную фотосъемку одного из каталожных ящиков с целью выявления скорости работы и качества получающихся электронных копий документов.


Картотека топонимов ИЯЛИ КарНЦ РАН.

     Из всего каталога был выбран ящик, полностью заполненный карточками. Фотосъемка проводилась при дневном свете таким образом, чтобы исключить попадание прямых солнечных лучей на страницы документов.6 Режим фотовспышки в фотоаппарате был отключен. Опция "Баланс белого" в функциях фотоаппарата принудительно выставлена в положение "дневной свет".


Каталожный ящик № 22.

     Размеры фотографий должны обеспечить свободное прочтение с экрана монитора текста, отображенного на карточке, или текста страницы описи. Слишком большие разрешения фотоснимков требуют огромных объемов дискового пространства, предназначенного для хранения фотофайлов. В этой связи, операционной системе необходимо дополнительное время для отображения электронных документов, что в конечном счете создаст неудобства, замедлив работу. Указанный минимум достаточен для пользовательских материалов, а высокая степень сжатия файла JPEG значительно снизит объемы файлов.

     Полученный таким образом электронный образ позволяет:
- Решить вопрос сохранности описей/карточек, путем формирования его страховой и вместе с тем пользовательской копии, пусть и относительно низкого качества.
- Во время работы с картотекой не обращаться к бумажным карточкам (не амортизировать оригиналы).
- При желании распечатывать любые отдельные электронные страницы.
- Дает исследователю возможность работать с описями/карточками дома или в экспедиции, поскольку электронная копия даже обширной картотеки помещается на карманный флеш-накопитель.

     Из отрицательных сторон можно отметить только труд, потраченный напрасно, ведь в будущем все равно данные придется вносить в базу данных, хоть с карточек, хоть с экрана монитора (правда, по мнению отдельных исследователей, с фотофайлов текст в базу набирать комфортей).


Фотографирование карточек на Olympus C-770uz.

     Несколько слов хотелось бы сказать о технических деталях эксперимента. Для формирования 30-ти журналов описей Фонограммархива использовался фотоаппарат Canon PowerShot A-540. Фотографирование 104 разворотов журнала (по 2 страницы за один раз) заняло в среднем 25-30 минут. Фотосъемка книги производилось у окна при рассеянном дневном свете. В силу того, что тетради старые и хорошо открываются на сгибах, прижимать разворот не приходилось, хотя иногда требовалось подложить под обложку любой предмет (другой журнал), для предотвращения самопроизвольного перелистывания страницы.


Canon. Выбран режим макросъемки (цветочек).



Canon. Выбрано разрешение 640x480 точек (слева в значке буква s красным по белому - высшее качество JPEG)



Canon. Выбрано разрешение 1600x1200 точек, 2 Mpix (слева S красным по белому - высшее качество JPEG)

     В настоящее время электронная копия насчитывает 18 журналов. Полученными документами приходится часто пользоваться и это действительно удобно. Поиск страницы с необходимым номером единицы хранения занимает считанные секунды. Несмотря на то, что фотоаппарат назначает специфические названия фотофайлам, они переименовываются, по мере обращения к электронным описям.
     В качестве разнообразия, топонимические материалы фотографировались старой моделью фотоаппарата Olympus C-770uz с разрешающей способностью 4 mpix.


Цифровой фотоаппарат Olympus C-770uz.

     Фотоаппаратом нелегко пользоваться: часто сбивались настройки диафрагмы, поэтому снимки получились низкого качества. Размер фотоснимка был выбран 1024 х 768 точек с параметрами сжатия "High Quality JPEG" (незначительное сжатие, т. е. почти без ухудшения качества снимка). В фотоаппарате были отключены все звуки и автоматические функции, для ускорения работы техники. Отобранный ящик содержал 1442 карточки с топонимами, размер которых в среднем составлял 12 х 8 см.


Размеры карточки с топонимами.

     В течение одного часа удалось сфотографировать 435 карточек, после чего разрядился аккумулятор. Впрочем, допускается использование блока питания, если фотоаппарат при длительной работе не перегревается. На следующий день в течение часа, специально отведенного на эксперимент, было отснято еще 449 карточек. На третий день за 1 час 13 минут, последние 488 карточек при разрешении фотоснимка 1280 х 960.


Размер ящика 44 см. Зная толщину группы карточек можно практически точно подсчитать их общее число и объем работ по фотографированию архива.

     Во всех случаях текст на «электронных карточках» легко читался. Некоторые карточки содержали надписи на обратной стороне. Пальцы, попавшие в кадр и закрывающие незаполненную надписями часть карточки, служат своеобразным указателем оборота.


Лицевая сторона топонимической карточки.



Оборотная сторона той же карточки.

     Поскольку основная цель, это быстрое получение «электронных карточек», то высокие требования предъявлялись лишь к тексту на снимке. Дополнительно к материалам картотеки, были сфотографированы 32 корешка (закладки), приклеенных к карточкам.


Закладки.

     В объектив попал и сам каталожный ящик. В итоге, работа заняла три с половиной часа. Хочется добавить, что в качестве обеспечения сохранности полученного каталога фотофайлов, рекомендуется создать его копию, обработанную (в целях защиты от повреждения) приложением ICEECC.7


Ящик картотеки Сектора языкознания.

     В виду того, что алгоритм работы достаточно прост и универсален, методика создания электронного образа может быть использована при работе с другими материалами или в других областях, например, в этнографии, фольклористике. Учитывая вредные условия труда с археологическими находками (каменная пыль), предварительная фотосъемка объектов помогает быстрее и точнее найти и определить находку в одном из множества секций некоторой группы шкафов. Та же ситуация с историческими документами, которые обрабатывают специальными составами. Фотографирование, осуществляемое, как правило, в краткие сроки, в дальнейшем убережет исследователей от многочасовой работы с ветхими бумажными документами. Электронный образ будет актуальным еще долгое время, пока бумажные материалы ожидают качественного сканирования.

     Данная методика может пригодиться небольшим библиотекам и архивам не имеющим возможность оплачивать работу программистам за написание базы данных, или нанимать сотрудников для ввода информации в уже существующую (например, собранную «на скорую руку» в приложении Microsoft Access). Однако, хотелось бы повториться, несмотря на то, что создание электронного образа не решает проблему профессионального и качественного сканирования документов архива или библиотеки, в ряде случаев может оказаться весьма полезным и существенно облегчить работу исследователя с материалами.


1 Доклад прочитан на научной конференции "Собирательство культурного наследия Северо-запада (ученые, экспедиции, коллекции)" в Санкт-Петербургском научном центре Института русской литературы (Пушкинский Дом), в 2013 г.
2 Н.В. Ушаков. Учет и описание цифровых полевых материалов. Радловский сборник: научные исследования и музейные проекты МАЭ РАН в 2012 г. СПб., 2013. С. 442. - URL: http://www.kunstkamera.ru/files/lib/978-5-88431-238-8/978-5-88431-238-8_60.pdf (дата обращения: 24.05.2014).
3 Ноль Л. Я. Сохранение электронных ресурсов по культурному наследию в музеях и библиотеках: общее и специфическое. - URL: http://www.gpntb.ru/win/inter-events/crimea2003/trud/tom1/sec/Doc103.HTML (дата обращения: 24.05.2014). Доклад Десятой Международной Конференции "Крым 2003". - URL: http://www.gpntb.ru/win/inter-events/crimea2003/index2.htm (дата обращения: 24.05.2014).
4 Gordon McKenna. Оцифровка: ландшафт стандартов для европейских музеев, архивов, библиотек. Публикация Рабочей группы 3 «Исследование стандартов и подготовка рекомендаций» проекта ATHENA. С. 8 - URL: http://www.minervaplus.ru/publish/standards_landscape.pdf (дата обращения: 18.05.2014). Авторы брошюры для обозначения таких копий используют термин - поиск «...оцифровка с целью поиска и извлечения оригинального материала».
5 Бовин В.Б. Понятие dpi (расчет размера изображения для печати). - URL: http://arstandard.narod.ru/image/dpiabout/dpiabout.html (дата обращения: 24.09.2015). См. также URL: http://rst.krc.karelia.ru/ (дата обращения: 17.02.2014).
6 Гоголева С. А. Создание оптимальных условий хранения документов на бумажной основе в архиве организации. - URL: http://www.archive.gov.tatarstan.ru/magazine/go/anonymous/main/?path=mg:/numbers/2009_1/10/03/ (дата обращения: 21.05.2014).
7 Бовин В.Б. Подготовка и хранение файлов фольклорно-этнографического материала на внешних носителях. Вэб-публикация статьи Международной научной конференции "Раскрывая культурное наследие: новые задачи для библиотек, архивов и музеев". - URL: http://cultural-heritage-conf.ru/publications/bovin.htm (дата обращения: 21.05.2014).

(C) Бовин В.Б.
Внесение изменений: 1.02.2012, 10.02.2012, 29.07.2015