Главная страница
Форматы файлов мультимедиа и их хранение
Обслуживание внешних носителей (жестких дисков, CD/DVD, флеш-карт)


    Проверку дисков, необходимо регулярно выполнять в любом электронном архиве. Такие действия выявляют различные физические (повреждение носителя) и логические ошибки (нарушение целостности файлов, несоответствие рассчитанным ранее контрольным суммам). Физические ошибки возникают в результате следующих действий. Предположим, жесткий диск неосторожно положили на твердую поверхность (стол), или толкнули, сдвинули, случайно задели работающий системный блок компьютера. Несмотря на то, что в отключенном состоянии считывающие магнитные головки "припаркованы", от удара может нарушиться центровка стальных пластин диска. Незаметно, незначительно, совсем чуть-чуть. Однако, такая ситуация в будущем приведет к повышенному износу движущихся частей устройства, с постепенной потерей информации на носителе. При работающем компьютере, толчок и удар могут привести к тому, что магнитная головка жесткого диска прикоснется к поверхности стальных пластин. Вращаясь на большой скорости (5400 - 10000 оборотов в минуту) пластины, получат от головки небольшую царапину, которая постепенно будет увеличиваться (но все зависит, конечно же от состава и качества покрытия пластин). В точке расположения царапины возникнет сбойный блок (Bad Block - ошибки записи/чтения участка диска с хранящейся информацией), который постепенно будет "разрастаться". Сбойные блоки уже не могут корректно хранить информацию.

    Второй случай физического повреждения, это повышенное напряжение в электросети, или воздействие статического электричества на микросхемы контроллера диска. Например, комплектующие компьютера, к примеру, материнская плата выходит из строя, а жесткий диск, соединительным проводом (шлейфом) подключается непосредственно к ней, потому электронные комплектующие последнего (контроллер диска) тоже повреждаются (случается редко). Попросту, контроллер жесткого диска сгорает вместе с платой. Или же при включении компьютера (также нечасто) возникает скачок напряжения и жесткий диск "отпарковавшись" выводит магнитные головки на поверхность с некоторым уровнем записи. Поскольку головки в первую очередь выходят на поверхность, занятую таблицей размещения файлов, то несогласованная с операционной системой запись в эту область приводит к потере информации, отвечающей за расположение всех файлов на диске. В действительности файлы остаются неповрежденными, но "добраться" до них сложно, поскольку отсутствуют необходимые "координаты" (невероятно трудно вернуть данные на сильно фрагментированном диске). Кроме того, мне часто приходилось встречать людей, которые приносили вышедшие из строя примерно таким же образом флешки. Они утверждали, что ничего противоестественного не совершали. Установили флешку в гнездо USB и компьютер "завис", а после сброса и перезагрузки, система уже предлагала отформатировать флешку ссылаясь на отсутствие на ней каких-либо признаков файловой системы. В одних случаях флешки считались окончательно вышедшими из строя, в других достаточно было воспользоваться программами-утилитами наподобие R-Studio, Easy Recovery как большая часть, или все файлы успешно восстанавливались.

    О надежности компакт дисков (или дисков DVD) говорить не приходится. Сам диск уязвим перед царапинами. Но это лишь явные недостатки, а есть и скрытые и мы о них знаем совсем немного. Хоть и редко, но случается, что даже при бережном хранении, примерно в течение первых трех месяцев после записи информации на диск, возникают изменения в составе рабочего слоя диска, что в свою очередь ведет к потере записанных файлов. Известно одно, первые полгода - год, за компакт-диском необходимо наблюдать. Наблюдение, или мониторинг заключается в том, чтобы создать на жестком диске компьютера пустой каталог, установить компакт диск в устройство чтения лазерных дисков (привод DVD-ROM) и произвести копирование всей информации диска в компьютер. Успешное копирование свидетельствует о надежности хранения данных. Тем не менее, из статьи "Подготовка и хранение файлов...."1 известно, что успешное копирование не свидетельствует об идентичности материала (который перед записью хранился на жестком диске) и тем материалом, что теперь присутствует на CD/DVD. Копировать необходимо как исходные материалы, так и их копии, специально подготовленные приложением ICEECC, чтобы осуществить проверку на целостность хранимой информации. Если на диске с оригиналами хранятся файлы контрольных сумм (MD5, SHA), то достаточно произвести проверку прямо на дисках, без копирования файлов на компьютер.
    Справедливости ради хочется заметить, что обработке файлов программой ICEECC должны подвергаться все файлы. Те, что хранятся на компакт-дисках и те, что скопированы на выносные USB-жесткие диски. Таким образом, сбой, произошедший по вине оборудования и уничтоживший таблицу размещения файлов, не повредит хранящуюся на жестком диске информацию. В этом случае, утрата информации может возникнуть в виду полной потери работоспособности вышеуказанного оборудования.
    Вся эта информация наводит на мысль, что надежности у подобных носителей практически нет2, однако, при своевременном и регулярном мониторинге, можно избежать потерь мультимедийной информации.

    Обновление информации на жестких дисках.
    Не секрет, что на компьютерах пользователей, вместе с мультимедийным фольклорно-этнографическим материалом хранится информация, не имеющая прямого отношения к архиву. Безусловно, это программное обеспечение, файлы документации и т.д. Наконец, большую часть жестких дисков занимает оцифрованный материал. Не всегда удается очень быстро сформировать каталог для записи новой (или старой, но оцифрованной) единицы хранения. Подобную ситуацию составляют такие факторы как потеря времени на формирование каталога, именование файлов, подготовку ecc-копии, поиска и сканирования метаданных (авторские надписи на футлярах магнитных лент, а также листы с описями, приложенные к хранящейся магнитной ленте). Работа оставленная на следующий день постепенно накапливается. Конечно, приходит время и все материалы переписываются на внешние носители, но происходит это далеко не так часто как хотелось бы. В итоге, жесткий диск наполнен почти до отказа архивным материалом и прочими файлами. Операционная система, управляясь со своими системными файлами, а также архивным мультимедиа материалом непрерывно производит операции создания, редактирования, копирования и удаления файлов и каталогов. В силу разных причин, подобные действия не всегда заканчиваются успешно (компьютер завис, пропал ток в осветительной сети, негативное действие нового вирусного программного обеспечения). Возникают логические ошибки, которые не всегда устраняются силами операционной системы, особенно, если диск регулярно не проверяется на целостность файловой структуры, либо обращение к отдельным файлам достаточно редкое. В итоге может возникнуть ситуация, когда файл не может быть прочтен. После проверки файловой структуры диска, операционная система сообщает о неких перекрестных ссылках на файл информируя о том, что часть файла не может быть скопирована. Ко мне часто обращались с флешками, с которых почему-то не копируются файлы. Проверка файловой системы флешек не производилась годами. Ошибки постепенно накапливались, хотя какими-то файлами можно было пользоваться. Словом внешне не было никаких признаков для беспокойства. Лишь отдельные, редкоиспользуемые файлы и каталоги не открывались, или не копировались.
    Во избежание подобных ситуаций, жесткий диск компьютера, предназначенного для работ по архиву (оцифровка, сканирование, видеозахват, работа с базами данных и т.д.) разбивают на два логических. Таким образом, первый и меньший из них (первичный раздел) отводится под нужды операционной системы (для Windows XP, Windows 7 достаточно 28 гигабайт3), другой (расширенный раздел), для данных пользователя. При грамотном подходе и хорошем финансировании приобретают два отдельных физических жестких диска. Один для системы, другой, для файлов мультимедиа. Впрочем, при этом логических ошибок все равно не избежать. Тогда поступают следующим образом. Всю информацию, хранящуюся на диске переносят на другой носитель (такой же диск). Затем исходный диск форматируют, после чего информацию возвращают. Операция в какой-то мере рискованная (необходимо вести строгий учет объема файлов), но позволяет перезаписать каждый занимаемый файлами сектор диска.

    Копирование.
    Для копирования целого раздела жесткого диска объемом 320 гигабайт, необходим идентичный, или большего объема жесткий диск. Этот диск-получатель устанавливают в системный блок компьютера. Можно использовать и переносной USB-жесткий диск, правда в этом случае процесс копирования затянется надолго (более чем вчетверо, поскольку скорость передачи посредством USB 2.0 составит 20 мегабайт в секунду, а с помощью подключения в SATA-разъем материнской платы - до 90 Мб/сек). Объем флешек небольшой, поэтому создают папку на рабочем столе и "сбрасывают" туда всю информацию с флешки.

    Копирование рекомендуется осуществлять файловым менеджером, например, Double Commander, или Unreal Commander, либо с помощью приложения Проводник Windows (не желательно). При использовании Проводника, сбой при копировании файлов остановит всю операцию, Unreal Commander позволит пропустить нечитаемый файл и завершить операцию копирования всех файлов/каталогов полностью. Чтобы компьютер не "засыпал" (не запускалась заставка), можно использовать программу "DontSleep!" (сайт). После того, как файлы будут скопированы, необходимо подробнее исследовать причины ошибок чтения файлов (если таковые имели место). В некоторых случаях помогает перезагрузка операционной системы (файл/каталог был заблокирован). Если и после перезагрузки файл не копируется, то производят проверку файловой системы. Иногда, копирование файла можно произвести в операционной системе Linux (систему загружают с компакт-диска, или с флешки). Бывает, что файл достаточно "сдвинуть с места". В одной панели Unreal Commander курсор устанавливают на файл, например, "E:\каталог1\архив\документы\опись15.doc" на противоположной - корневой каталог (например, диск E:\). Клавишей [F6] осуществляют перемещение файла на противоположную панель, т.е. на диск E:\. При этом, содержимое файла остается без изменений, но в таблице размещения файлов, сведения о нем попадают в другую "ячейку" (сектор). Однако и это успешно осуществляется не всегда и спасает лишь при ошибках многократного вложения каталогов. Хочется отметить, что указанные случаи достаточно редки и желаемый файл все же скопируется. Почему нельзя сразу же осуществить проверку файловой системы перед копированием? Разумеется, проверку без исправления ошибок можно и нужно осуществлять, но если ошибки будут найдены, то при наличии разрешения на исправление, программа попытается выполнить работу по устранению ошибок и на моей памяти были случаи, когда в результате произведенной коррекции случайно удалялись и хорошо хранящиеся файлы. Впрочем, это все редкие случаи которых, надеюсь, у вас не возникнет. Копирование с помощью Unreal Commander положительно еще и в том, что действие распространяется на системные и на скрытые файлы и каталоги. С таким файловым менеджером ничто не скроется с глаз сотрудника архива.

    Итак, выше была поставлена задача "обновить" жесткий диск №1 , поэтому всю информацию "сбрасывают" на какой-то другой, надежный диск №2, после чего производят сравнение информации обоих дисков (все ли скопировалось?), затем диск №1 форматируют. После форматирования диска №1 информацию возвращают с диска №2 на диск №1. Эта "регенерация" необходима в случае, если информация на диске хранится уже много лет (5 и более). В ходе такой операции происходит перемагничивание рабочего слоя дисков, поэтому информация может храниться еще столько же времени. Полное копирование выявляет потенциальные ошибки файловой системы и это основная причина по которой производится "регенерация". Продолжительность копирования разнородной информации диска объемом 620 гигабайт отнимет 3 - 5 часов рабочего времени, поэтому работающий компьютер можно смело оставить на ночь без присмотра. Однако, требований пожарной безопасности никто не отменял. В местах соединений силовых кабелей не должно быть легковоспламеняющихся предметов. Вилки кабелей необходимо плотно вставить в разъемы во избежание искрения. Монитор можно отключить.
Завершая мысль о файловой структуре можно порекомендовать использование каталогов с именами, набранными латиницей (быстрее и легче восстанавливаются при сбое), а также избегать большого вложения каталогов наподобие d:\archive\audio\meropriyatiya\folklore\disk-01\seminar\sidorov\doklad5.ppt

    Проверка.
    Как узнать, что все скопировалось верно? Существуют специальные программы, которые подсчитывают объемы файлов и производят сравнение. Приложение BCompare, является наиболее удобным и простым из многих. В арсенале программы использованы практически все возможные способы сравнения. Приложение требует лицензии, но в режиме ознакомления проработает 30 дней. Такого срока достаточно для осуществления необходимого обслуживания жестких дисков. После запуска выбирают сравнение каталогов, после чего откроются две панели. В левой части выбирают источник (диск с которого осуществлялось копирование), в правой - получатель (только что скопированные файлы). Проверка начнется сразу же после выбора диска/каталога в правой части. Черным цветом будет отмечено полное сходство (что и ожидается увидеть). Другие расцветки указывают на различия по другим критериям. В приложении можно кликнуть на каталог, который отличается, при этом последний будет открыт. Автоматически откроется одноименный каталог на противоположной панели. Программа четко отображает различия, поэтому работать с ней комфортно. Лишь после детального обследования обоих дисков можно приступать к форматированию исходного жесткого диска.

    Бывает, что я иногда перепроверяю один из достаточно емких, скопировавшихся файлов командой /Файл/-/Сравнить по содержимому.../(это тоже Unreal Commander, или Double Commander), при этом, курсор устанавливается на файл источника, затем нажимается клавиша-пробел (текст имени файла при этом становится красным, выделяется). На противоположной панели (получатель) так же выделяется сохраненный файл (идентичный источнику), после чего в меню выбирается вышеуказанная команда. Ожидается, что в результате проверки Unreal Commander сообщит об идентичности исходного и скопированного документов. В других случаях можно создать файл контрольной суммы MD5 для проверяемого файла и заставить программу проверить сумму скопировавшегося файла (надежный способ). Однажды так выявился случай, когда половина файла не скопировалась (содержимое нули), хотя объем, дата и начало файла совпадали.

    Форматирование диска.
    Операция форматирования полностью удаляет таблицу размещения файлов, ликвидируя логические ошибки. Само собой разумеется, что форматирование вообще удаляет всю информацию с диска. Для осуществления форматирования операционную систему компьютера перезагружают (в основном для освобождения оперативной памяти). Кликом правой кнопки мыши на значке "Мой компьютер" открывают окно свойств, где отыскивают и "нажимают" на пункт "Управление" и в левой части другого появившегося окна выбирают пункт "Управление дисками". После прочтения сведений о дисках физических (расположены один под другим) и логических (расположены в одной строке), выводится информационная карта. Здесь ответственный момент!

    Следует очень внимательно следить за тем, какой диск выбирается для форматирования. Иногда важно подождать, выпить чаю, побеседовать с кем-то на различные темы, словом, не торопиться с форматированием. Лучший вариант - отложить мероприятие на следующий день. Правой кнопки мыши по разделу (логическому диску) можно вызвать "Проводник" и еще раз убедиться в том, что это подлежащий форматированию диск. Идеальный вариант, это отключить и вынуть из компьютера все диски кроме подлежащего форматированию. Можно сменить имя этого диска. Кликом той же правой кнопкой мыши по разделу вызывается вышеуказанное окно, где имеется надпись "Форматирование". Обычно, в параметрах форматирования выбирают файловую систему NTFS, а размер кластера "По умолчанию". Автор этой статьи устанавливает размер кластера 16 или 32 килобайта. Размер 16 используется для жестких дисков (или разделов, если диск ранее был разделен на несколько логических) объемом 160 Гб, а кластер 32 килобайта для дисков большего объема. Вообще, рекомендуют безбоязненно использовать все значения от 4 до 16 включительно, а со значениями 32 и 64 поостеречься (есть вероятность разного рода несовместимостей). За два года "использования" кластера 32 Кб, мне не удалось обнаружить проблем с файловой системой, а форматировать со значением 64 Кб на архивном диске еще не решился. Сегодня, после вышеуказанного обслуживания (отнявшего почти неделю для трех дисков по 600 гигабайт и двух по 160 Гб), все диски объемом более 120 гигабайт отформатировал в NTFS с размером кластера 32 Кб. При использовании кластера размером 4 Кб, общее число таких кластеров (групп секторов) огромно и файловой системе приходится обрабатывать колоссальные объемы информации. Увеличивая размер кластера до 32 Кб, нагрузка снижается в 8 раз. Сегодняшние процессоры мощны, поэтому пристального внимания на размер кластера обращать не стоит. Вполне достаточно пункта "По умолчанию". В окне также присутствует флажок "Быстрое форматирование", который снимают. Таким образом, будет произведено полное форматирование, занимающее очень продолжительное время.

    Форматирование, процесс ответственный. Во время этой операции, компьютер подключают к источнику бесперебойного питания (UPS). Сбой, или отключение системы при форматировании недопустимы. Толкать, качать, двигать системный блок компьютера во время форматирования нельзя. Если системный блок установлен на стол, то вышеуказанные требования относятся также к столу. Любая работа на компьютере при выполнении процедуры форматирования должна быть прекращена. Все эти рекомендации необходимы лишь для того, чтобы не повредить электромагнитные головки и поверхность пластин жесткого диска. Продолжительность форматирования жесткого диска объемом 620 гигабайт отнимет 2 или 3 часа рабочего времени. Желательно время от времени наблюдать за процессом. Разумеется, все заставки (хранители экрана) отключают. Схема питания: включен - постоянно, отключение жестких дисков - никогда. Если ничего не помогает и компьютер все равно идет в заставку, используйте программу "DontSleep!"


    Возвращение информации.
    После того, как диск будет отформатирован, операционную систему снова перезагружают. Когда компьютер будет готов к работе, этот же диск повторно форматируют с теми же параметрами, однако флажок "Быстрое форматирование" возвращают. Такое форматирование займет пару секунд. Даже если какой-то сбой во время полного форматирования и был, то это повлияло на сектора, которые все равно будут перезаписаны новой информацией, а вот насчет формирования таблицы размещения файлов нам мало что известно. Быстрое форматирование вмиг создаст таблицу, так что проследить за тем, произошел ли сбой электричества довольно легко.

    Следующий шаг, это отключение индексирования диска. В любом менеджере файлов (Проводник Windows) кликом правой кнопкой мыши по отформатированному диску вызывают окно свойств, где выбирают пункт "Свойства". Внизу снимают флажок "Разрешить индексирование диска для быстрого поиска". Кнопка "Применить", или "Ок" завершает действие. Система может сообщить о невозможности каких-то действий - "Пропустить".

    Теперь можно приступать к возвращению информации на диск. Если остальные диски отключались от компьютера, то завершают работу системы, подключают диски и снова запускают компьютер. С помощью того же файлового менеджера Unreal Commander на левой (или правой) панели выбирают диск, на который сохранялась информация (теперь, это источник), а на противоположной панели устанавливают получатель (отформатированный диск). Курсор устанавливают сверху списка и клавишей [Insert], которая находится над клавишами-стрелками начинают выделять все файлы и каталоги, двигаясь по списку вниз. Клавиша [F5] "стартует" копирование с активной панели (на которую установлен курсор) на противоположную.

    Возврат информации, это ответственная задача. За процессом необходимо наблюдать отвлекаясь минимально. Обычно такой процесс легче сопровождать чтением книги (даже с компьютера). Несмотря на то, что после возврата мы проверим оба диска приложением BCompare, на произошедший сбой в копировании желательно отреагировать интерактивно. Проанализировать причину останова. При этом хорошо наблюдается каталог, на котором остановилось копирование. Чаще всего этот каталог я копирую повторно с замещением находящихся файлов ("переписать каталог/файл?" - да). Затем возвращаю оставшуюся часть. В этом случае, успевшие скопироваться каталоги, выделять уже не нужно. Чтобы избежать сбоев, не включайте в список копирования системные каталоги "RECYCLER", "System Volume Information".
    В подавляющем большинстве случаев, возвращение информации проходит успешно. После операции копирования операционную систему перезагружают, чтобы запустить приложение BCompare для проверки источника и получателя. Содержимое обоих дисков идентично, за исключением системных файлов, указанных выше.

    Заключение.
    Вышеизложенное "обновление" файловой системы необходимо выполнять регулярно (раз в три - пять лет). Если информация находится на диске 2 - 3 года и при этом на таком диске производится копирование, создание, редактирование, удаление и переименование файлов, то хотя бы раз в 2 года диск нуждается в обновлении. В случае, если на диск только поступает информация (накопительный диск), то обновление можно производить каждые 5 - 7 лет. Внеплановое "обновление" необходимо сразу же после возникновения любого сбоя (пропало электричество в электроосветительной сети, зависание копирующих, создающих, редактирующих, удаляющих файлы приложений, результат выполнения вирусного программного обеспечения). В идеале конечно же отключать такой диск и подключать по мере необходимости.

    Раз в полгода рекомендуется обновлять информацию, хранящуюся на флеш-накопителях. Согласитесь, мало кто осуществляет такую операцию. Как правило, флешкой пользуемся годами удаляя и создавая на ней файлы. Между тем, файловая структура точно такая же и сбой приводит к последствиям подобным ситуации с жестким диском. Долговременно хранить информацию на "флешке" (особенно ценную и в единственном экземпляре) также не рекомендуется, поскольку восстановление вышедших из строя флешек пока не производят4. Операция происходит точно так же за исключением объема времени, которого на копирование информации потребуется существенно меньше.

    Что касается компакт-дисков и DVD, то обслуживание заключается лишь в копировании файлов на жесткий диск, проверки контрольных сумм и целостности файлов посредством приложения ICE ECC. Регулярность по желанию, но не реже 3 - 5 лет.

     Помимо копирования есть операция "перенос" (вырезать/вставить). Не рекомендую такое использовать, поскольку после переноса исходный файл удаляется. Во-первых эта операция выполняется очень долго, во вторых в таблицу размещения файлов вносится информация. Если таблица была с ошибками, могут "потеряться" и другие файлы. Лучше как можно реже вмешиваться в структуру диска-источника пока вся информация не будет "сброшена".


1 "Подготовка и хранение файлов фольклорно-этнографического материала на внешних носителях."
2 Хотелось бы упомянуть о специальном носителе LTO (стример), надежно хранящем информацию на магнитной ленте, но в виду отсутствия оборудования здесь не обсуждается.
3 Такой меньший объем ведет к быстрому функционирования операционной системы и для указанных в тексте систем более чем достаточен. Размер до 28 гигабайт (32768 Мбайт) связан с максимальным объемом, рекомендуемым для файловой системы FAT32, с которой Windows XP расходует меньше процессорного времени на осуществление файловых операций. Кроме того, с FAT32 бережется диск в виду отсутствия журналирования, при котором возникают частые обращения к диску. Тем не менее, файловая система NTFS более устойчива к повреждениям и рекомендуется для файлов архива.
4 За большое вознаграждение, в лабораторных условиях информацию с пластин жесткого диска еще прочтут. Сгоревшая микросхема флеш-карты скорее всего ремонту не подлежит.

(C) Бовин В.Б.
Внесение изменений: 19.09.2012, 26.09.2012, 25.10.2015