Расшифровка экспедиционных аудио и видеоматериалов стала частью научной работы фольклористов и этнографов сравнительно недавно. До середины ХХ в. основным материалом для исследований и публикаций были рукописные полевые или перебеленные записи. Редкое в те времена устройство звукозаписи, фонограф, могло фиксировать лишь двухминутный фрагмент звучащего текста.
Магнитофоны первого поколения, появившиеся после Второй Мировой войны, позволяли более полно записывать фольклорные произведения, однако, магнитная лента стоила дорого, и не была доступна широкому кругу собирателей, поэтому, как правило, отбирались наиболее интересные и яркие образцы. С 1970-х годов стали изготавливаться простые в использовании и недорогие монофонические магнитофоны, позволявшие собирателям записывать экспедиционный материал полностью.
К. К. Логинов за расшифровкой полевых звукозаписей.
(если файл не воспроизводится, его можно скачать (ссылка)
Годами позже, когда магнитную ленту уже несложно было заказать, перебеленные полевые записи отошли на второй план, их место заняли расшифровки с фонограмм, зачастую сделанные уже по возвращении из экспедиции. Изначально они выполнялись от руки, а затем перепечатывались на машинке.
Современные собиратели берут с собой в экспедицию цифровые диктофоны и видеокамеры, способные производить многочасовую непрерывную запись. Объем записанного материала настолько велик, что далеко не всегда удается расшифровать его сразу по прибытии из экспедиции. На следующий год к нему добавляются записи, сделанные в новом полевом сезоне. Несвоевременная расшифровка материалов создает дополнительные проблемы в архивации, а, зачастую и атрибуции материалов, поскольку уходят из жизни не только носители исчезающих культур и языков, но и сами собиратели. В связи с этим упрощение процесса расшифровки остается одной из первоочередных задач.
Обычно исследователи работают со звучащим текстом в двух программах, одна – для воспроизведения звука, например, проигрыватель Windows Media или сторонние приложения наподобие Aimp, Winamp, вторая – для набора текста. Как правило, ученые используют те же программы, в которых пишутся статьи: текстовый редактор Microsoft Word, приложение Блокнот. Если звукозаписи не переведены в цифровой формат, то в качестве проигрывателя выступает магнитофон, или диктофон. Процесс неудобный, достаточно трудоемкий, требующий от составителя расшифровки большой степени сосредоточенности, и, к сожалению, весьма затратный по времени. Кроме того, указанные программы не предназначены для подобной работы, а для страховки, одновременно с файлом DOC, тексты расшифровок необходимо сохранять на диск в современном формате HTML.
При этом, сохранение каждой расшифровки в два разных файла приводит к еще большему увеличению времени работы над полевыми материалами, поэтому, ставший уже традиционным, способ создания расшифровок в текстовом редакторе стоит признать малоэффективным.
Поиски наиболее подходящей для этнологов и фольклористов программы привели к анализу опыта специалистов других профессий, работающих в системе «человек-человек», таких как психология, медицина и спорт, в которых также используется аудио и видеофиксация происходящего. С появлением компьютеров, технические устройства преобразились в специализированные программные комплексы, расшифровка медиа-записей в которых существенно повышает эффективность работы представителей указанных выше областей
2.
Практически сразу после появления подобных программ они стали использоваться европейскими учеными для работы с фольклорно-этнографическим материалом, поскольку во многих странах этап собирания материала уже завершен, и все усилия специалистов направлены на работу по расшифровке и сохранению уже имеющихся записей.
В России, значительная часть сил исследователей по-прежнему сконцентрирована на сборе культурного наследия, находящегося под угрозой исчезновения.
В последнее время появилось несколько отечественных программ, например, Транскрайбер Цезарь, Transcriber-pro, которые находят себя в других областях. Современному исследователю доступно достаточно много программ для расшифровки,
3 но рамки статьи не позволяют описать все. Приведем краткий список наиболее удобных для фольклористов приложений (см. Таблицу 1), которые подбирались с учетом следующих критериев: бесплатный статус, возможность работы в разных операционных системах, возможность представления расшифровки в других программах, относительная простота в освоении. Большим преимуществом является участие авторитетных специалистов или крупных научных центров в разработке программ.
Таблица 1. Список программ для расшифровки.
Annotation academic video (офисы в Цюрихе и Сан Франциско)
"http://entwinemedia.com/2013/annotations-tool/"
Традиционной программы-расшифровщика для компьютера нет. Авторы предпочли организовать всю работу с текстами и записями в обозревателе Интернет, т.е. онлайн.
|
|
Annotator's Workbench (Индиана, США)
"http://www.eviada.org/" (см. раздел «Research & Development» и «Software Development»)
Программа предназначена для работы с форматом видеозаписи MOV, что ограничивает ее применение в кругу собирателей.
|
|
Anvil (Аугсбург, Германия)
"http://www.anvil-software.org/"
Anvil, хорошее начинание Майкла Кипа (Michael Kipp). Несмотря на продуманный подход, программа несколько ограничена в функционале. В последующих версиях ожидается импорт расшифровок от ELAN. Требует установки интерпретатора Java.4
|
|
Audio Notetaker (Лидс, Великобритания)
"http://www.sonocent.com/en/the_software/audio_notetaker"
Программу необходимо приобрести. Расшифровка ведется отдельными предложениями, нет возможности выделить слова из текста. Однако, преимуществом программы является возможность воспроизводить звук в замедленном режиме.
|
|
Easytranscript (Берлин, Германия)
"http://e-werkzeug.eu/index.php/en/products/easytranscript"
Предлагаемая авторами программа является легким в использовании расшифровщиком, со встроенным медиапроигрывателем. Текст поддается форматированию (жирный, курсив, подчеркивание и т.д.).
|
|
Transcriber
"http://trans.sourceforge.net/en/presentation.php"
В прошлом самая популярная программа, однако, последняя версия была выпущена в 2005 г., после чего авторы продолжили работу в новом проекте TranscriberAG (http://transag.sourceforge.net/). Не поддерживает текст в формате Юникод. Есть сложности в установке.
|
|
Transcriber-pro (Россия)
"http://transcriber-pro.com/ru/"
Отечественная. Необходимо приобретать. Сохраняет диалоги в HTML а текст в TXT и RTF форматах. Расшифровка ведется на слух. Собиратель вносит только тот текст, который смог, или посчитал нужным расшифровать. При отсутствии привязки текста к записям, точность расшифровки довольно сложно проконтролировать.
|
|
Транскрайбер Цезарь (Россия)
"http://www.speechpro.ru/product/transcription/cesar"
Отечественная разработка Центра речевых технологий, имеет множество функций, в том числе управление воспроизведением медиафайла с помощью внешнего, подключаемого устройства «ножная педаль», освобождающего руки для печати текста. Расшифровки вводятся во встроенный в программу редактор, близкий по функциональности приложению Microsoft Word.
|
Поскольку большая часть предлагаемых программ используется для подготовки стенограмм, или расшифровок записей лекций, то результатом работы является обычный, или отформатированный текст в виде диалогов. В таком же виде предоставляются результаты работы фирм, занимающихся созданием расшифровок заседаний суда, производственных совещаний, конференций. Отметим, что такая работа стоит недешево – от 3$ за лист А4 или 16$ за час.
Во время разработки идеи международного проекта по оцифровке звукозаписей саамского фольклора, хранящегося в Фонограммархиве ИЯЛИ,
5 зарубежные коллеги часто ссылались на информацию, размещенную на специализированных вэб-ресурсах, таких как сайт IASA
6 – ассоциация звуковых и аудиовизуальных архивов и портал DOBES (документирование языков, находящихся под угрозой исчезновения), являющийся частью Лингвистического Архива Института Психолингвистики имени Макса Планка в г. Неймеген (Нидерланды).
7 Помимо основной деятельности, в Институте с 2002 года работают над приложением EUDICO Lingwistic Annotator (ELAN), ориентированным на работу с текстами. В аннотации сказано, что ELAN специально разрабатывался для анализа языка, языка знаков и жестов, но будет полезен всем, кто занимается расшифровкой, анализом и документированием корпусов языка.
8 В создании программы принимали участие специалисты гуманитарного профиля, что выгодно отличает ELAN от других профильных программ.
Поскольку анализ языковых данных не ограничивается только расшифровкой, технические специалисты развивают другие программные инструменты, предназначенные, например, для размещения мультимедийных данных в базе Института, просмотра и управления архивными фотографиями базы, обеспечения доступа к базе для зарегистрированных пользователей и функций полнотекстового поиска.
Программа ELAN имеет следующие особенности:9
* Бесплатность и кроссплатформенность (работа в системах Windows, Linux, MacOS X).
* Наличие русифицированной версии.
* Расшифровка видео- и аудиозаписей с привязкой к каждому кадру, к каждой фонеме.
* Возможность замедлять или ускорять воспроизведение экспедиционных записей.
* Возможность изменять размер шрифта текста расшифровки.
* Поиск текста в расшифровках (в текущей версии кириллический поиск пока не поддерживается).
* Сохранение результатов работы в текстовом формате XML.
* Сохранение текста расшифровки (экспортирование) в виде обычного текста для вставки в Microsoft Word.
* Экспорт расшифровки в файл субтитров «srt» (для видеозаписей).
И некоторые другие, не менее важные для филологов и этнологов функции, выделяющие программу из общего числа приложений.
Текст расшифровки размещается в текстовом файле формата XML, в кодировке Юникод.
Сейчас это довольно распространенный и перспективный формат для систематизированных данных и представляет собой обычный текстовый файл с разметкой в виде тегов.
10 Структура используемого формата расшифровок подробно описана авторами и опубликована на сайте, что свидетельствует о профессиональном подходе к созданию программы.
11
Программа ELAN работает с файлами, имеющими следующие расширения: MPEG, MP4, MOV, WAV, QT.
12 К сожалению этого недостаточно, учитывая то многообразие мультимедийных форматов, которое встречается на жестких дисках, или компакт-дисках российских собирателей, использующих недорогие устройства аудио и видеофиксации.
13
Из переписки с программистами ELAN стало известно, что принятые форматы удовлетворяют пожеланиям психологов и лингвистов, поскольку позволяют воспроизводить фильмы по кадрам, а звукозаписи проигрывать по фонемам. Специфика сжатых
14 медиа-файлов других современных форматов такова, что в видеозаписях перемещение как правило осуществляется по ключевым кадрам, которые встречаются через каждые 10-15 стандартных кадров, а в аудиозаписях «перемотка» происходит только по секундам, в которых может содержаться несколько слов. Программисты также сообщают, что для открытия других форматов потребуется полная переработка кода программы, которая в ближайшее время не входит в их планы.
В ходе поисков, преследовавших цель открытия всех без исключения мультимедиа-файлов в ELAN, было найдено бесплатное приложение FFmpeg.
15
Это набор свободных библиотек (подпрограмм) с открытым исходным кодом, который позволяет конвертировать из одного в другой различные медиа-форматы. Таким образом, для создания файлов, пригодных для открытия в ELAN, в каталоге с записями достаточно запустить один командный bat-файл,
16 который спустя довольно продолжительное время кодирования (в зависимости от объема видеозаписи и мощности процессора компьютера) подготовит данные для последующей расшифровки. В процессе кодирования уменьшается размер кадра и ухудшается качество изображения с учетом приемлемой сохранности визуального ряда.
Полученные файлы уже пригодны для открытия и расшифровки в ELAN, кроме того, в виду небольшого объема, их можно переносить на флеш-накопителе целыми экспедициями.
17 Этот, дополнительный процесс конвертации можно оправдать лишь тем, что помимо совместимости с ELAN, собиратель автоматически получает материалы для фонда использования. Теперь, экспедиционный источник можно разместить в архиве и в следующий раз обратиться только в процессе видеомонтажа, или резервного копирования.
Изучив краткую инструкцию на русском языке, составленную Brigitte Pakendorf и опубликованную на сайте Института им. Макса Планка, удалось в течение двадцати минут расшифровать короткий (две минуты) фрагмент видеозаписи экспедиции в Иркутскую область, осуществленную в 2006 году под руководством д.ф.н. Зайцевой Н. Г. (ИЯЛИ КарНЦ РАН).
Для удобства систематизации и поиска, авторы ELAN рекомендуют при сохранении проекта давать ему точно такое же имя, как и у видео-, аудиозаписи. Расширение .eaf программа впечатает сама. При экспортировании выбранного слоя в качестве субтитров к фильму выбирают пункт меню «Файл» - «Экспортировать как» - «Многострочный текст». Тип файла субтитров –«.srt».
18 Для каждого слоя рекомендуется создавать отдельный файл субтитров.
19 Авторами предусмотрено неограниченное число слоев
20. Например, один слой создается для расшифровки текущей записи, следующий слой - при необходимости перевода на другой язык, или для целей комментирования видео, или аудиозаписей, если встроенное средство (в отдельной вкладке программы) не достаточно удобно. Работа со слоями может существенно упростить труд текстологов во время подготовки изданий, поскольку дает возможность сразу видеть разночтения, встречающиеся в сказанном и записанном вариантах или опубликованном ранее тексте данного фольклорного произведения.
Возможность сохранить текст расшифровки как файл со структурой XML в кодировке Unicode позволяет производить расшифровку с включением в текст символов национальных языков.
21 При необходимости один или несколько слоев расшифровки сохраняются в виде титров, а популярный видеопроигрыватель VLC Player
22 автоматически их загружает, выводя в необходимый кадр фильма (по
этой ссылке можно скачать видеофайл с тремя субтитрами, которые открываются в меню /Субтитры/-/Дорожка субтитров/ универсального проигрывателя VLC).
Все возможности ELAN описаны в подробной инструкции, которая опубликована на сайте разработчика.
23 Данная программа успешно зарекомендовала себя в работе с русскими аудио, и видеоматериалами «Несомненно, одновременный доступ к аудио-, видео-, а также текстовой информации абсолютно идентичного содержания – новый эффективный и весьма многообещающий метод хранения как лингвистических, так и экстралингвистических данных: аудио-, а особенно видеозапись, точно фиксирует интонацию, мимику, жесты говорящего. Кроме того, компьютер позволяет в любой момент заново воспроизвести фрагмент текста любого объема, либо без задержек попеременно воспроизводить отрезки текста, находящиеся на довольно далеком расстоянии друг от друга в потоке речи. <…> Программы, подобные ELAN, обеспечивают интеграцию материала не только для лингвистических изысканий, но и для широкого спектра гуманитарных исследований, связанных с жизнедеятельностью человека, – психологии, социологии, психолингвистики, этнографии, антропологии и др.»
24
В качестве недостатков программы можно назвать отсутствие возможности импортировать сжатые разными кодеками
25 аудио- и видеозаписи, а также, на данном этапе, отсутствие функции «поиск слов» в кириллическом тексте. В процессе тестирования возникли сложности с работой приложения в системе Ubuntu Linux
26: не удалось услышать звук при расшифровке медиа-файлов. Без установленного в операционной системе компьютера интерпретатора JAVA воспроизведение медиафайлов затруднено.
В Европе исследователи стремятся унифицировать текстовые данные архивов, и рекомендация использовать в работе ELAN имеет смысл, учитывая возможность программы объединять, сравнивать разные расшифровки. Результаты работы представленные единым электронным форматом позволяют создавать некоторую обширную сеть архивных данных по всему миру. Надеемся, что программа займет достойное место среди инструментов собирателя и даст возможность ввести большой объем материалов в научный оборот.
1 Подготовлено на основе доклада научно-практического семинара "Методика полевых работ и архивация фольклорных, лингвистических и этнографических материалов" совместно с С. В. Ковалевой "Программа ELAN как ресурс для обучения младописьменному языку" г. Петрозаводск, ИЯЛИ КарНЦ РАН г. Петрозаводск 2013 г., а также доклада Седьмых шёгреновских чтений - Северо-запад: этноконфессиональная история и историко-культурный ландшафт "Использование приложения ELAN в работе с фольклорно-этнографическими материалами" Российский Этнографический Музей, г. Санкт-Петербург 2015 г.
2 Онлайн-курс русского жестового языка "LIGMIR". URL – Режим доступа: http://www.digitgestus.com/
3 Список инструментов для расшифровки на сайте Института имени Макса Планка (Нидерланды). URL – Режим доступа: https://tla.mpi.nl/tools2/tooltype/annotation/
4 Объектно-ориентированный язык программирования (Sun Microsystems). Приложения, использующие Java разрабатывать несложно, кроме того, они могут выполняться в разных операционных системах, для которых реализована виртуальная машина Java. URL – Режим доступа: http://java.com/ru/
5 Институт языка, литературы и истории Карельского Научного Центра РАН.
6 Организация создана в Амстердаме, с целью международного сотрудничества архивов, хранящих аудиовизуальные данные. URL – Режим доступа: http://www.iasa-web.org/
7 Интернет-сайт Института Психолингвистики . URL – Режим доступа: http://www.mpi.nl/
8 Описание ELAN Linguistic Annotator. URL – Режим доступа: www.mpi.nl/corpus/html/elan_ug/pr01.html
9 Раздел сайта посвященный программе ELAN. URL – Режим доступа: https://tla.mpi.nl/tools/tla-tools/elan/
10 Теги, это слова, размещенные между угловыми скобками, например, . В языке XML теги определяют структуру и то, чем являются хранящиеся в файле данные. «Правила XML разрешают создавать любые теги, требуемые для описания данных и их структуры.» URL – Режим доступа: https://support.office.com/ru-RU/article/XML-для-начинающих-A87D234D-4C2E-4409-9CBC-45E4EB857D44
11 Описание формата EAF. URL – Режим доступа: http://www.mpi.nl/tools/elan/EAF_Annotation_Format.pdf
12 Перечисленные типы файлов обусловлены наличием фреймворка, установленного в системе: DirectShow, QuickTime, Java Direct Show. URL – Режим доступа: http://www.mpi.nl/corpus/html/elan/ch04.html#Sec_Basic_Information
13 Установка пакета кодеков K-Lite Codec Pack «http://www.codecguide.com/download_kl.htm» также не решила вопроса с воспроизведением видеофайлов.
14 «…в основном, видео хранят в видеофайлах, в которых применены различные алгоритмы сжатия информации. Благодаря этим технологиям видеофайл можно сжимать в десятки и сотни раз практически без потери качества картинки и звука». URL – Режим доступа: http://videovegas.ru/urok-14-formaty-videofajlov.html
15 Сайт проекта FFMPEG. URL – Режим доступа: https://www.ffmpeg.org/
16 Командный, файл имеет расширение .bat и содержит текст. В приложении «Блокнот» набирается следующий текст в одну строку: for %%a in ("*.mov","*.mts") do ffmpeg.exe -i "%%a" –target pal-vcd -y "%%~na.mpg" можно сжать сильнее: for %%a in ("*.mov","*.mts") do ffmpeg.exe -i "%%a" –vcodec mpeg1video -vf yadif=1 -r 25 -s 352x288 -b:v 700k -acodec libmp3lame -ab 96k -ac 2 -ar 22050 -y "%%~na.mpg"
17 Например, видеозапись с размерами кадра 1440х1080 точек и скоростью 100 кадров в секунду «сожмется» в 7 – 9, иногда в 15 раз получив новые параметры 352х288, 25 кадр/с. За один час записи, видеокамера Sony HDR-XR160, создаст файл объемом 5,58 Гигабайт, который после обработки программой ffmpeg уменьшится до 0,36 Гигабайт.
18 Видеоплеер VLC позволяет подгружать файлы субтитров и переключать их во время просмотра.
19 Для получения автономного видеофайла (с несколькими субтитрами) можно воспользоваться приложением MKVToolnix. URL – Режим доступа: https://www.bunkus.org/videotools/mkvtoolnix/
20 Группы разных слоев называется ярусами (tier – ярус, URL – Режим доступа: http://www.mpi.nl/corpus/html/elan_ug/pr01s02s02.html).
21 Бовин В. Б. Опыт создания электронных описей цифровых фотоматериалов ИЯЛИ КарНЦ РАН / Историко-культурный ландшафт Северо-Запада - 3: Шестые Шёгреновские чтения. СПб. 2014. С. 159
22 Сайт видеопроигрывателя VLC. URL – Режим доступа: http://www.videolan.org/vlc/
23 Руководство пользователя ELAN. URL – Режим доступа: http://www.mpi.nl/corpus/html/elan_ug/
24 В.М. Лемская Потенциал применения методов корпусной лингвистики в рамках дескриптивного подхода в исследовании чулымско-тюркского языка. Вестник ТГПУ. 2006. Выпуск 4 (55). Серия: Гуманитарные науки (филология). С. 174
25 Кодеки: вопросы и ответы. URL – Режим доступа: http://windows.microsoft.com/ru-ru/windows/codecs-frequently-asked-questions#codecs-frequently-asked-questions=windows-7
26 Сайт операционной системы Ubuntu Linux. URL – Режим доступа: http://www.ubuntu.com/desktop