microbik.ru
1

Проблемы архивного хранения электронных документов

Левадняя Ю.А


Томский государственный университет
Электронный документооборот в России становится все более распространенным. Электронные документы уже активно использует бизнес, на электронную форму работы переходят суды. В ближайшее время архивам придется принять тысячи, миллионы, и, возможно, миллиарды электронных документов. Хранить их нужно будет на протяжении многих лет, не нарушая при этом целостности, аутентичности, сохраняя информацию, которая может понадобиться в любое время. А это неизбежно вызовет массу проблем. Сфера архивного хранения электронных документов характеризуется отсутствием соответствующей законодательной и единой для всех нормативно-методической базы. Но в этих условиях не получается закрыть глаза на тот факт, что электронные документы уже заняли свое место в деловой деятельности как государственных структур, так и коммерческих организаций.

Сейчас существуют крупные государственные базы данных, которым установлен постоянный срок хранения, хотя никто не потрудился объяснить государственным органам - владельцам этих баз - что и как они должны сохранить и какими способами будет обеспечиваться юридическая значимость сохраняемой информации и документов. Одновременно наблюдается стойкое нежелание заниматься проблемами электронных архивов на государственном уровне

В организации долговременного и постоянного хранения электронных документов можно выделить две задачи. Первая - сохранить информационное содержание документов, с тем, чтобы обеспечить возможность их использования в деловой деятельности и в государственном управлении. При всей своей сложности задача понятна. В этом направлении имеется большой практический опыт, в том числе и отечественный – достаточно вспомнить продолжающиеся программы спасения ценно научной информации с магнитных лент, записанных в 80-е и 90-е годы. Задача вторая - сохранить не только содержание, но и юридическую значимость документов, чтобы всегда можно было доказать их целостность и аутентичность. Здесь отечественный опыт пока невелик, поэтому часто приходится использовать зарубежный. Но и там далеко не все проблемы решены. Поэтому эту задачу можно рассматривать как наиболее сложную из двух.

Работа с документами должна быть организована так, чтобы в любой момент существовала возможность доказать, что это надежная информация, которая не была искажена, изменена или как-либо иначе испорчена с течением времени.

Сохранность электронных документов, как правило, обеспечивают несколько служб. ИТ-отдел обычно организовывает хранение и оперативный доступ к информации, решает технические проблемы хранения. Департамент информационной безопасности видит свою основную задачу в обеспечении конфиденциальности, т.е. в ограничении доступа к информации. Наконец, архивную службу (и иногда – и юристов) волнует обеспечение сохранности электронной информации в качестве юридически значимых документов. С точки зрения архивного дела основной целью является не обеспечение сохранности отдельных документов, а сохранение массивов документов вместе с их взаимосвязями с тем, чтобы была возможность понять роль этих документов в деловой деятельности организации. Значение отдельного документа в большой степени зависит от контекста – от обстоятельств его создания и использования, от его взаимосвязей с другими документами.

Если в бумажном делопроизводстве то или иное дело физически объединяет "бумаги" по определенному признаку или признакам, то в системе электронного документооборота документы, как правило, физически не лежат в соответствующих делах. Очень часто номенклатура и состав самих дел – это всего лишь логическое представление содержимого базы данных, причем могут существовать и альтернативные представления. Документы "раскладываются по делам" виртуально, и эта логика – тот самый контекст - также может быть искажена или утрачена – можно сохранить все индивидуальные документы, но потерять информацию об их логических взаимосвязях.

Одной из основных проблем, которую необходимо решить при организации долговременного хранения электронных документов, является обеспечение их читаемости на протяжении всего жизненного цикла. Задача это многоплановая: необходимо сделать так, чтобы электронный документ можно было прочитать на той компьютерной системе или устройстве, на которой они первоначально были созданы, или где они в настоящее время хранятся, или которая в настоящее время используется для доступа к ним, а также которая будет использована для хранения электронной документов в будущем.

Сохраненная на цифровом носителе информация может со временем стать нечитаемой. К этому может привести несколько причин. Воздействие плохих условий хранения приводит к физическому износу или порче носителей. Все виды носителей, используемые в настоящее время для хранения электронных документов, чувствительны к воздействию неблагоприятной окружающей среды, - например, к перепадам температуры и влажности. Подобные неблагоприятные условия или повреждают носитель, или ускоряют процесс его "старения" и деградации. Для обеспечения максимального срока службы различных типов цифровых носителей требуются различные уровни контроля параметров окружающей среды в местах хранения.

При использовании некоторых технологий записи информации порча данных возможна вследствие воздействия магнитных полей, пыли и загрязняющих окружающую среду веществ (магнитные носители), в то время как другие виды носителей (оптические) менее подвержены влиянию внешних факторов и менее чувствительны к повреждениям, случающимся вне строго контролируемой среды хранения.

Моральное устаревание носителей и оборудования, которое происходит в том случае, когда устройство (например, лента или диск) физически несовместимо с имеющимся компьютерным оборудованием (например, приводом для чтения лент или дисков), и, следовательно, информация не может быть прочитана. Моральное устаревание носителей неизбежно, поскольку технологические достижения постоянно изменяют способы физического хранения электронных документов (происходят, например, изменения в технологии записи, в интерфейсах оборудования и программного обеспечения приводов); изменяются конструктивные параметры устройств. Как следствие, со временем более старые носители информации становятся несовместимыми с появившимися позднее носителями и оборудованием.

Устаревание форматов документов – электронные документы создаются и используются в различных форматах. Многие из них являются "закрытыми" - либо недоступны их подробные описания, либо их использование может быть затруднено вследствие прав интеллектуальной собственности. Это создает угрозу доступности информации при долговременном хранении, поэтому уже сейчас при передаче электронных документов на длительное хранение из широкого набора форматов, используемых создателями и получателями документов, выбирается небольшое число часто используемых стандартов, подходящих для целей архивного хранения.

Именно поэтому сейчас так популярны открытые форматы, которые позволяют работать с электронными документами даже в отсутствие программного обеспечения, использовавшегося для их создания. Специалисты рекомендуют в случае необходимости сохранения электронных документов в "нестандартном" формате постараться оставить максимально подробное его описание и также само программное обеспечение.

Среди форматов для длительного и постоянного хранения пока что доминируют (среди текстовых) PDF/A, другие версии открытого формата PDF, SGML, XML и TXT. Для хранения веб-страниц используется HTML. Стоит отметить, что новые открытые форматы ODF и OOXML для длительного и постоянного хранения документов пока не используются.

Устаревание программного обеспечения. При создании и использовании электронных документов организации и отдельные лица используют широкий набор пакетов программ. Для обеспечения сохранности документов чрезвычайно сложно сделать доступ к соответствующему ПО или поддерживать все эти пакеты в работающем состоянии.

Часть электронных документов может оказаться зависимой от программного обеспечения, - и, соответственно, их можно будет использовать лишь в устаревших информационных системах.

Самой сложной проблемой при организации долговременного хранения электронных документов с ЭЦП является необходимость поддержания возможности в любой момент убедиться в подлинности ЭЦП. Для архивов это означает, что придется сохранять в рабочем состоянии множество версии и поколений инфраструктуры открытых ключей PKI. Большинство российских организаций (а что уж говорить про государственные архивы), не готовы сейчас к решению таких задач, у них для этого нет ни финансовых, ни технических, ни кадровых ресурсов.

При поступлении таких документов на постоянное или длительное архивное хранение, ЭЦП рекомендуется проверять и "снимать", фиксируя всю содержащуюся в ней информацию в метаданных документов. В дальнейшем защита целостности и аутентичности документов должна уже обеспечиваться силами и средствами архива.

Хотя электронные архивисты не стремятся применять ЭЦП, те же самые технологии, на которых базируется ЭЦП, начинают все более активно использоваться в электронном архивном деле – в первую очередь для защиты целостности документов. Поскольку подписывать миллионы документов архивными ЭЦП нереально, то используется система иерархического определения дайджестов (хэшей), когда в итоге вычисляется дайджест всего архива или крупной его части. Тогда одна архивная ЭЦП способна подтвердить целостность всего огромного архива.

Нами перечислен далеко не полный перечень проблем, которые придется преодолевать в самом ближайшем будущем. К сожалению, как показывает российский опыт решения других проблем "электронного правительства", затягивание приводит тому, что все придется определять в авральном порядке, рискуя принять неверные или ошибочные решения. Государство должно в срочном порядке создать электронные архивы на федеральном и региональном уровне, с тем, чтобы успеть подготовиться к тому моменту, когда придется в массовом порядке принимать на хранение электронные документы. Иначе есть вполне ощутимый риск потерять значительную часть документального наследия.
Литература

1. Зверева С. Длительное хранение электронных документов. Проблемы и решения / С. Зверева. [Электрон.ресурс]. Режим доступа- http://citcity.ru/13935/ , свободный

2.Храмцовская Н.А. Архивное хранение электронных документов глазами министерств и ведомств/ Н.А. Храмцовская. [Электрон.ресурс]. Режим доступа- http://art.thelib.ru/business/insurance/arhivnoe_hranenie_elektronnih_dokumentov_glazami_ministerstv_i_vedomstv.html, свободный

3.Храмцовская Н.А. Как хранить электронные документы? Советы эксперта / Н.А. Храмцовская Режим доступа-

http://www.audit-it.ru/articles/soft/a115/125733.html, свободный