Компьютер-Информ || Архив || Рубрики || Поиск || Подписка || Работа || О "КИ" || Карта


Создание электронных архивов предприятий


Алексей Рындин
Consistent Software SPb

sales@csoft.spb.ru

Общая концепция построения электронного архива

И так, Вы решили автоматизировать инженерно-конструкторский документооборот, чтобы избавиться от рутинной ручной работы с огромным количеством бумажной документации. Создание электронных архивов (ЭА) является в каждом случае уникальной задачей для любого предприятия с одной стороны, но имеет общие закономерности, с другой стороны, позволяющие производить их поблочную реализацию и поэтапно получить законченное программно-аппаратное решение. При этом важно, что результатом каждого этапа также является законченное решение, готовое к использованию до проведения работ по следующим этапам. Структура ЭА изображена на рисункеи состоит из следующих подсистем:

•подсистемы сканирования комплекса программно-аппаратных средств для преобразования бумажной документации в электронный вид;
•подсистемы оперативного электронного архива для хранения информации оперативного использования и накопления информации перед записью ее на долговременное хранение;
•подсистемы долгосрочного хранения для долговременного хранения больших и сверхбольших объемов данных, обращение к которым носит нерегулярный характер;
•пользовательских приложений. Как правило, на этом уровне организуется доступ к информации архива либо в файл-серверном режиме, либо посредством использования систем автоматизации, СУБД;
•подсистемы тиражирования;
•технологических решений.

Проблема создания ЭА предприятий в настоящее время очень актуальна. Основная причина необходимости ее решения состоит в наличии большого количества бумажной документации, постепенно приходящей в негодность, низкой эффективности ручной работы с документацией с одной стороны, и наличии уже внедренных на предприятиях САПР, существовании необходимых программно-аппаратных средств для создания ЭА, с другой стороны. Создание законченной системы документооборота конструкторской документации ведет, прежде всего, к повышению эффективности работы предприятия, и, как следствие, к росту прибыли. Рассмотрим создание каждой из вышеперечисленных подсистем ЭА.

Создание подсистемы сканирования

Создание подсистемы следует начать, прежде всего, с изучения бумажного архива предприятия. Как правило, архив любого предприятия состоит из десятков тысяч и даже миллионов документов. Все документы имеют различные форматы, состояние, плотность и толщину бумаги. Частью документов могут быть синьки, кальки. Часто встречаются документы на цветных и серых бумагах. Документы могут быть в виде отдельных листов и сброшюрованные в книги и альбомы. На любом предприятии обязательно найдется часть документации, сохранность и состояние которой оставляют желать лучшего ветхие и выцветшие документы. Поэтому, правильно было бы начать процесс создания ЭА с определения объемов документации, которые необходимо поместить в ЭА. При этом для правильного подбора оборудования необходимо произвести тщательное изучение документов по следующим параметрам:

•количество документов по каждому из форматов;
•наличие и количество сшитых документов по каждому из форматов;
•наличие и количество ветхих документов по каждому из форматов;
•наличие и количество документов на бумаге низкой плотности по каждому из форматов;
•наличие и количество документов на цветной и серой бумаге по каждому из форматов;
•наличие двусторонних документов по каждому из форматов.

Конечно, невозможно произвести абсолютно точный подсчет, но следует помнить, что чем точнее будет проведено обследование архива, тем точнее будет подобрано оборудование, и эффективнее будет создаваться ЭА.

Далее, необходимо определить сроки создания архива и интенсивность его пополнения новыми документами. Очень важно определить, какие форматы файлов должны иметь электронные документы.

Наличие формализованной определенным образом информации позволяет определить наиболее подходящее оборудование. Так, для сканирования больших объемов узкоформатной (до формата А3) несшитой документации применяются поточные сканеры(например,Inotex Scamax), позволяющие сканировать со скоростью до 90 листов/мин (Scamax2600) или до 180 листов/мин (Scamax5000) в режиме автоподачи. Сканеры этого модельного ряда имеют также режим ручной подачи. Так например, при наличии в пачках сканируемой документации некоторого количества документов на бумаге низкой плотности, ветхих, которые сканер не может протягивать с указанными скоростями, оператор сканирования может на время переключиться в режим ручной подачи для сканирования таких документов, и обратно в режим автоматической подачи, не прерывая процесса сканирования пачки.

Получаемые форматы файлов: *.tif монохромный одностраничный, двухстраничный; *.pdf. Особенностью данных сканеров и управляющего ПО является наличие множества дополнительных функций, например: двухстороннее сканирование; аппаратные модули динамического контраста, позволяющие получить высококачественные изображения с неконтрастных, серых и цветных оригиналов, работа со штрихкодами, надпечатка на документах, получение изображений gray scale и другие. Для предприятий, планирующих менее интенсивные темпы создания архивов и меньшие объемы несшитой узкоформатной документации форматов до А3, использование сканеров Scamax не всегда целесообразно и экономически не оправдывается. В этом случае возможно использование поточных сканеров производства компании Fujitsu, имеющих в зависимости от модели производительность 15-90 листов/мин. Получаемый формат файлов *.tif монохром, gray scale, цветной. Отличительной особенностью сканеров Fujitsu является одновременная возможность поточного и планшетного сканирования. При наличии небольшого процента документации, которая не может быть протянута механизмом поточного сканирования, отдельные ветхие листы и листы на бумаге низкой плотности можно отсканировать на планшете сканера. Сканеры Fujitsu содержат дополнительные программные и аппаратные модули, ориентированные на выполнение различных операций. Особенно можно отметить модуль обработки изображений ICP, позволяющий резко поднять качество изображений, полученных при сканировании неконтрастных, некачественных документов.

Для сканирования сшитой узкоформатной (до формата А3) документации можно применять бесконтактные книжные сканеры Bookeye, Minolta. Их особенность отсутствие механического контакта со сканируемыми материалами. Сканирующая камера расположена над столом, на котором располагаются сшитые документы. Время сканирования разворота 3-5 секунд. Получаемый формат файла *.tif монохромный и gray scale. Сканер и ПО управления имеют опции, необходимые для работы со сшитыми документами корректировку изгиба страниц и ряд дополнительных функций, позволяющих наиболее удобно поставить технологию сканирования, например, работа со штрихкодами. При наличии толстых книг и пачек сшитой документации целесообразно применять специальные дополнительные подставки. Оператор перелистывает страницы вручную. Запуск процесса сканирования может осуществляться при помощи педали, пульта управления сканером или прямо из программы. Данные сканеры могут успешно применяться и для сканирования отдельных узкоформатных листов, имеющих ветхое состояние. Если предприятию не нужно сканировать узкоформатную сброшюрованную документацию, но есть небольшие объемы ветхих узкоформатных документов, то использование бесконтактных сканеров в этом случае нецелесообразно. Для этих целей вполне подходит простой планшетный сканер или планшет поточного сканера Fujitsu.

Для сканирования широкоформатной документации можно использовать широкоформатные сканерыкомпанийContex Scanning Technologies и Vidar Systems. Они предназначены для перевода в электронный вид документации широких форматов (свыше А3 и до А0) без ограничения по длине сканируемого листа. В сканерах аппаратно реализованы алгоритмы цифровой обработки изображений. Например, в сканерах Contex оператор управляет лишь выбором алгоритмов или их параметрами, но сам процесс обработки результата сканирования зашит в устройство и происходит в режиме реального времени. Для получения лучших результатов использованы: механизм независимого улучшения деталей переднего плана и фона (Dual 2D-Adaptive Enhancement); выделение полутонов для качественного копирования (ADL+ Error Diffusion Halftoning); динамическое выставление порога сканирования (2D-Adaptive Thresholding);фильтрыповышениярезкости(2D-Sharpening),сглаживания(2D-Softening) и размытия (2D-Blur) полутонового и цветного изображений; выделение деталей изображения по цветовым признакам (Color Feature Extraction), приведение цветовой палитры к заданным цветам (8бит). Для разных типов оригинальных изображений используются различные наборы алгоритмов. Зачастую качество отсканированного изображения превосходит качество оригинала например, при сканировании синек или выцветших оригиналов. Сканеры Vidar и Contex имеют прямой тракт протяжки с равномерно расположенными роликами, что позволяет успешно сканировать ветхую документацию и кальки. Оба модельных ряда имеют возможность монохромного, gray scale и цветного сканирования. Конкретные модели отличаются также и по производительности.

При построении подсистемы сканирования ЭА предлагается сканирующее оборудование репрографических комплексов OSE TDS400, TDS600, TDS800. Всостав комплекса входят сканер, плоттер и контроллер, являющийся связующим звеном между ними. Поддерживаемые форматы файлов: HP-GL, HP-GL2, Calcomp, Tiff и Cals используются в большинстве CAD- и EDMS-систем. Опционально предусмотрена поддержка Adobe PostScript3, включающая прямую печать PDF-форматов. PDF наиболее распространенный формат для большинства офисных приложений, все чаще применяемый для обмена данными в Интернет и архивного хранения. Кроме того, TDS400 поддерживает форматы ASCII. Скорость сканирования TDS400 3метра/мин, TDS600 5метров/мин, TDS800 10метров/мин. Сканеры предназначены для сканирования документации формата до А0. Длина оригиналов может достигать 15 метров и определяется автоматически.

Подобрать то или иное оборудование, как отмечалось выше, можно лишь после обследования бумажного архива предприятия и выполнения требований, выдвигаемых к ЭА. Обязательной для создания подсистемы сканирования является разработка самой технологии сканирования, уникальной, как правило, в каждом отдельном случае и соответствующе подобранной технологии ПО обработки сканированных изображений. При подборе оборудования часто возникают ошибки, связанные с тем, что не учитывается технология проведения работ. Так например, поточный сканер A3 формата Scamax 2600 имеет производительность 90 листов в минуту. Но это совсем не означает, что за 8 часов работы будет отсканировано 8х60х90=43200 документов. На самом деле, производительность данной модели в среднем 10000-20000 отсканированных документов в день. Точная цифра зависит от качества документов, технологии работ. Если на бумажных документах изображения низкого качества, приходится включать дополнительные опции автоматической обработки изображений в ПО управления сканером, которые замедляют процесс сканирования. Если при поточном сканировании в пачках встречаются документы на бумаге низкого качества, то оператор сканирования будет вынужден периодически переходить из режима автоподачи в режим ручной подачи, что также уменьшает производительность сканера. Разработка технологии процедур сканирования является серьезной задачей и требует определенного опыта и знания всех, в том числе и дополнительных, возможностей оборудования и ПО (работа со штрихкодами, корректирующие опции ПО, дополнительные блоки и аппаратные модули). Велика вероятность того, что потребуется дополнительная обработка файлов, например устранение перекосов, вырезание изображений по формату, пакетное удаление повторяющихся и ненужных частей изображений (например, изображений перфорации на спецификациях). Причины тому следующие:

•состояние подлинников (загрязненные, выцветшие, на цветных и серых бумагах), вызывающее появление нечетких, неконтрастных изображений низкого качества;
•наличие подлинников нестандартных размеров. Например, если оригинал на миллиметры шире формата А1, то при тиражировании печатающее устройство может воспринять его как документ формата А0, хотя поданные на печать лишние миллиметры не несут никакой информации;
•наличие повторяющихся фрагментов изображений, не несущих информации, но делающих размер файла больше. Например, изображение перфорации по краям спецификаций;
•возможность перекосов изображения, связанных с перекосом ветхого документа в протяжном тракте поточного сканера.

Вследствие этих причин часть изображений может быть неудовлетворительного качества. Часть из перечисленных недостатков можно устранить в процессе сканирования при помощи стандартных аппаратных или программных опций. Как правило, сканирующее оборудование и ПО имеют ряд дополнительных аппаратных и программных блоков, приобретаемых отдельно, которые помогут справиться с имеющейся проблемой. Однако некоторые из перечисленных выше недостатков изображений невозможно устранить в процессе сканирования при помощи дополнительных аппаратных блоков и опций ПО. Вэтом случае необходима дополнительная обработка изображений. Правильно было бы стремиться максимально исключить ручную обработку и использовать дополнительное ПО пакетной обработки, которое автоматически устраняет недостатки полученных изображений. Всегда стоит помнить о том, что в архиве предприятия найдется часть документов, электронные копии которых возможно отредактировать лишь вручную. Пакетная обработка не приемлема для файлов, недостатки изображений в которых не имеют каких-либо закономерностей и не встречаются в других файлах. Вэтих случаях, как правило, предусматривается использование дополнительного ПО. Поэтому-то при разработке подсистемы сканирования ЭА предусматривается использование дополнительных программных пакетов, например SPOTLIGHT PRO V4 производства компании Consistent Software, выполняющего функции обработки растров, дигитайзирования, трассировки, векторизации, гибридной обработки.

Продолжение следует


       КОМПЬЮТЕР-ИНФОРМ 
          Главная страница || Статьи 10'2002 (3 - 16 июня) || Новости СПб || Новости России || Новости мира

Рубрики || Работа || Услуги || Поиск || Архив || Дни рождения
О "КИ" || График выхода || Карта сайта || Подписка

Рассылка анонсов газеты по электронной почте

Главная страница

Сайт газеты "Компьютер-Информ" является зарегистрированным электронным СМИ.
Свидетельство Эл 77-4461 от 2 апреля 2001 г.
Перепечатка материалов без письменного согласия редакции запрещена.
При использовании материалов газеты в Интернет гиперссылка обязательна.

Телефон редакции (812) 718-6666, 718-6555.
Адрес: 196084, СПб, ул.Заставская, д.23, БЦ "Авиатор", 3-й этаж, офис 307
e-mail: editor@ci.ru
Для пресс-релизов и новостей news@ci.ru