Дипломная работа: Автоматизация процессов документооборота
Рисунок 5 - Виды сетей
На дисках серверов располагают совместно используемые программы, базы данных и т. п. Остальные компьютеры сети называют рабочими станциями, на некоторых из них могут даже не устанавливать жесткие диски. Аппаратное обеспечение серверов значительно превосходит аппаратное обеспечение рабочих станций, т. е. они являются весьма мощными компьютерами с большим количеством оперативной и дисковой памяти, обладают исключительной надежностью, высокой производительностью, дублированием устройств и хранимых данных, средствами контроля над состоянием сервера, средствами обеспечения бесперебойной работы при отказе некоторых устройств.
Если компьютеры расположены на удаленном расстоянии друг от друга, то для передачи данных используются каналы связи: телефонные линии, спутниковая связь, оптоволоконные линии.
Глобальная сеть объединяет компьютеры в разных странах и континентах, например, широко известная сеть Internet. Объединение глобальных, региональных и локальных вычислительных сетей позволяет создать многосетевые иерархии, позволяющие не только обрабатывать информационные массивы, но и обеспечивать доступ к ним (рис. 6).
Для обеспечения связи в глобальных сетях выработаны единые правила, которые называются технологиями Internet. [16]
В настоящее время появилась возможность создания корпоративных сетей, которые представляют собой объединение локальных сетей в пределах одной корпорации (например, филиалов, территориально удаленных друг от друга) для решения общих задач. Ведь, действительно, любая организация – это совокупность взаимодействующих элементов (подразделений), которые связаны между собой как функционально (выполняют отдельные виды работ в рамках единого бизнес-процесса), так и информационно (обмениваются документами, устными распоряжениями и т. д.). Кроме того, эти элементы взаимодействуют с внешними системами, причем их взаимодействие также может быть как информационным, так и функциональным. И такие виды взаимодействия характерны практически для любой организации, каким бы видом деятельности она ни занималась. Поэтому создание единого информационного пространства на основе корпоративной информационной системы является необходимым условием для повышения эффективности деятельности организации и реализации процессов управления.
Рисунок 6 - Иерархия компьютерных сетей
Для корпоративных сетей характерно сочетание централизованной обработки информации с использованием удаленного соединения компьютеров. Информация может изменяться работниками, имеющими доступ к ней. Для связи компьютеров в корпоративных сетях разработана технология Intranet. Intranet использует опыт работы в распределенной среде и построена на технологии «клиент-сервер» с централизованной обработкой информации, она использует протоколы и технологию Internet.
Одной из важнейших составляющих корпоративной информационной системы является система электронного управления документами (ЭУД). Организация работы с документами – это составная часть процессов управления и принятия решений, существенно влияющая на оперативность и качество управления. Документы поступают в организацию, создаются сотрудниками, передаются для согласования или исполнения из подразделения в подразделение, поступают к руководству для принятия решения или утверждения и отправляются из организации. [16]
Число организаций, где внедрена система электронного документооборота, увеличивается, растет количество автоматизированных рабочих мест. Если ранее сферой применения систем электронного документооборота был в основном крупный и средний бизнес, то теперь дело дошло и до небольших предприятий. [1]
Системы электронного управления документами (ЭУД) обеспечивают процесс создания, управления доступом и распространения больших объемов документов в компьютерных сетях, а также обеспечивают контроль над потоками документов в организации. Часто эти документы хранятся в специальных хранилищах или в иерархии файловой системы. Типы файлов, которые, как правило, поддерживают системы ЭУД, включают текстовые документы, электронные таблицы, аудио-, видеоданные, графические объекты и документы Web. Системы ЭУД включают:
1) системы электронного документирования (делопроизводства);
2) системы электронного документооборота;
3) корпоративные системы электронного управления документами.
Очень многие поставщики и аналитические компании предлагают собственные системы классификации. Если положить в основу классификации роль документа в системе, то можно выделить два класса систем. К одному из них причислим так называемые корпоративные (или универсальные) системы управления документами (Enterprise Document Management System – EDMS), к другому – специализированные системы управления документами, ориентированные в основном на автоматизацию делопроизводственных процедур.
С документами любого содержания необходимо выполнять некоторые действия: принимать и отправлять, регистрировать, передавать по назначению, контролировать ход исполнения, накладывать резолюции. Специализированные системы (а практически все отечественные разработки в этом сегменте относятся к данному классу) как раз и предназначены для решения таких задач, например для автоматизации делопроизводственной деятельности предприятия.
Корпоративные системы управления документами – это, по сути, платформы для создания различных решений, ориентированных на обработку документов. Специализированные решения, в свою очередь, ориентированы на решение конкретных задач, таких как автоматизация традиционного отечественного делопроизводства, и внедряются они на ограниченном числе рабочих мест. При этом специализированные системы не предназначены для решения задач, связанных с содержательной частью документа. [16]
1.2 Распознавание образов как неотъемлемый этап работы в системе электронного документооборота (СЭД)
Сегодня перспективные разработки построения систем управления информацией в электронном виде связаны с распознаванием образов. В начале 90-х гг. появились технологические разработки, связанные с индексацией и поиском документов, в которых используются результаты, полученные в области искусственного интеллекта и нейронных сетей. [16]
С помощью возможностей распознавания компьютер сможет «прочесть» отсканированный текст. А затем воссоздать первоначальный вид страницы со всеми имеющимися графическими элементами в электронном виде. Использование распознавания текста после сканирования печатного издания позволяет не только обеспечить доступ к нему широкого круга лиц, но и сохранить редкий экземпляр документа. Современные технологии позволяют решить проблему разрушения бумаги при частом использовании. Это подразумевает, что теперь материалы, хранящиеся в архивах, фондах, библиотеках и редких коллекциях, могут быть активно использованы за счет электронных дубликатов.
В чистом виде такая возможность может быть полезна для:
сохранения уже имеющейся на бумажном носителе информации в электронном виде;
быстрого поиска необходимой информации;
удобства пользования информацией, представленной в электронном виде для большого количества одновременно работающих пользователей.
Распознавание текста позволяет увеличить удобство работы с информацией за счет преобразования данных на отсканированном изображении в удобные форматы текстовых редакторов (doc, pdf и т.п.). Таким образом, появляется возможность модифицировать полученный текст, использовать его в своих документах. Печатать, а также осуществлять контекстный поиск.
Работы по распознаванию отсканированного текста можно подразделить на несколько этапов:
Распознавание структуры документа. С помощью специального программного обеспечения производится распознавание структуры документа. Стоит отметить, что современное ПО имеет режим автоматического определения типа, размера и структуры фрагментов изображения (текст, таблица, рисунок), но опыт свидетельствует, что необходимо обязательно проверять правильность определения фрагментов и проводить их корректировку.
Распознавание текста. На этом этапе особенно важно правильно установить параметры программы, чтобы минимизировать ошибки распознавания. Количество ошибок распознавания зависит от таких параметров, как полиграфическое качество документа, размер и контрастность текста, сложность взаимного размещения элементов документа.