Курсовая работа: Ввод стандартных форм и форматированных документов
· средство разработки ABBYYFormReader 6.5 DeveloperEdition для интеграции функций FormReader во внешние приложения;
· инструментарий ABBYYFlexiCaptureStudio 1.5 для создания на базе ABBYYFormReader с технологией ABBYYFlexiCapture решений для обработки гибких форм и документов.
ABBYYFormReader успешно используют банки, страховые компании, маркетинговые агентства и производственные компании, государственные учреждения и учебные заведения, торговые компании и медицинские организации.
ABBYYFormReader способен обрабатывать любые типы форм, соответствующие простым требованиям машиночитаемости, автоматически сортирует бланки, проверяет комплектацию многостраничных форм, не требует вмешательства оператора на этапах сканирования и распознавания.
Система предполагает автоматический контроль результатов распознавания с помощью перекрёстных проверок, правил контроля сумм, сверок по словарям и базам данных. Существует возможность создать собственные правила проверки, в том числе с подключением списков и словарей, и использовать их для контроля качества вводимых данных.
Использование локальной версии ABBYYFormReader позволяет силами одного сотрудника вводить ежедневно от 500 до 1000 страниц в зависимости от сложности формы и аппаратной конфигурации. Если объём работ по вводу данных увеличится, пользователь в течение дня сможет модифицировать существующий комплекс, перейдя на версию с большей производительностью. Чтобы увеличить скорость обработки форм на 1000 страниц в день, достаточно установить FormReader на еще одно рабочее место [3,4,12].
FineReaderBank — система автоматизированного ввода платежных поручений — также является продуктом разработки компании ABBYY. FineReaderBank — готовое приложение, в основе которого лежит технология распознавания гибких форм [5,6].
3.2 Система Cognitive Forms
Компания CognitiveTechnologies разработала систему для ввода и обработки форм — Cognitive Forms. Процесс её работы осуществляется следующим образом.
Оператор на станции сканирования помещает пачку документов в устройство автоматической подачи сканера. Нажатием клавиши запускается процесс потокового сканирования документов.
Подсистема распознавания — Cognitive Form-Reader в автоматическом режиме управляет распознаванием и контекстной проверкой правильности распознавания.
На станции визуального контроля (модуль редактирования Cognitive Form Editor) оператор имеет возможность визуально контролировать и редактировать распознанные поля форм перед экспортом в базу данных.
В подсистеме описания форм (Cognitive Form Designer) производится компьютерное описание обрабатываемых форм, используемое на всех этапах процесса ввода от распознавания до экспорта в базу данных.
Подсистема экспорта результатов формирует текстовое представление документа перед его записью в базу данных, с окончательной проверкой на допустимость значений экспортируемых данных. Регистрация записи осуществляется пользователем после ввода и проверки определенного количества документов.
Одним из важных элементов Cognitive Forms является система контроля за правильностью ввода информации. Ее основная функция состоит в том, чтобы точность распознавания на выходе составляла 100%, обеспечивая при этом минимальную степень утомляемости оператора. Человек контролирует лишь те данные, которые не удовлетворяют требованиям правильности распознавания.
Слова документа, содержащие сомнительно распознанные символы или автоматически исправленные подсистемой контекстного контроля, подсвечиваются. Оператору не нужно проверять все содержание текста и сравнивать его с исходным документом. Это гарантирует меньшую утомляемость оператора и соответственно 100%-ю точность ввода информации в самых ответственных операциях. Экспорт в базу данных осуществляется клиентом системы после ввода определенного количества форм.
Благодаря гибкой модульной организации системы имеется возможность простого масштабирования для увеличения производительности ввода.
Система работает по принципу максимальной автоматизации ввода. Все операции, связанные с навигацией по форме, распознаванием, контекстным контролем за корректностью ввода и экспортом в базу данных, происходят без участия оператора.
Участие оператора может потребоваться только на стадии окончательного контроля перед экспортом в базу данных.
По описанию заметно, что в системе обработки форм Cognitive Forms ярко представлены все этапы ввода стандартных форм, а также система является масштабируемой и открытой, что даёт ей преимущества [10,13,14,15].
Выводы к разделу 3
Из нескольких сотен компаний, предлагающих решения или компоненты систем обработки форм, наиболее известными являются системы «ABBYYFineReaderForm» и «Cognitive Forms». Они предлагают различные модули ввода и обработки форм. Организация может приобрести как всю систему, так и отдельные модули. Кроме того, многие компании разрабатывают свои собственные решения, лицензируя у производителей модули обработки. Следовательно, в выборе системы массового ввода следует ориентироваться на особенности организации и формы, преобладающие в ней.
ЗАКЛЮЧЕНИЕ
В деятельности большого количества государственных, акционерных и частных предприятий возникает необходимость обработки структурированных и неструктурированных форм документов, изначально выполненных на бумаге. Обычно под этим понимается первоначальный ввод информации с бумажного документа в информационную систему предприятия и, затем, собственно обработка данных в СУБД и прикладных информационных системах.
Суммарное количество документов, которые должны быть занесены в базу данных для дальнейшей обработки только в одной организации, может достигать нескольких тысяч и даже десятков тысяч в день. Можно представить, в каком масштабе подобные работы производятся в целом по У