Курсовая работа: Совершенствование информационной системы управления кадров и работы с личным составом Главного управления Федеральной службы исполнения наказания по Иркутской области
Технологии автоматизации ввода информации
Автоматизация работы с документами невозможна без средств ввода их в компьютер. До недавнего времени текстовые документы вводились лишь при помощи клавиатуры, изображения сканировались и хранились в виде файла в графическом формате. В системах первого поколения графические образы введенных документов идентифицируются с помощью ключевых слов для последующего поиска необходимой информации.
Альтернативными способами ввода документов в компьютер стали системы распознавания изображения и распознавания голоса.
Работы над созданием системы распознавания изображения велись очень давно. Для ввода данных в настоящее время используются технологии интерпретации изображения, называемые системами автоматического распознавания (например, ABBYYFineReader), чье дальнейшее развитие связано с распознаванием не только печатных, но и написанных от руки символов.
При массовом ручном вводе однотипных документов используются электронные формы, которые обеспечивают структуризацию документа путем выделения частей текста и добавления полей (атрибутов), что позволяет упростить заполнение документов и выполнить необходимые вычисления. Информация в офис может поступать и путем импорта файлов с магнитных носителей или по телекоммуникациям (факсы, сообщения электронной почты и т.п.).
Десятилетиями ученые и инженеры искали способы, которые позволили бы людям общаться с компьютером так же, как они общаются между собой, а не заставлять пользователей приспосабливаться к языку, который понятен машине. Речь - это самое прямое, непосредственное и интуитивное средство общения между людьми, которое могло бы стать мостом между человеком и машиной.
В общих чертах технология компьютерного распознавания речи реализуется следующим образом: при помощи воспринимающих (микрофона) и оцифровывающих устройств и машинной обработки фиксируется акустический (речевой) сигнал и преобразуется в цифровую форму. Затем цифровой сигнал разбивается на неделимые интервалы, называемые фонемами. Фонемы представляют собой элементарные единицы звука. Последовательность фонем составляет слоги, слоги составляют слова, слова составляют предложения, которые представляют сообщения, идеи и команды.
Для англоязычных программ уже реализована функция распознавания голоса в некоторые системы и текстовые процессоры. Коммерческие программы распознавания голоса работают в системах речевых услуг, от справочных столов до записи медицинских процедур.
В 1996 г. была представлена голосовая мышь. Это система, имеющая то же назначение, что и обычная мышь, но позволяющая вводить команды голосом. Произнесенные команды распознаются специальной программой, в памяти которой содержится несколько сотен слов-команд для различных Windows-приложений. Последовательность действий, задаваемая каждой командой (клавиатурный макрос), определяется пользователем. Качество распознавания команд составляет 98%.
1.2 Автоматизация хранения и поиска документов
Важное значение для организации эффективного управления неструктурированными документами имеют методы хранения информации, навигации, поиска и анализа документов. Для этого ввод информации сопровождается классификацией документов путем задания атрибутов и ключевых слов, аннотированием их содержания. Для ускорения последующего контекстного поиска производится полнотекстовое индексирование документов.
Документы могут храниться просто в файловой системе, и при этом система каталогов служит средством группирования и навигации в хранилище документов. В современных операционных системах типа Windows есть возможность задания длинных имен каталогов и файлов в качестве названий лапок и документов, а также имеются соответствующие средства поиска файлов по их параметрам.
Ряд систем, основанных на электронной почте, хранят документы в почтовых ящиках в виде почтовых сообщений с присоединенными файлами. Навигация в хранилище упрощается с помощью вложенных папок личного и коллективного пользования (рис. 1.1). Однако в таких системах поиск и фильтрация ограничены лишь отбором и сортировкой документов по атрибутам и тексту почтового сообщения.
Рис. 1.1 Способы хранения и поиска документов
Многие современные системы электронных документов используют в дополнение к файловой системе так называемые библиотеки документов, содержащие в БД карточки документов с атрибутами и ключевыми словами. Для логической группировки документов применяются папки.
Поиск и фильтрация документов производится по запросам на основе контекстного поиска: по атрибутам, по ключевым словам и по полному содержанию текста на основе индекса. При использовании механизма четкого поиска в запросе не должно быть орфографических ошибок, а в тексте документа - ошибок распознавания.
На основе нейронных сетей и искусственного интеллекта реализована технология нечеткого поиска по полному содержанию документа. Нечеткий поиск не требует полного соответствия искомых фраз с содержимым документов, кроме того, исключает потребность в исправлении ошибок после распознавания текста. Система поиска всегда выдает пользователю ответ, наилучшим образом согласованный с терминами или фразами запроса.
В реляционных СУБД реализованы другие схемы хранения - текстовые и универсальные БД. Тексты документов хранятся в символьных полях переменной длины, расширенные средства SQL-поиска позволяют формировать смешанные запросы для поиска по атрибутам и контекстного поиска, а дополнительные функции обеспечивают обработку текста.
Распределенный гипертекст составляет основу широко внедряемой Web - технологии. Хранилище информации представляет собой совокупность гипертекстовых страниц, распределенных по узлам сети Internet или Корпоративной сети (Intranet). Каждая страница размещается в отдельном файле и представляет собой текст, размеченный с помощью языка HTML. Структуризация документа осуществляется путем форматирования, выделения полей, создания форм для диалогового заполнения документа и организацией внутренних гипертекстовых ссылок. Навигация по хранилищу гипертекста осуществляется с помощью внешних гипертекстовых ссылок URL на документы, расположенные на различных узлах сети (Web-серверах). Кроме того, для определения местонахождения документов служит контекстный поиск. Для ускорения поиска информации в Internet применяются специальные программы-роботы, сканирующие Web-сервера и строящие некое подобие индекса. Использование гипертекста позволяет создать информационную инфраструктуру территориально распределенного учреждения и упростить диалоговый интерфейс пользователя, что наиболее важно при разработке информационных приложений для руководителей.
1.3 Обработка документов с использованием офисных пакетов
Офисные пакеты представляют собой набор программ, подготовленный производителем для автоматизации решения наиболее распространенных задач. Эти программы работают как единый программный комплекс, разрешена проблема совместимости между разными программами. Сами изготовители программного обеспечения дали такому комплекту название «офисный пакет», прочно прижившееся среди пользователей. Лидерысредиофисныхпакетов - Microsoft Office, Lotus SmartSuite, Corel WordPerfect Office.
В последние годы в мире говорят также о пакете StarOffice компании Sun, разработанном для операционной системы Linux. Компания Sun поддерживает проект OpenOffice.org, который в рамках концепции открытого кода - исходного текста компьютерных программ (opensource), позволяет пользователям всего мира свободно (бесплатно) получить операционную систему Linux и вместе с ней офисный пакет OpenOffice (он работает также на платформах Windows и Unix). Данный проект смог привлечь к разработке опыт тысяч талантливых программистов со всего мира, что позволяет операционной системе Linux и офисному пакету StarOffice/OpenOffice конкурировать с Microsoft. Главное различие платной и бесплатной версий StarOffice - то, что Sun осуществляет техническую поддержку и обучение пользователей StarOffice, и то, что StarOffice содержит некоторые дополнения, отсутствующие в OpenOffice, такие как специальные шрифты и база данных.
Отечественные фирмы также предлагают решения для автоматизации отдельных видов работы офиса и занимают конкретные ниши благодаря своим расширенным возможностям, таким как совместимость с определенными видами данных, поддержка национальных особенностей или специфических аппаратно-программных платформ. В России получил распространение офисный пакет «Русский Офис».
Традиционный набор программ для организации офисной работы представлен в таблице 1.2. Все представленные пакеты обеспечивают работу с Internet.
Таблица 1.2
Офисные пакеты различных производителей
Microsoft | Corel | Lotus | Sun | АрсеналЪ | |
Офисный пакет | Office | WordPerfectOffice | SmartSuite | StarOffice | Русский Офис |
Текстовый процессор | Word | WordPerfect | WordPro | Writer | Лексикон |
Электронная таблица | Excel | Quattro Pro | 1-2-3 | Calc | |
Презентация | Power Point | Perfect Presentations | Freelance Graphics | Draw | |
СУБД | Access | Paradox | Approach | ||
Электронный органайзер | Outlook | Info Central | Organizer |
Лидером на рынке офисных приложений является корпорация Microsoft. По разным оценкам, она контролирует сейчас 80-95% рынка офисных пакетов в западных странах, а в России эта цифра еще выше. В то же время во Франции, Германии, Италии, Португалии, Китае и Японии лидируют продукты CorelPerfect.
Коллективная работа с информацией
Концепция современного «электронного офиса» предполагает обязательную совместную работу всех сотрудников. Организация и автоматизация в офисе коллективной работы с документами строятся на технологиях groupware (командная работа) и workflow (поток работ).
Технологии командной работы ориентированы на небольшие рабочие группы, характеризуются поддержкой выполнения одной коллективной задачи и отсутствием структуризации в организаций работ. Поддержка ограничивается обеспечением коллективного доступа к информации с помощью различных методов доступа: