Курсовая работа: Автоматизация работы в офисе
Вкладка «Установки» определяет общие настройки программы. Здесь задают язык интерфейса и настраивают используемые единицы измерения.
Флажки панели «Показывать» определяют способ представления окна программы и открытых документов.
Панель «Цвета» позволяет определить цвета различных элементов документа. В нижней части окна можно задать дополнительные параметры.
2.7. Распознавание бланков
Важной особенностью программы FineReader является возможность распознавания бланков. Бланк представляет собой отформатированный документ, в специальные поля которого вносятся данные. Типичными примерами бланков являются анкеты. Формат бланка может быть достаточно вычурным и не напоминать ни книжную, ни журнальную страницу.
Особенность работы с бланками заключается в том, что приходится иметь дело с объемным пакетом документов одинаковою формата, заполненных разными людьми. В таких документах различается содержание заполненных полей, а стандартные заголовки не представляют интереса. Данные, полученные из набора бланков, обычно подлежат последующей обработке, например статистической. Для обработки бланков предназначено специальное приложение FineReader Forms.
Для распознавания содержимого бланка необходимо предварительно создать шаблон формы. Для этого служит команда «Сервис®Шаблоны». В открывшемся диалоговом окне «Шаблоны» можно создать новый шаблон или открыть для редактирования уже имеющийся.
В этом случае программа открывает окно «Редактор шаблонов» и дополнительное диалоговое окно «Параметры». В этом окне размещают блоки, соответствующие полям бланка и для каждого блока указывают тип содержащегося в нем значения. Блоки, содержащие данные, задаваемые пользователем, помечаются как экспортируемые. Данные могут записываться в текстовый файл или заноситься в базу данных в качестве записей.
Созданный шаблон используется на этапе сегментации. Сегментация в данном случае состоит не в реальном разбиении страницы на блоки, а в наложении шаблона. Положение шаблона корректируется в соответствии с тем, насколько ровно был размещен бланк при сканировании.
Заключительный этап состоит в распознавании содержимого бланка. Результат представляется в виде формы, содержащей названия полей и их содержание. Последовательность распознанных бланков может быть сохранена в рамках единой базы данных для последующей обработки.
3. Автоматический перевод документов
Идея автоматического перевода текстов с одного языка на другой витает в воздухе со времени появления самых первых компьютеров. Если бы полноценный перевод был возможен, значительно упростилось бы общение между народами и обмен документами, но это очень сложная задача, о полном решении которой пока не приходится говорить.
Все упирается в объем переводимого текста. Компьютеризованный словарь вполне может справиться с переводом отдельных слов, особенно если он способен предложить несколько значений на выбор. Однако ситуация заметно усложняется, когда мы переходим к переводу целых фраз и, тем более, абзацев связного текста.
Для таких случаев надежного алгоритма перевода с одного языка на другой не существует. Это связано с тем, что каждая фраза языка имеет два уровня: синтаксический и смысловой. Синтаксический уровень определяет построение предложения, а смысловой – его содержание. Для правильного смыслового перевода необходимо принимать во внимание не только конкретную фразу, но и абзац или даже целую главу текста. Таким образом, рассчитывать на то, что при автоматическом переводе получится полноценный документ, нельзя.
Программы автоматического перевода рассчитаны, в первую очередь, на тех, кто совсем не знает соответствующего иностранного языка, но должен ознакомиться с содержанием документа хотя бы приблизительно. Кроме того, подобные программы позволяют готовить короткие сообщения электронной почты на иностранном языке. Такие сообщения трудно считать грамотными, но, скорее всего, корреспондент сумеет понять, что ему хотели сообщить.
Если нет никаких требований к качеству перевода текста с иностранного языка на русский, то программы автоматического перевода можно рассматривать как удобные средства получения простейшего черновика. Если подобные требования есть, то использовать подобные программы не рекомендуется. Квалифицированное редактирование текста, полученного автоматическим путем, обходится в несколько раз дороже, чем услуги специалистов-переводчиков.
3.1. Средства автоматического перевода
Программные средства автоматического перевода можно условно разбить на две основные категории. Первую категорию представляют компьютерные словари. Назначение компьютерных словарей то же, что и у обычных словарей: предоставить значение неизвестного слова.
Преимущество компьютерных словарей состоит в быстроте доступа и удобстве автоматического поиска значения выделенного слова. Автоматический словарь обычно предоставляет возможность перевода слова по нажатию выделенной комбинации клавиш.
Ко второй категории относятся программы, позволяющие выполнить автоматический перевод связного текста. Они принимают текст на одном языке (предположительно грамотный и не содержащий опечаток) и выдают текст на другом языке. В ходе работы программа использует обширные словари, наборы грамматических правил и другие средства, обеспечивающие наилучшее (с точки зрения программы) качество перевода. Словарь может содержать не только отдельные слова, но и типичные словосочетания.
Используя эти средства, программа анализирует грамматическую структуру предложений исходного текста, обнаруживает связи между словами и пытается построить верный перевод фразы на другом языке. Чем короче предложение, тем больше шансов на то, что такое преобразование будет правильным. В длинных предложениях и сложных грамматических конструкциях любая система перевода может давать сбои.
В Украине наиболее широкое распространение получили программы автоматического перевода с английского языка на русский, а также с русского на английский. Это объясняется ведущей ролью английского языка в сфере международного общения. Англи