Курсовая работа: Создание программы-переводчика текстов с английского на русский язык
Целью выполнения данного курсового проекта является приобретение практических навыков в построении переводчиков; в разработке диалога САПР; в структурировании языков САПР; в области использования языков программирования и создания языков проектирования.
В задачи курсового проекта по дисциплине «Лингвистическое обеспечение» входит:
- получение знаний в области лингвистического обеспечения;
- изучение классификации языков САПР, структуры трансляторов, структуры диалога в САПР;
- развитие навыков программирования, полученных на предыдущих курсах;
- развитие системное мышление;
- написание программы, соответственно варианту задания.
В настоящее время все большее распространение приобретает английский язык, как язык международного значения. Поэтому ставится задача создания более совершенных переводчиков. Разработанный проект демонстрирует переводчик, работа с которым очень удобна для пользователя. Программа является очень актуальной на сегодняшний день, она способствует быстрому переводу различных текстовых документов и обработку большого количества информации, а также предоставляет возможность добавления новых слов в словарь.
1. Предпроектные исследования
Лингвистическое обеспечение – это совокупность всех языковых средств используемых в САПР, включая термины и определения, правил формализации естественного языка, методы сжатия и развертывания текстов, необходимых для выполнения автоматизированного проектирования.
Лингвистическое обеспечение автоматизированной системы – совокупность языковых средств, используемых в автоматизированных системах, а также правил формализации естественного языка в целях повышения эффективности машинной обработки информации.
Практика показала, что мощность и комфортность конкретной системы автоматизированного проектирования прямо и весьма существенно зависит от мощности ее лингвистического обеспечения. Возрастающая практическая значимость лингвистического обеспечения определяется такими причинами, как:
- огромные объемы текстов на естественном языке, циркулирующих в информационных системах;
- необходимость использования новых стратегий обработки информации с учетом семантических законов обыденного языка;
- потребность в гибком и тесном симбиозе человека и компьютерной системы;
- вовлечение в обработку многообразных скрытых знаний, экспликация которых возможна только на естественном языке.
В настоящее время искусственные языки, использующие для описания предметной области текстовое представление, широко применяются не только в программировании, но и в других областях. С их помощью описывается структура всевозможных документов, трехмерных виртуальных миров, графических интерфейсов пользователя и многих других объектов, используемых в моделях и в реальном мире. Для того, чтобы эти текстовые описания были корректно составлены, а затем правильно распознаны и интерпретированы, используются специальные методы их анализа и преобразования. В основе методов лежит теория языков и формальных грамматик, а также теория автоматов.
Несмотря на то, что к настоящему времени разработаны тысячи различных языков и их трансляторов, процесс создания новых приложений в этой области не прекращается. Это связано как с развитием технологии производства вычислительных систем, так и с необходимостью решения все более сложных прикладных задач. Элементы теории языков и формальных грамматик применимы и в других разнообразных областях, например, при описании структур данных, файлов, изображений, представленных не в текстовом, а двоичном формате.
Лингвистическое обеспечение состоит из совокупности трёх языков: входного, внутреннего и выходного.
2. Р абота на тему «Бинарные деревья»
2.1 Техническое задание на разработку программы
Дана числовая последовательность. Отсортировать ее, используя обратный обход бинарного дерева в порядке возрастания.
2.2 Описание программы
Входной язык
Входной язык является средством взаимодействия пользователя с данной программой в ходе обработки исходных данных и формулировки проблемы.
Для данной программы исходными данными являются, числовая последовательность, необходимая для сортировки, которую пользователь вводит с клавиатуры.
Форма ввода для исходных данных приведены ниже (рисунок 1).
Рисунок 1 – Форма ввода данных для программы «Бинарные деревья»