Курсовая работа: Моделирование семантики специального текста
Мы проводили моделирование семантики статьи из журнала "Мир Авионики" №1 за 2004 год "Методы обработки информации в бортовых радиолокационных станциях обнаружения наземных объектов" (авторы - Г.Н. Ульянов, В.А. Шпенст). Она, как и большинство специальных текстов, написана по строгим правилам, принятым среди специалистов в любой области.
Как указывает И.С. Алексеева в своей книге "Профессиональное обучение переводчика" (СПб, 2000; стр.110-111), в специальных текстах присутствуют одни и те же синтаксические и морфологические структуры, одинаковые обороты речи, одинаковый стиль. Специальный текст служит для передачи когнитивной информации. Многочисленные языковые средства обеспечивают её оформления как объективной информации:
Семантика подлежащего;
Безличные и неопределённо-личные предложения и пассивные конструкции;
Преобладание настоящего времени глагола;
Обилие слов, построенных по словообразовательной модели с абстрактным значением;
Отчётливая номинативность текста.
Характерной чертой специального текста является обилие терминов, передающих основную часть когнитивной информации.
Остальная лексика в специальном тексте достаточно однообразна по составу. Её иногда называют общенаучным слоем терминологии или лексикой общенаучного описания. Подчеркнём её особенности в тексте:
Она лишена эмоциональной окраски;
Её можно отнести к нейтральному варианту современной письменной литературной нормы;
В ней широко развита синонимия.
В специальном тексте всегда имеются средства, повышающие уровень плотности когнитивной информации. Это прежде всего разного рода сокращения.
Абсолютное преобладание когнитивной информации в специальном тексте диктует логический, а не ассоциативно-образный путь его построения. Он обеспечен особыми языковыми средствами, которые организуют связность текста - средства семантической и формальной когезии.
Логичность изложения обеспечена также высоким уровнем сложности и разнообразием синтаксических структур. Дополнительным средством логической организации специального текста являются графические средства, прежде всего шрифтовые.
Мы видим, что моделирование семантики любого специального текста - сложная и многоаспектная задача. В этой работе мы сосредоточили своё внимание преимущественно на частотной составляющей анализа статьи из области радиолокации.
Приведём некоторые цифровые данные. Рассматриваемая статья содержит 2181 словоупотреблений, из них 1576 употреблений фоновой (неспециальной) лексики и 605 - терминологической (специальной), 87 пунктуационных, математических и других знаков. Абсолютным рекордсменом по числу употреблений, как и ожидалось, является точка - 134 вхождения. Среди терминов самым частотным является "Радиолокационное изображение" - 62вхождения, среди нетерминологической лексики - союз "и" - 64вхождение.
Основными методами работы с текстом являлись частотный и семантический анализ лексики, в результате чего были составлены таблицы, характеризующие частотность лексем в тексте, и терминологическая лексика была распределена по понятийным или семантическим группам.
Анализ терминов
В тексте статьи содержатся 605 терминов, из которых 407 являются существительными, 192 - прилагательными, 4 - предлогами, 1 - наречие, 1 - глагол.
Структура большей части этих терминов сложная. Чаще всего они представляют собой словосочетания типа "прилагательное + существительное" (76 терминов) или "существительное + существительное в родительном падеже" (41 термин). Однословные или простые термины занимают лишь второе по частотности место - их в тексте 56 единиц. Возможно, термины такого типа позволяют выразить больше признаков понятия, чем однословные, однако, требованию краткости они не удовлетворяют.
Нами было посчитано количество вхождений существительных в единственном и множественном числах. В соответствии Академической грамматикой русского языка (М., 1982) единственное число существительного является признаковой категорией и, следовательно, должно встречаться в 1,5 - 2 раза реже, чем множественное число. Нами установлено, что преобладают существительные в единственном числе (344 вхождения). Это можно объяснить большой степенью абстрактности и обобщённости излагаемой информации, поскольку одним из переносных значений категории единственного числа является обобщающее значение.
Анализ вхождений существительных в различных падежах показал существенное преобладание родительного падежа (252 существительных из 407). Это явление типично для русского языка. По сведениям Академической грамматикой русского языка (М., 1982) родительный падеж в отличие от остальных, имеющих одно центральное и несколько периферийных значений, имеет в качестве центральных значений целых три: субъектное, определительное и объектное.
Что касается терминов-синонимов и омонимов, то в тексте анализируемой статьи их нет. Но мы предполагаем, что это отнюдь не значит отсутствие их в данной области науки. Как правило, термины - синонимы употребляются разными авторами или в различных статьях. Следовательно, материала одной статьи не достаточно для полного анализа этого аспекта.
Большинство терминов моносемичны, что, наверное, можно отнести к заслугам учёных - терминологов, которые провели длительную работу по стандартизации терминологии, отбору терминов и составлению правил и рекомендаций по созданию новых. Однако, встретились в тексте статьи и полисемичные термины, такие как "борт" (совокупность элементов обшивки летательного аппарата и сам аппарат), "земля" (3 планета Солнечной системы и наземная радиолокационная станция), "высота" (угол между горизонтом и светилом, измеряемый вдоль дуги вертикала и перпендикуляр, опущенный к стороне многоугольника), "оператор" (понятие, означающее соответствие между элементами двух множеств X и Y и член боевого расчёта, занимающийся наблюдением за полученным изображением). И хотя их неоднозначность в данном случае снимается контекстом, эти термины всё же можно признать не вполне удовлетворительными с точки зрения требований, выдвигаемых лингвистами.
Для обработки массива терминов данной статьи потребовалось определить все его элементы, используя словари и учебники по данному вопросу. На основе проделанной работы имеющиеся термины были разделены на 9 семантических групп:
вычислительная техника - процессор, ОЗУ, ЦВМ;
география - карта, Земля (планета), азимут;
изображение - геометрическое искажение, комплексирование, плотность почернения;
математика - интерполяция, коэффициент, оператор;