Реферат: Проблемы автоматизации перевода математической литературы с английского языка на русский
Ученицы 9 класса
Гиназии №71 г. Гомеля
Барановой Валерии Викторовны
Научный руководитель —
Горский С.М.,
учитель информатики
Гомель, 2008
Содержание
Введение
1. Пересчет размерностей
2. Импликации в английских научно-технических текстах
3. Математические штампы
Заключение
Список использованных источников
Приложение 1
Введение
Обилие математической литературы вынуждает искать способы автоматического перевода, но низкое качество программ-переводчиков вынуждает использовать технику перевода «машина-человек», то есть в начале текст обрабатывает программа, а затем его корректирует человек, что существенно снижает затраты на перевод.
К сожалению, современные программы-переводчики, такие как Prompt, не поддерживают формат TeX, ставший стандартом представления математических текстов. Так же совершенно не поддерживается передача символов, названий функций, имен собственных, ставших традиционными для русскоязычной математической литературы.
Данная работа пытается восполнить этот пробел на стадии допереводческого анализа текста. В первом разделе работы обсуждаются вопросы передачи формул (пересчет при необходимости). Второй раздел посвящен импликациям в математических текстах, что так же не учитывается программами-переводчиками. В третьем разделе показывается, что при переводе математического текста можно применять технологию TranslationMemory, и приведены основные математические штампы [Сосинский].
Исследования, связанные с данной работой позволили написать несколько программ на языке Perl для анализа и частичного выполнения перевода. Недостаток объема текста не позволяет их рассмотреть подробно. Перечислим данные программы:
1. Программа для передачи символов, имен собственных, названий функций, названий теорем и т. п., сокращений.
2. Программа для анализа диалекта английского языка (BritishEnglish или American) поскольку это влияет на перерасчет формул.
3. Программа для нахождения комментариев в текстах программ и указания, можно ли производить перевод переменных. Данная программа актуальна, поскольку в языках программирования типа Perl, Python невозможно отличить комментарии от программы, не зная синтаксиса комментариев (На Perl даже сочиняют поэмы).
4. Программа для поиска импликаций в тексте для облегчения редактирования машинного перевода.
1. Пересчет размерностей
Рассматриваются примеры пересчета размерностей при переходе от британской системы единиц к метрической либо к международной системе (СИ). Эта операция – не простая и ответственная, особенно когда в исходном тексте размерность величины представлена неправильно или необычно, либо когда нужно определить численный коэффициент в полуэмпирической расчетной формуле. Приведем обоснование терминов, использованных при рассмотрении примеров.
Обычный пересчет размерности
Такой пересчет размерности сводится к перемножению всех составляющих ее единиц измерения, каждая из которых умножена на свой коэффициент пересчета. В нижеследующей таблице приведены коэффициенты пересчета наиболее ходовых единиц измерения из британской системы единиц в международную. Аналогичные таблицы существуют для пересчета британских единиц в метрические и метрических единиц в международные.
Наименование величины | Значение (Х) величины в британской системе | Коэффициент пересчета из британской системы единиц в СИ | Результат пересчета, представленный в СИ |
Длина | Х foot (ft) | 0,3048 | 0,3048 Х м |
Площадь | Х foot square (ft2 ) | 0,3048 × 0,3048 | 0,0929 Х м2 |
Объем | Х cubicfoot (ft3 ) | 0,30483 = 28,317 × 10-3 | 28,317 × 10-3 Х м3 |
Масса | Х pound of mass (lbm ) | 0,4536 | 0,4536 Х кг |
Время | Х second (s) | 1 | Х сек, или Х с |
Сила | Х pound of force (lbf ) | 4,448 | 4, 448 Х Н |
Скорость | Х f/s | 0,3048/1 = 0,3048 | 0,3048 Х м/с |
Работа | Х lbf xft | 4,448 × 0,348 = 1,356 | 1,356 Х Нм |
Давление | Х lbf /in2 (psi) | 4,448/(0,0254)2 = 6895 | 6895 Х Н/м2 |
Например, в исходном тексте говорится, что рабочее давление резервуара равно 980 psi. В СИ это давление записывается как 6,757 МПа (пересчет: 6895 × 980 Н/м2 = 6757100 Н/м2 » 6,757 МПа).
Конечно, таблица отражает лишь малую часть практических случаев. Взять хотя бы длину. В английском языке для ее измерения кроме фута широко используются дюйм, ярд, миля, мил, микродюйм, и, следовательно, количество сочетаний с использованием единиц измерения длины в размерностях велико. Кроме системных единиц измерения существует множество внесистемных (или «ведомственных»). Например, помимо системной международной единицы измерения давления Паскаль (т.е. Н/м2 ), в русской технической литературе используются кгс/см2 = кГ/см2 , кГ/м2 , атм. (атмосфера), торр (мм ртутного столба), бар (приблизительно равен атмосфере и точно равен 100 кПа), пьеза, миллиметр водяного столба.
Определение размерности путем ее анализа
Рассмотрим пример. В статье по обработке металлов резанием приводится таблица значений удельной работы резания Ut , причем размерность этой величины имеет вид h . p ./ in 3 / min . Такая неочевидная запись размерности недопустима, поскольку ее можно понять как ( h . p ./ in 3 ): min и как h . p .( in 3 / min ).
Чтобы перед пересчетом определить правильную запись размерности, переводчик рассуждает следующим образом: h . p . — мощность, т.е. работа в единицу времени; если ее поделить на in 3 , получим удельную мощность (т.е. мощность, затрачиваемую на единицу объема металла); чтобы из удельной мощности получить удельную работу, нужно удельную мощность помножить на время. Таким образом, правильная запись должна выглядеть как ( h . p ./ in 3 )· min , или h . p .· min / in 3 .
--> ЧИТАТЬ ПОЛНОСТЬЮ <--