Реферат: Лексикографічна структура семантичного словника в моделях класу Смисл - текст
МС => ПСС аналіз
ПСС => ГСС
ГССвхід => ГССвихід власне переклад
ГССвихід => ГССпохід перефразування
ГСС => ПСС
ПСС => МС синтез
МС => Речення
На всіх етапах, за винятком першого та останнього, необхідно звертатися до ТКС, який, таким чином, виявляється вельмисуттєво зв’язаним з граматичним компонетом системи, являючи з нею один (інтегральний) опис мови. Тому для успішної роботи системи необхідно мати максимально узгоджені один з одним граматику і словник. Це дуже складно зробити, бо цей словник має вміщувати, як можна більше інформації про мову, але без такого словника автоматизований переклад (саме ПЕРЕКЛАД) буде неможливий.
Словарна стаття ТКС являє собою підмножину деякої множини зон, у котрих записується інформація про відповідні властивості лексичних одиниць. Кожна зона, за винятком першої, вводиться своєю поміткою – абревіатурою з прописних латинських букв, з двокрапкою. Ось ці зони:
(1) Вхід – порядковий номер та ім’я лексичної одиниці, з номером омоніма та номером значення;
(2) TRANS – переклад:
(3) DEF – тлумачення лексичної одиниці в термінах лексичних функцій;
(4) POR – частина мови;
(5) LIM – морфологічні, синтаксичні та обмеження, що поєднуються, на дане значення слова, на безумовний зворот чи на слово у складі фраземи;
(6) SYNT – синтаксичні ознаки;
(7) DES – дескриптори (семантичні ознаки);
(8) GOV – синтаксичні ознаки та дескриптори типового синтаксичного власника;
(9) MG – модель чи моделі керування;
(10) PREL – потенційні синтаксичні зв’язки для слова у складі фраземи;
(11) LF – лексичні функції;
(12) TRSFS – поверхнево-синтаксичні перетворення для фразем – “мікросинтагми”;
(13) TRSFD – глибинно-синтаксичні перетворення для фразем;
(14) - неформальна зона ілюстрацій та приміток.
Зони (1) та (4) обов’язкові в будь-якій словниковій статті. В словникових статтях фразем обов’язкові зони (12) та (13). Решта зон факультативні.
Однією з двох центральних проблем будь-якої системи АП (автоматизованого перекладу) є вирішення проблеми неоднозначності при аналізі – морфологічної, синтаксичної і лексичної омонімії та лексичної полісемії. (Друга центральна проблема – можливість породити достатню синонімію при синтезі, щоб подолати лексико-синтаксичні розходження між вхідною і вихідною моваим).
З усіх перерахованих типів неоднозначності доречно розглянути тільки лексичну полісемію та засоби її вирішення.
Для цього використовується інформація, що знаходиться в таких зонах: LIM, SYNT, GOV, MG, LF. LIM виступає як розрізник значень у тих випадках, коли на значення і слова Х накладаються певні морфологічні чи синтаксичні обмеження, а в реченні, яке ми оброблюємо ці обмеження не спостерігаються.
Наприклад, лексема ЗУСТРІЧАТИ І (Я випадково зустрів її – RECONTRER (fr.)), ЗУСТРІЧАТИ ІІ (Хто поїхав зустрічати делегацію? – ACCUEILLIR (fr.)). Ця різниця формально і цілком природньо проявляється в тому, що ЗУСТРІЧАТИ ІІ може бути залежним членом обставинного відношення при лексемі, здатної підпорядковувати собі цільовий інфінітив. до числа таких лексем відносяться більшість дієслів переміщення типу ЙТИ, ПІТИ, ЇХАТИ, ВЕСТИ та ін. Всім їм у словнику приписується спеціальна синтаксична ознака (обс-інф), яка описує їх здатність бути головним членом згаданої вище конструкції. Щоб використати цю інформацію при виборі потрібного значення дієслова ЗУСТРІЧАТИ в реченнях типу
Хто поїхав зустрічати делегацію?