Дипломная работа: Інформаційний синтез системи автоматичного розпізнавання бланків документів

Припустимо, що при друкуванні цифр біля кожної з них буде надрукована група точок з різним для кожної точки інтервалом. Тоді система розпізнавання може аналізувати не самі зображення, а супроводжуючі їх групи точок. Поява кожної точки фіксується, наприклад, одиничним фоторецептором, а вся група перетворюється в послідовність імпульсів. Цю послідовність подають на дешифратор, котрій видає сигнал, що характеризує дану цифру. На формування сигналу не впливають ні якість надрукованої літери, ні зміна її положення в рядку, ні зміна стилю написання. Задача розпізнавання зображень зводиться до задачі розпізнавання кодів, подібних азбуці Морзе.

Основний недолік методу заключається в тому, що кожне зображення, яке необхідно розпізнати, повинно до представлення системі пройти спеціальну обробку в маркувальному приладі. Тому даний метод не знайшов широкого застосування на практиці.

1.2.8 Квазітопологічний метод розпізнавання

Основна складність розпізнавання полягає в тому, що один і той же образ може бути представлений зображеннями, що суттєво відрізняються між собою. Наприклад, для одного і того ж алфавіту існує велика кількість написання одних і тих же знаків. Не дивлячись на це, система розпізнавання повинна завжди ототожнювати всі написання однієї літери в один образ. Для цього необхідно скласти таке описання зображення, яке було б інваріантним до вказаних змін.

Для аналізу зображень можна використати математичний апарат топології. Так як проекційні перетворення, що розглядаються в топології, дуже широкі, то використовується лише одна математична категорія – графи. Граф – це множина, що складається з підмножини елементів, що називаються ребрами, і підмножини елементів, що називаються вершинами. Кожному кінцю ребра відповідає одна вершина, а кожному ребру відповідає дві вершини. Якщо є можливим взаємно неперервне і взаємно однозначне відображення графа на граф , то таке відображення називається гомеоморфним.

Такі зображення, як літери латинського алфавіту, можна розглядати як плоскі графи, а різні написання однієї і тієї ж літери – як гомеоморфні перетворення деякого ідеального знаку.

Гомеоморфність двох графів встановлюється за допомогою топологічних інваріантів, тобто ознак, які не змінюються при гомеоморфних перетвореннях. Простіше всього користуватися інваріантами, котрі можуть бути виражені за допомогою чисел. Для цього необхідно встановити правило, за яким кожному графу ставиться у відповідність деяке число, що залишається незмінним при гомеоморфних перетвореннях. Частіше всього в якості топологічного інваріанту використовують індекс вершини, котрий визначається як кількість ребер, що входять у вершину. Індекс вершин встановлюється при послідовному обході графа за певним правилом. Це правило може бути сформоване так: обхід відбувається по ребрам, при чому напрям обходу змінюється на протилежний у випадку попадання на вершину з індексом 1; у випадку, якщо індекс вершини більше 2, далі рух з цієї вершини необхідно продовжувати по першому ребру, розміщеного за годинниковою стрілкою відносно ребра, по якому рухома точка потрапила в цю вершину. Таке правило дозволяє проводити послідовний обхід любого графа по зовнішнім ребрам при умові, що обхід почався з випадкової точки будь-якого зовнішнього ребра.

Метод квазітопологічного розпізнавання [9, 13] може бути реалізований за допомогою слідкуючої розгортки, коли обхід відбувається по зовнішньому контуру зображення. До слідкуючої розгортки повинен бути добавлений пристрій, який визначає індекси вершин в місцях згину зовнішнього контуру. Далі схема логіки повинна проводити декодування отриманих кодових комбінацій. Крім цього, повинен бути присутній або пристрій для фіксації початку обходу, або пристрій, який би забезпечував декодування кодових комбінацій в циклічних перестановках.

Таким чином квазітопологічний метод можна успішно застосовувати для побудови читаючих автоматів. Але використання цього методу не може принципово забезпечити повного розподілу літер алфавіту, так як деякі зображення літер є гомеоморфними одному і тому ж еталонному графу. Це стосується літер П, С, Г. Вони є гомеоморфними відрізку прямої. Крім того, метод не може забезпечити якісного розпізнавання при наявності нечіткого зображення літери, що розпізнається, та потребує багато часу.

1.3 Постановка задачі та формування завдань дослідження

Виходячи з аналізу методів розпізнавання образів (табл. 1.1), та перспектив розвитку методів розпізнавання [14, 17], в даній роботі запропоновано розробляти систему розпізнавання рукописних символів у рамках інформаційно екстремальної інтелектуальної технології (ІЕІТ), що ґрунтується на максимізації інформаційної спроможності системи, шляхом оптимізації її параметрів функціонування за умов апріорної невизначеності інформаційних і ресурсних обмежень. В рамках ІЕІТ, завдяки самонавчанню системи та шляхом оптимізації просторово-часових параметрів функціонування системи розпізнавання, можна побудувати безпомилкові вирішальні правила.

Розглянемо постановку задачі загального синтезу систами розпізнавання. Нехай ефективність навчання розпізнаванню реалізацій класу , характеризується значенням критерію функціональної ефективності. Відома навчальна матриця де - кількість ознак розпізнавання і випробувань відповідно. Рядок матриці утворює -ту реалізацію образу, а стовпець- навчальну вибірку з генеральної сукупності значень -ї ознаки розпізнавання. Треба для структурованого вектора параметрів функціонування системи розпізнавання , які будемо називати параметрами навчання і для яких відомі обмеження , шляхом організації послідовних ітераційних процедур знайти екстремальні значення координат вектора , що забезпечують максимум КФЕ навчання системи розпізнавання:

,

де - область допустимих значень параметрів навчання.

Треба на етапі екзамену визначити з наближеною до асимптотичної повної достовірності належність зображення, що розпізнається до одного з класів розпізнавання із сформованого на етапі навчання алфавіту класів .

Об’єктом дослідження є слабо формалізований процес розпізнавання зображень.

Предметом дослідження є метод розпізнавання зображень у рамках МФСВ.

Метою роботи є підвищення достовірності та оперативності розпізнавання рукописних символів у рамках ІЕІТ.

Для досягнення поставленої мети необхідно вирішити такі завдання:

- розробити базовий алгоритм навчання та екзамену за ІЕІТ;

- сформувати навчальну матрицю для зображень в декартових і полярних координатах;

- розробити та програмно реалізувати алгоритм навчання системи розпізнавання рукописних символів за ІЕІТ з оптимізацією контрольних допусків на ознаки розпізнавання;

- програмно реалізувати алгоритм екзамену та оцінити достовірність результатів;


2 ОПИС МЕТОДУ РОЗПІЗНАВАННЯ РУКОПИСНИХ СИМВОЛІВ

2.1 Основні ідеї інформаційно-екстремального методу розпізнавання рукописних символів

Базовим методом ІЕІТ є метод функціонально-статистичних випробувань (МФСВ) [18, 19, 20] – непараметричний інформаційно-екстремальний метод аналізу та синтезу здатної навчатися системи керування, який ґрунтується на прямій оцінці інформаційної здатності системи за умов нечіткої компактності реалізацій образу, та обмеження навчальної вибірки, яка є прийнятною для задач контролю і керування. Метод призначено для розв’язання практичних задач контролю та управління слабо формалізованими системами і процесами шляхом автоматичної класифікації їх функціональних станів за умови невизначеності.

МФСВ окрім системних та специфічних принципів ґрунтується також на 2-х дистанційних принципах:

- максимально-дистанційному, який вимагає максимальної міжцентрової відстані між класами;

- мінімально-дистанційному, вимагає мінімальної середньої відстані реалізацій від центру свого класу:

Класом розпізнавання (образом) називається відбиття властивостей m-го функціонального стану системи розпізнавання і відношень між елементами системи. Клас розпізнавання - топологічна категорія, яка задається в просторі ознак розпізнавання областю ÌWБ .

Детерміновано-статистичний підхід [21, 22] до моделювання систем вимагає завдання систем нормованих (експлуатаційних) і контрольних допусків на ОР. Нехай - базовий клас, який характеризує максимальну функціональну ефективність, тобто є найбільш бажаним для розробника інформаційного забезпечення системи. Нормованим називається поле допусків , в якому значення і–ї ОР знаходиться з імовірністюабо , за умови, що функціональний стан відноситься до класу. Контрольним називається поле допусків, в якому значення і-ї ОР знаходиться з імовірністю за умови, що функціональний стан відноситься до класу.

В ІЕІТ система контрольних допусків вводиться з метою рандомізації процесу прийняття рішень, оскільки для повного дослідження об’єкту контролю та управління необхідно використовувати як детерміновані, так і статистичні характеристики. Зрозуміло, що і базова (відносно класу) СКД є сталою для всієї абетки класів розпізнавання.

Реалізацією образу називається випадковий структурований бінарний вектор , де - і-та координата вектора, яка приймає одиничне значення, якщо значення і-ї ОР знаходиться в полі допусків , і нульове значення, якщо не знаходиться; - мінімальна кількість випробувань, яка забезпечує репрезентативність реалізацій образу.

К-во Просмотров: 240
Бесплатно скачать Дипломная работа: Інформаційний синтез системи автоматичного розпізнавання бланків документів