Дипломная работа: Інформаційний синтез системи автоматичного розпізнавання бланків документів
У теперішній час технічно не складно перетворити паперовий документ в цифровий формат. Для цього можна скористатися сканером, цифровою фото або відео камерою. Якщо перетворення паперових документів в цифровий вигляд можна вважати вирішеною проблемою, то розпізнавання введеного документа все ще залишається актуальним. Хоч і створені програми розпізнавання друкованих документів з прийнятною якістю розпізнавання, але більшість розроблених систем дають великі похибки при обробці текста низької якості, чи текста з різним рівнем яскравості. Якщо ж говорити про розпізнавання рукописних документів, то можна сказати, що результатів, задовільних на практиці, ще не отримано.
Тема дипломної роботи є актуальною, оскільки вона присвячена розпізнаванню рукописних символів, що до теперішнього часу залишається невирішеною проблемою. У дипломній роботі розглядається задача підвищення функціональної ефективності системи розпізнавання рукописних символів, що дозволяє з більшою достовірністю і оперативністю приймати управлінські рішення, обробляти великі масиви текстової інформації, здійснювати факсимільну передачу оригіналів підписів і фінансових документів.
1 АНАЛІЗ ПРОБЛЕМИ ТА ПОСТАНОВКА ЗАДАЧІ
1.1 Огляд методів розпізнавання образів
Найбільш ефективними методами виведення нових знань є методи розпізнавання образів на основі навчання (самонавчання) [1, 2, 3].
Виділяють такі способи відображення знань:
1. Інтенсіональне відображення – у вигляді схеми зв’язків між атрибутами (ознаками).
2. Екстенціональне відображення – за допомогою конкретних фактів (об’єкти, приклади).
Інтенсіональне відображення фіксує закономірності і зв’язки, якими пояснюється структура даних. Відповідно до діагностичних задач така фіксація полягає у визначенні операцій над атрибутами (ознаками) об’єктів, що призводять до потрібного діагностичного результату. Інтенсіональне зображення реалізуються за допомогою операцій над значенням атрибутів і не припускають операцій над відповідними інформаційними фактами (об’єктами).
У свою чергу, екстенціональне відображення знань пов’язане з описом і фіксацією конкретних об’єктів з предметної галузі і реалізоване в операціях, елементами котрих являються об’єкти як цілісні системи.
Описані вище два фундаментальні способи зображення знань дозволяють запропонувати таку класифікацію методів розпізнавання образів (табл. 1.1):
Таблиця 1.1 Класифікація методів розпізнавання
Класифікація методів розпізнавання | Область застосування | Обмеження (недоліки) | ||
Методи розпізнавання | Інтенсіональні методи | Методи, основані на оцінках плотності розподілу значень ознак (або подібність і розбіжність об’єктів) | Задачі з відомим розподілом , як правило нормальним, необхідна наявність великої кількості статистичних даних | Відсутність ототожнення. Необхідність в переборі всієї навчальної вибірки при розпізнаванні, висока чутливість до непредставницької навчальної вибірки та артефактів. |
Методи, основані на припущеннях про клас вирішальних функцій | Класи повинні бути добре роздільними, система ознак - ортонормованою | Відсутність ототожнення. Повинен бути попередньо відомий вид вирішальної функції. Неможливість врахування нових знань про кореляцію серед ознак | ||
Логічні методи | Задачі невеликої розмірності простору ознак | Відсутність ототожнення. При відборі логічних вирішальних правил (кон’юнкцій) необхідний повний перебір. Висока обчислювальна робота | ||
Лінгвістичні (структурні) методи | Задачі невеликої розмірності простору ознак | Відсутність ототожнення. Задача відновлення(визначення)граматики по певній множині висловлювань (опису об’єктів), являється важкою для формалізації. Невирішеність теоретичних проблем. | ||
Методи порівняння з прототипом | Задачі невеликої розмірності простору ознак | Відсутність ототожнення. Висока залежність результатів класифікації від міри відстані (метрики) | ||
Метод k-найближчих сусідів | Задачі невеликої розмірності по кількості класів та ознак |
Відсутність ототожнення. Висока залежність результатів класифікації від міри відстані (метрики). Необхідність повного перебору навчальної вибірки при розпізнаванні. Трудоємність при обчисленні. | ||
Алгоритм обчислення оцінок (голосування) АОО | Задачі невеликої розмірності по кількості класів та ознак | Відсутність ототожнення. Залежність результатів класифікації від міри відстані (метрики). Необхідність повного перебору навчальної вибірки при розпізнаванні. Висока технічна складність методу. | ||
Колективи вирішальних правил | Задачі невеликої розмірності по кількості класів та ознак | Відсутність ототожнення. Висока технічна складність методу,невирішеність ряду теоретичних проблем, як при виділенні області компетенції часткових методів, так і самих часткових методах |
Аналіз перспективних напрямів розвитку методів розпізнавання показує, що для успішного досягнення мети дослідження необхідно вирішити (або обійти) такі проблеми:
1) комбінаторного вибуху;
2) досягнення незалежності часу розпізнавання від обсягу навчальної вибірки;
3) корекція зниження розмірності простору ознак без відчутної втрати значимої інформації;
4) досягнення високої валідності результатів аналізу;
1.2 Методи оброблення та розпізнавання рукописних символів
1.2.1 Двовимірне дискретне косинусне перетворення
Надійність розпізнавання значною мірою залежить від якості зображення символів, яке визначається формою символів або стилем написання і способом виконання.
Алгоритм двомірного дискретного косинусного перетворення [4, 5, 7] реалізується наступним виразом:
,
де ,
;
;
ФункціяB = dct 2 ( A ) повертає результат двомірного дискретного косинусного перетворення для матриці А. Матриця В має той же розмір, що і матриця А , і відображає коефіцієнти дискретного косинусного перетворення.
Функція B = dct 2 ( A , m , n ) повертає результат двомірного дискретного косинусного перетворення для матриці А розміром m х n . Якщо розмір матриці А менший, вона доповнюється нульовими елементами до заданого розміру.
МатрицяА може включати елементи класу double або любого класу integer . МатрицяВ має елементі класу double .
1.2.2 Двовимірне зворотнє дискретне косинусне перетворення
Алгоритм зворотного дискретного косинусного перетворення [4, 5, 8] реалізується наступним виразом:
,
де ,
,