Дипломная работа: Классификация римских цифр на основе нейронных сетей
Структура НС:
1. количество слоев: 4
2. количество нейронов:
а) во входном слое: 63
б) в выходном слое: 9
3. активационная функция
а) во входном слое: линейная
б) в выходном: логистическая
В таблице отражена зависимость минимальной средней ошибки на тренировочном и тестовом наборах и времени обучения от вида функций активации.
Скорость обучения = 0,1; момент = 0,1
Таблица данных
1 скрытый слой | 2 скрытый слой | Min средняя ошибка | Время обучения | |||
Функция активации | Кол-во нейронов | Функция активации | Кол-во нейронов | на тренировочном наборе | на тестовом наборе | |
Гауссова | 24 | компГауссова | 24 | 0,0000013 | 0,0034898 | 02:59 |
Гауссова | 24 | Гауссова | 24 | 0,0000005 | 0,0065507 | 05:21 |
компГауссова | 24 | компГауссова | 24 | 0,0000017 | 0,0037426 | 02:29 |
логистческая | 24 | логистическая | 24 | 0,0000147 | 0,0019549 | 00:38 |
Исходя из таблицы дла данной сети оптимальными будут функции активации Гауссова для 1 слоя и Комплем. Гауссова для 2 слоя.
Вых1 | Вых2 | Вых3 | Вых4 | Вых5 | Вых6 | Вых7 | Вых8 | Вых9 | |
R квадрат | 0,9995 | 0,9995 | 0,9986 | 0,9995 | 0,9983 | 0,9994 | 0,9996 | 0,9977 | 0,9979 |
СКО | 0,007 | 0,008 | 0,013 | 0,007 | 0,012 | 0,007 | 0,006 | 0,014 | 0,015 |
Относ СКО % | 0,690 | 0,760 | 1,258 | 0,692 | 1,230 | 0,746 | 0,620 | 1,429 | 1,512 |
Данная сеть после обучения показывает не очень хорошие обобщающие данные.
Скорость обучения и начальный момент на качество обобщения не влияют.
Сеть Кохонена
Структура НС:
1. кол-во нейронов
a. входной слой: 63
b. выходной слой: 9
2. скорость обучения: 0,5
3. начальные веса: 0,5
4. окрестность: 8
5. эпохи: 500
в таблице отражена зависимость средней количества неиспользованных категорий от пораметров выбора примеров и метрик расстояния.
Параметры выбора примеров | Метрики расстояния | Время обучения | Кол-во неиспозльзованных категорий |
поочередный | евклидова | 00:02 | 1 |
случайный | евклидова | 00:02 | 1 |
поочередный | нормированная | 00:02 | 3 |
случайный | нормированная | 00:02 | 2 |
Данная сеть обладает плохим обобщением.
На данной диаграмме показаны сравнительные данные по времени обучения рассмотренных сетей.
Т.к сеть Кохонена обладает наихудшими обобщением, ее в диаграмму не включаем.
На данной диаграмме показаны сравниваемые нами значения выходных данных обученных сетей.