logo search
Методичка

Элементы распознавания образов

1. Основные понятия и определения.

Различают две задачи:

- идентификация;

- классификация.

Под идентификацией понимают процесс присвоения объекту одного однозначного названия (узнавание).

Классификация – процесс, заканчивающийся указанием принадлежности объекта к какому-то классу.

В случае , когда каждый класс состоит из одного элемента , то классификация вырождается в идентификацию .

Можно говорить о двух подходах при решении задач классификации : классификация с обучением ; классификация без обучения.

В первом методе при настройке распознающей системы для каждого отличающегося образа задаются примеры и каждому примеру ставится в соответствие метка, указывающая отнесение к тому или иному классу.

Множество этих примеров называют обучающим множеством .

После завершения обучения система должна распознавать и другие входные данные , которые ранее ей не передавались.

Вторую группу можно называть с самообучением , они предполагают отсутствие обучающего множества и количество классов может быть не задано , тогда для настройки распознающей системы в качестве примеров выбираются элементы из множества объектов подлежащих распознаванию . Количество классов может быть определено на примере использования кластерного анализа

В обоих случаях стоит задача определения оптимального набора признаков, характеризующих объекты.

2. Методы анализа зрительной информации (в задачах классификации). Существует 3 класса методов :

  1. методы сопоставления эталонов;

  2. теория принятия решений (статистические методы);

  3. структурные методы (семантические , лингвистические).

В методах первой группы используется набор эталонов, т. е. Представителей каждого класса объектов.

Анализируемые изображения поточечно сравниваются с эталоном. По результатам этого сравнения делается вывод о отнесении объекта к тому или иному классу.

Задача выбора оптимального набора информационных параметров может решаться двумя путями:

  1. выбирается максимально возможный объем параметров , а затем из них исключают наименее информативные .

  2. осуществляется выбор ограниченного количества наиболее информативных параметров.

Первый более конструктивный.

Обычно полезность или информативность рассчитывается по полной вероятностной ошибке параметров при полном исключении параметра .

Рош - полная вероятность ошибки распознавания для исходной совокупности параметров .

Р'ош - полная вероятность ошибки распознавания при исключении данного признака.

  1. РОШ < 0 - отображенный признак полезен , информативен , поскольку его негативное значение увеличивает вероятность ошибки распознавания;

  2. РОШ - О - признак бесполезен ;

  3. РОШ > 0 - признак вреден .

Все признаки оцениваются статистически. Ошибка характеризуется дисперсией (оценки).

Хр

рис. 47 Ошибка характеризуется дисперсией (оценки).