Функции потерь и вероятности неправильной классификации

Методы классификации следует выбирать исходя из условия минимизации потерь или вероятности неправильной классификации объектов [32].

Для формализации данной задачи введем понятие "функция потерь". Обозначим С(1/т) потери, связанные с ошибочным отнесением объекта m-го класса к классу / (при / = от, очевидно, С(1/т) = 0).

Предположение 6.1. Потери С(1/т) одинаковы для любой пары / и от, т.е.

(6.8)

Пусть в процессе классификации число ошибок составило v(//ot). Тогда потери, связанные с ошибочным отнесением объектов от-го класса к классу /, составляют v(//ot) C(//ot) по всем /, от = 1,2 р.

Общие потери С„ (п – число наблюдений) при такой процедуре классификации составят

Удельная характеристика потерь С при и –> ■" равна

где Д(//от) – вероятность отнесения объект класса от к классу– вероятность извлечения объекта класса от из общей совокупности объектов, или априорная вероятность (удельный вес) класса от.

Здесь предел понимается в смысле сходимости по вероятности относительных частот к соответвующим вероятностям:

Средние потери от неправильной классификации объектов от-го класса равны

(6.9)

Средние удельные потери от неправильной классификации всех анализируемых объектов составят

(6.10)

С учетом предположения (6.8) минимизация средних удельных потерь С эквивалентна вероятности правильной классификации объектов, равной

С учетом соотношения (6.9) выражение (6.10) может быть преобразовано к виду

При этом учитывалось, чтодля любого т. В этом случае при построении процедур классификации часто говорят не о потерях, а о вероятности неправильной классификации объектов

 
< Пред   СОДЕРЖАНИЕ     След >