\(a(x_i)-y_i\)
\(MAE\)
Больше настраивается на выбросы. Оптимальный прогноз - среднее
Недифференцируема - сложнее минимизировать. Оптимальный прогноз - медиана
Оптимальный прогноз - квантиль \(\tau\)
Огромный недостаток:
Пусть \(q_0\) - доля самого крупного класса, тогда:
\(accuracy \in [q_0, 1]\)
y = True | y = False | |
---|---|---|
a(x) = True | True Positive (TP) | False Positive (FP) |
a(x) = False | False Negative (FN) | True Negative (TN) |
Accuracy
\(\large accuracy = \frac{TP + TN}{TP + TN + FP + FN}\)
Precision и recall
\(\large precision = \frac{TP}{TP + FP}\)
\(\large recall = \frac{TP}{TP + FN}\)
F-мера
F = \(\frac{2*precision*recall}{precision+recall}\)
F\(_\beta = (1+{\beta}^2)\frac{2*precision*recall}{\beta^2precision+recall}\)
Кредитный скоринг:
Медицинская диагностика:
Что есть что?
\(precision\): какова вероятность того, что предсказание
\(a(x) = 1\) - точное?
\(recall\): какую долю истинно положительных объектов находит алгоритм?
\(a(x) = [b(x) > t] \), \(b(x)\) - оценка принадлежности классу +1
b(x) | 0.14 | 0.23 | 0.39 | 0.52 | 0.73 | 0.90 |
---|---|---|---|---|---|---|
y | 0 | 1 | 0 | 0 | 1 | 1 |
b(x) | 0.14 | 0.23 | 0.39 | 0.52 | 0.73 | 0.90 |
---|---|---|---|---|---|---|
y | 0 | 1 | 0 | 0 | 1 | 1 |
ROC AUC:
PRC AUC:
Пример
50 000 объектов класса 0
100 объектов класса 1
950 000 объектов класса 0
порог отнесения к классу 1
\(a(x) = 1\) - 50095 объектов
\(FP = 50000, TP = 95\)
\(TPR = 0.95, FPR = 0.05\)
\(precision = 0.0019, recall = 0.95\)
\(b(x) = 0\)
\(b(x) = 1\)
Минимум функции - частные производные равны нулю
Проблема локальных минимумов