Zastosowanie systemów wieloklasyfikatorowych

do diagnozowania białaczki u dzieci

Michał Bieroński

Agenda

  1. Cel pracy
  2. Multiklasyfikatory
  3. Technologie
  4. Metodyka implementacji
  5. Selekcja cech
  6. Klasyfikatory bazowe
  7. Optymalizacja kl. bazowych
  8. Implementowane metody
  9. Co dalej?

Cel pracy

  • Optymalizacja jakości klasyfikacji
  • Uzyskanie zadowalających wyników klasyfikacji
  • Porównanie algorytmów wieloklasyfikatorowych

Multiklasyfikatory

Technologie

Wybrana metodyka - TDD

Metody oceny jakości klasyfikatorów

  • W jakim celu?
  • K-krotna walidacja krzyżowa
  • Dokładność

Selekcja cech

\rho_{X,Y}=\frac{cov(X,Y)}{\sigma_X\sigma_Y}
ρX,Y=cov(X,Y)σXσY\rho_{X,Y}=\frac{cov(X,Y)}{\sigma_X\sigma_Y}

Chi kwadrat? nie za bardzo.

Klasyfikatory bazowe

  • SVC
  • KNN
  • MLP
  • Naiwny Bayes
  • Regresja Liniowa
  • Drzewo decyzyjne

Dobór parametrów klasyfikatorów bazowych

  • GridSearch z wykorzystaniem walidacji krzyżowej
  • Samodzielne badania

przykład MLP

Fuzja decyzji

  • Głosowanie większościowe
  • Głosowanie ważone
  • Głosowanie ważone z uwzględnieniem K-sąsiadów

Fuzja wsparć

  • Kombinatory elementarne
  • Schematy decyzyjne

Selekcja (nie cech!)

  • Statyczna
  • Dynamiczna

Losowy las

  • Wiele drzew
  • Dywersyfikacja
  • Optymalizacje
  • Badania
  • Porównanie metod

Enseble

By bierus

Enseble

  • 277