Magdalena Wójcik
Jestem doktorantką na Wydziałe Matematyki, Informatyki, Mechaniki Uniwersytetu Warszawskiego. Specjalizuję się w uczeniu maszynowym. Lubię też uczyć ludzi, ostatnio programowania w Pythonie. Prowadzę consulting projektów z zakresu Data Science.
Obecnie pracuję nad aplikacją wspomagającą wykrywanie zmiany fazy w Chorobie Afektywnej Dwubiegunowej. Podstawą są dane o cechach fizycznych głosu pacjentów, zbierane podczas rozmów telefonicznych.
Dział sztucznej inteligencji, w którym do tworzenia algorytmów używa się wcześniej oznaczonych danych.
Klasyczny przykład:
Kiedy grać w tenisa?
Żródło: "Machine Learning", Tom Mitchell
Żródło: "Plotting trees from Random Forest models with ggraph", shiring.github.io
Co chcemy osiągnąć? Jak? Dlaczego?
Co będzie odpowiedzią z algorytmu?
Na podstawie jakich danych nauczymy algorytm?
Jakie informacje możemy zbierać?
Jak sprawdzimy czy działa?
Czy zbierane informacje są poprawne?
Czy reprezentują wszystkie przypadki?
Czy oznaczenia nie zawierają błędów lub stronniczości?
Przykładowa miara błędu modelu:
Czy wdrażamy go wszędzie jednocześnie?
Czy jest potrzebny okres przejściowy?
Czy wszyscy rozumieją jak działa i co ma osiągnąć?
Czy nowe przypadki są podobne do tych
ze zbioru uczącego?
Czy model daje zbalansowane odpowiedzi?
Jak zmieniły się dane od czasu,
kiedy uczyliśmy algorytm?
"Broń matematycznej zagłady"
Cathy O'Neil