MACHINE LEARNING WORKFLOW
Defining steps for practical machine learning
@cristianossd
$ whoami
Software Engineer @ Jusbrasil
Machine Learning enthusiast
WHY?
CONJUNTO DE DADOS
IMPACTO DA EXPERIÊNCIA DE TREINAMENTO
EXPERIÊNCIA DIRETA
EXPERIÊNCIA INDIRETA
REPRESENTATIVIDADE
TAREFAS DE APRENDIZADO
- Preditivas
- Descritivas
PRÉ
PROCESSAMENTO
NEM SEMPRE É POSSÍVEL UTILIZAR AS TÉCNICAS DE AM DIRETAMENTE
DATASET
ID
52383
95384
AGE
34
21
HAIR
curly
straight
DATASET
ID
52383
95384
AGE
34
21
HAIR
curly
straight
DATASET
ID
52383
95384
AGE
34
21
HAIR
curly
straight
COLETAR
LIMPAR
INTEGRAR
ESCOLHA DE ATRIBUTOS
(OU DESCARTE)
ESCOLHA DE ATRIBUTOS
(OU DESCARTE)
ATRIBUTO NÃO SE APLICA A TODAS INSTÂNCIAS
ESCOLHA DE ATRIBUTOS
(OU DESCARTE)
ATRIBUTO DEPENDENTE DE OUTRO
ESCOLHA DE ATRIBUTOS
(OU DESCARTE)
ATRIBUTO IRRELEVANTE
RUÍDO
RUÍDO
INSTÂNCIAS DUPLICADAS
RUÍDO
VALORES INCONSISTENTES
RUÍDO
VALORES AUSENTES
RUÍDO
OUTLIERS
TRANSFORMAÇÃO
DE DADOS
EXPLORE SEUS
DADOS
ML
ESTATÍSTICA
ALGORITMOS
ALGORITMOS
CLASSIFICAÇÃO
REGRESSÃO
AGRUPAMENTO
LINEAR REGRESSION
LOGISTIC REGRESSION
DECISION TREE
SUPPORT VECTOR MACHINE
NAIVE BAYES
kNN (k-Nearest Neighbors)
K-MEANS
NEURAL NETWORKS
VALIDAÇÃO
WHY?
MÉTRICAS DE ERRO
MÉTRICAS DE ERRO
AMOSTRAGEM
- RESSUBSTITUIÇÃO
- VALIDAÇÃO SIMPLES (HOLDOUT)
- AMOSTRAGEM ALEATÓRIA
- VALIDAÇÃO CRUZADA (R-FOLD)
- VALIDAÇÃO CRUZADA ESTRATIFICADA
- LEAVE ONE OUT
MATRIZ DE CONFUSÃO
Imagens:
Agence Producteurs Locaux Damien Kühn on Unsplash
Sonny Ravesteijn on Unsplash
Oliver Hale on Unsplash
Marten Newhall on Unsplash
Connor Moynihan on Unsplash
Roman Kraft on Unsplash
Shane Albuquerque on Unsplash
Joseph Chan on Unsplash
Makarios Tang on Unsplash
Glenn Carstens-Peters on Unsplash
@cristianossd
MACHINE LEARNING WORKFLOW
By cristianossd
MACHINE LEARNING WORKFLOW
- 490