MACHINE LEARNING WORKFLOW

Defining steps for practical machine learning

@cristianossd

$ whoami

Software Engineer @ Jusbrasil

Machine Learning enthusiast

WHY?

CONJUNTO DE DADOS

IMPACTO DA EXPERIÊNCIA DE TREINAMENTO

EXPERIÊNCIA DIRETA

EXPERIÊNCIA INDIRETA

REPRESENTATIVIDADE

TAREFAS DE APRENDIZADO

- Preditivas

- Descritivas

PRÉ

PROCESSAMENTO

NEM SEMPRE É POSSÍVEL UTILIZAR AS TÉCNICAS DE AM DIRETAMENTE

DATASET

ID

52383

95384

AGE

34

21

HAIR

 

curly

straight

DATASET

ID

52383

95384

AGE

34

21

HAIR

 

curly

straight

DATASET

ID

52383

95384

AGE

34

21

HAIR

 

curly

straight

COLETAR

LIMPAR

INTEGRAR

ESCOLHA DE ATRIBUTOS
(OU DESCARTE)

ESCOLHA DE ATRIBUTOS
(OU DESCARTE)

ATRIBUTO NÃO SE APLICA A TODAS INSTÂNCIAS

ESCOLHA DE ATRIBUTOS
(OU DESCARTE)

ATRIBUTO DEPENDENTE DE OUTRO

ESCOLHA DE ATRIBUTOS
(OU DESCARTE)

ATRIBUTO IRRELEVANTE

RUÍDO

RUÍDO

INSTÂNCIAS DUPLICADAS

RUÍDO

VALORES INCONSISTENTES

RUÍDO

VALORES AUSENTES

RUÍDO

OUTLIERS

TRANSFORMAÇÃO

DE DADOS

EXPLORE SEUS

DADOS

ML

ESTATÍSTICA

ALGORITMOS

ALGORITMOS

CLASSIFICAÇÃO

REGRESSÃO

AGRUPAMENTO

LINEAR REGRESSION

LOGISTIC REGRESSION

DECISION TREE

SUPPORT VECTOR MACHINE

NAIVE BAYES

kNN (k-Nearest Neighbors)

K-MEANS

NEURAL NETWORKS

VALIDAÇÃO

WHY?

MÉTRICAS DE ERRO

MÉTRICAS DE ERRO

AMOSTRAGEM

- RESSUBSTITUIÇÃO

- VALIDAÇÃO SIMPLES (HOLDOUT)

- AMOSTRAGEM ALEATÓRIA

- VALIDAÇÃO CRUZADA (R-FOLD)

- VALIDAÇÃO CRUZADA ESTRATIFICADA

- LEAVE ONE OUT

MATRIZ DE CONFUSÃO

Imagens:

Agence Producteurs Locaux Damien Kühn on Unsplash
Sonny Ravesteijn on Unsplash
Oliver Hale on Unsplash
Marten Newhall on Unsplash
Connor Moynihan on Unsplash
Roman Kraft on Unsplash
Shane Albuquerque on Unsplash
Joseph Chan on Unsplash
Makarios Tang on Unsplash
Glenn Carstens-Peters on Unsplash

@cristianossd

MACHINE LEARNING WORKFLOW

By cristianossd

MACHINE LEARNING WORKFLOW

  • 490