Machine Learning
The Next Big Thing
Produtos de extremo sucesso
O que eles têm em comum?
Machine Learning.
Rodrigo Araújo
BSc. Computer Science
Pesquisador na TDRT
Engenheiro de Software e Machine Learning na JusBrasil
Mas afinal, o que é Machine Learning?
Definições básicas
Machine Learning é um tipo de Inteligência Artificial que dá aos computadores uma habilidade de aprender algo sem ser explicitamente programado pra isso.
É fazer com que programas cresçam sozinhos e que se modifiquem conforme expostos a novos dados
"Programas que crescem e se modifiquem sozinhos...?"
"Programas que crescem e se modifiquem sozinhos...?"
Machine Learning é uma simplificação do processo de aprendizagem dos humanos
Processo de aprendizagem
Processo de aprendizagem
Carro
Processo de aprendizagem
Carro
Processo de aprendizagem
O que é isso?
Processo de aprendizagem
Reconhecimento de padrões
O que é isso?
Processo de aprendizagem
Reconhecimento de padrões
O que é isso?
Carro
Processo de aprendizagem
Carro
O que é isso?
Processo de aprendizagem
Carro
O que é isso?
Mas o que acontece aqui?
Processo de aprendizagem
Carro
O que é isso?
Bruxaria?
Processo de aprendizagem
Carro
O que é isso?
Machine Learning
Processo de aprendizagem
Machine Learning é uma mudança de paradigma na programação
Paradigma conhecido e tradicional:
Construir um programa para resolver um problema
Paradigma conhecido e tradicional:
Construir um programa para resolver um problema
Paradigma da Machine Learning:
Construir um programa para aprender a resolver um problema
Machine Learning é uma mistura de diversas áreas científicas
Teoria da Informação
Álgebra Linear
Estatística
Probabilidade
...E muito mais...
vs.
Supervised Learning
Unsupervised Learning
Supervised Learning
Supervised Learning
Dados treinados
Supervised Learning
Dados treinados
Algoritmo de aprendizagem
Supervised Learning
Dados treinados
Algoritmo de aprendizagem
Modelo
Supervised Learning
Dados treinados
Algoritmo de aprendizagem
Modelo
Novos dados
Supervised Learning
Dados treinados
Algoritmo de aprendizagem
Modelo
Novos dados
Previsões
Supervised Learning
Tendo dados em mãos, nosso objetivo é achar a função que melhor generalize o problema
Supervised Learning
Temos 2 tipos de problemas aqui
Supervised Learning
Temos 2 tipos de problemas aqui
Classificação
Supervised Learning
Temos 2 tipos de problemas aqui
Classificação
Dada várias classes, prever qual a classe de um próximo dado
Supervised Learning
Temos 2 tipos de problemas aqui
Classificação
Dada várias classes, prever qual a classe de um próximo dado
Ex: Paciente tem câncer ou não?
A pessoa na câmera está sorrindo ou não?
Supervised Learning
Temos 2 tipos de problemas aqui
Classificação
Dada várias classes, prever qual a classe de um próximo dado
Ex: Paciente tem câncer ou não?
A pessoa na câmera está sorrindo ou não?
Previsão/Regressão
Supervised Learning
Temos 2 tipos de problemas aqui
Classificação
Dada várias classes, prever qual a classe de um próximo dado
Ex: Paciente tem câncer ou não?
A pessoa na câmera está sorrindo ou não?
Previsão/Regressão
Prever informações futuras com base em dados passados
Ex: vai chover amanhã? Qual o preço de uma casa com X quartos em um dado local?
Supervised Learning
Iremos resolve-los com a abordagens semelhantes
Supervised Learning
Achando a função que melhor generaliza o problema
Supervised Learning
E quando os dados são mais complicados e uma função linear não resolve mais?
Supervised Learning
polinômio neles!
Supervised Learning
Ok... mas no mundo real... temos mais de 2 variáveis; temos milhares!
Supervised Learning
Ok... mas no mundo real... temos mais de 2 variáveis; temos milhares!
Supervised Learning
Então, começamos a buscar a melhor função no hiperespaço
Supervised Learning
Melhor estratégia: Gradient Descent
Supervised Learning
Melhor estratégia: Gradient Descent
Supervised Learning
O problema de classificação é conceitualmente um pouco diferente
Supervised Learning
O problema de classificação é conceitualmente um pouco diferente
Supervised Learning
Queremos achar a função que melhor divida as classes
Supervised Learning
Queremos achar a função que melhor divida as classes
Supervised Learning
Queremos achar a função que melhor divida as classes
Supervised Learning
Queremos achar a função que melhor divida as classes
Supervised Learning
Mas... e os algoritmos pra achar essas funções que generalizam os problemas e geram os modelos?
Supervised Learning
Mas... e os algoritmos pra achar essas funções que generalizam os problemas e geram os modelos?
Dados treinados
Algoritmo de aprendizagem
Modelo
Supervised Learning
Mas... e os algoritmos pra achar essas funções que generalizam os problemas e geram os modelos?
Dados treinados
Algoritmo de aprendizagem
Modelo
Supervised Learning
Support Vector Machines
Supervised Learning
Decision Tree
Supervised Learning
Random Forest
Supervised Learning
E minha favorita...
Supervised Learning
Redes Neurais Artificiais (ANNs)
Supervised Learning
Redes Neurais Artificiais (ANNs)
Flexíveis
Poderosas
Elegantes
Supervised Learning
Redes Neurais Artificiais (ANNs)
Supervised Learning
Redes Neurais Artificiais (ANNs)
Supervised Learning
Redes Neurais Artificiais (ANNs)
Backpropagation é lindo (e funciona)
Supervised Learning
Redes Neurais Artificiais (ANNs)
Com o passar das épocas de treinamento, a rede neural passa a errar menos
Supervised Learning
Redes Neurais Artificiais (ANNs)
Com o passar das épocas de treinamento, a rede neural passa a errar menos
Supervised Learning
E o que é Deep Learning?
Supervised Learning
Simples. Redes Neurais com mais camadas escondidas
Supervised Learning
Simples. Redes Neurais com mais camadas escondidas
Supervised Learning
Deep Learning
Unsupervised Learning
Unsupervised Learning
E quando não temos aqueles dados treinados previamente para alimentar o algoritmo?
Unsupervised Learning
Dados treinados
Algoritmo de aprendizagem
Modelo
Novos dados
Previsões
Unsupervised Learning
Dados treinados
Algoritmo de aprendizagem
Modelo
Novos dados
Previsões
Unsupervised Learning
Dados treinados
Algoritmo de aprendizagem
Modelo
Novos dados
Previsões
Unsupervised Learning
Solução: Clustering
Unsupervised Learning
Solução: Clustering
Unsupervised Learning
Dificuldades:
Unsupervised Learning
Dificuldades:
Algortimos ainda não estão em estado-da-arte
Unsupervised Learning
Dificuldades:
É difícil calcular precisão do resultado quando não se tem dados passados para comparar
Processo típico de ML supervisionado
Processo típico de ML supervisionado
dataset treinado
Processo típico de ML supervisionado
dataset treinado
Dataset de teste e validação
Dataset de treino
Processo típico de ML supervisionado
dataset treinado
Dataset de teste e validação
Dataset de treino
Algoritmo de aprendizagem escolhido
Processo típico de ML supervisionado
dataset treinado
Dataset de teste e validação
Dataset de treino
Algoritmo de aprendizagem escolhido
Modelo
Processo típico de ML supervisionado
dataset treinado
Dataset de teste e validação
Dataset de treino
Algoritmo de aprendizagem escolhido
Modelo
Processo típico de ML supervisionado
dataset treinado
Dataset de teste e validação
Dataset de treino
Algoritmo de aprendizagem escolhido
Modelo
Validação final do modelo
Caso de uso real
Caso de uso real
Caso de uso real
modelo
Caso de uso real
modelo
Decisão?
Julgamento?
Sentença?
...?
Arquitetura final
Caso de uso real
Golpe final:
Caso de uso real
Golpe final:
Redução de Variância
Caso de uso real
Golpe final:
Redução de Variância
Ganho de informação
Machine Learning: RoadMap
Machine Learning: RoadMap
Por onde começar a estudar Machine Learning?
Machine Learning: RoadMap
Programação
Machine Learning: RoadMap
Programação
Matemática
Álgebra Linear
Estatística
Probabilidade
Teoria da Info
Machine Learning: RoadMap
Programação
Matemática
Álgebra Linear
Estatística
Probabilidade
Teoria da Info
Ops
Spark
Hadoop
Redis
Docker
Machine Learning: RoadMap
Programação
Matemática
Álgebra Linear
Estatística
Probabilidade
Teoria da Info
Ops
Spark
Hadoop
Redis
Docker
Neurociência
Neurociência básica
Learning Process
Processos Cognitivos
Machine Learning: Dicas
Machine Learning: Dicas
Implemente os algoritmos que você esteja estudando, não tenha medo
Machine Learning: Dicas
Abra seu coração para a matemática avançada. Ela é o centro da Machine Learning
Machine Learning: Dicas
Dataset limpo, bem estruturado e GRANDE é um dos maiores segredos da Machine Learning
Machine Learning: Dicas
Dataset limpo, bem estruturado e GRANDE é um dos maiores segredos da Machine Learning
Você irá sofrer muito se pegar Datasets sujos e pequenos
Machine Learning: Dicas
Seus primeiros dias lidando com ML:
Lágrimas irão cair. Acostume-se.
Machine Learning: Dicas
Seus primeiros dias lidando com ML:
Você tentando entender a matemática das Redes Neurais
Machine Learning: Dicas
Seus primeiros dias lidando com ML:
Você finalmente entendendo a matemática das Redes Neurais
Machine Learning: Dicas
Seus primeiros dias lidando com ML:
Você tentando parametrizar um modelo em cima de um dataset ruim
Machine Learning: Dicas
Seus primeiros dias lidando com ML:
Você rodando seu primeiro algoritmo de ML implementado
Machine Learning: Dicas
Seus primeiros dias lidando com ML:
Você finalmente dominando ML e vendo seus programas ficando cada vez mais inteligentes.
Machine Learning: Recursos
Free Datasets: https://archive.ics.uci.edu/ml/datasets.html
Machine Learning: Recursos
Free Datasets: https://archive.ics.uci.edu/ml/datasets.html
SciKit-Learn tutorials: http://scikit-learn.org/stable/tutorial/
Machine Learning: Recursos
Free Datasets: https://archive.ics.uci.edu/ml/datasets.html
SciKit-Learn tutorials: http://scikit-learn.org/stable/tutorial/
Melhor curso do coursera de Machine Learning: https://www.coursera.org/learn/machine-learning
Machine Learning: Recursos
Free Datasets: https://archive.ics.uci.edu/ml/datasets.html
SciKit-Learn tutorials: http://scikit-learn.org/stable/tutorial/
Melhor curso do coursera de Machine Learning: https://www.coursera.org/learn/machine-learning
leia toda essa thread: https://www.quora.com/How-do-I-learn-machine-learning-1
Dúvidas?
Obrigado!
Rodrigo Araújo
@digorithm
www.rodrigoaraujo.me
Machine Learning: The Net Big thing
By Rodrigo Araújo
Machine Learning: The Net Big thing
- 2,026