Portfólio de cursos
Nanocursos: como funcionam?
Nanocursos são mini cursos, com no máximo 10 horas-aula, com duração de 1 dia. Todos os módulos tem início, meio e fim e a ideia é que o aluno saia entendendo os principais pontos de um determinado assunto. Em linhas gerais, os nanocursos são compostos por uma parte teórica, estudos de caso e exercícios aplicados.
Neste mundo de big data e data science em que uma quantidade grande de conhecimento é produzida e destruída a todo momento, cursos de curtíssima duração ajudam aos alunos e as empresas a acelerarem seus processos de decisão, ficando mais fácil decidir quais são os melhores caminhos a se seguir.
Cultura data-driven
A ciência de dados tornou-se parte integrante de muitos projetos e negócios modernos, com um número crescente de decisões agora baseadas na análise de dados;
A ciência de dados é uma disciplina incrivelmente ampla e complexa, uma interceptação da ciência da computação, matemática e estatística, e um domínio de conhecimento que requer o entendimento da fonte de dados: médicos, financeiros, web e outros domínios;
A família de cursos que será apresentada a seguir condensa os principais conceitos e técnicas da ciência de dados que revolucionaram o cenário de negócios e se tornaram essenciais para a tomada de decisões benéficas baseadas em dados;
Cultura data-driven
Os ramos da nossa família de cursos estão agrupados de uma maneira particular. Primeiro, existem duas seções de conhecimento básico sobre as quais são construídos quaisquer projetos de ciência de dados, a saber, matemática e estatística e linguagens de programação;
Como estamos falando sobre a ciência que é baseada nos dados, é evidente que um dos conhecimentos fundamentais aqui é a matemática. Cada algoritmo de aprendizado de máquina é baseado em fundamentos matemáticos, e é necessário entender os fundamentos da álgebra linear, teoria da probabilidade e estatística clássica;
Avançando, todos esses enormes cálculos e implementação de diferentes algoritmos e soluções de tarefas de ciência de dados são realizados exatamente usando várias linguagens de programação;
Cultura data-driven
A segunda vertente está diretamente relacionada à esfera da ciência de dados. É um conceito amplo, que combina três áreas muito grandes: robótica, aprendizado de máquina e aprendizado por reforço com uma ramificação adicional dessas áreas. Além disso, criamos um módulo para Análise de Séries Temporais, ramo que tem crescido muito ao longo do últimos anos;
A terceira vertente, abrange as áreas de suporte da ciência de dados: armazenamento de dados, engenharia de dados, big data, análise de dados, visualização e BI (Business Intelligence). Eles ajudam a limpar, processar, transformar e representar dados e analisá-los de diferentes aspectos, de forma a complementar as diferentes tarefas de aprendizado de máquina;
Por fim, há um módulo de Business Analytics direcionados para a formação executiva.
Família de cursos
Business analytics
Matemática e Estatística
Data storages
Data streaming e Big data
Machine learning e Reinforcement learning
Robótica
Linguagem de programação
Data engineering
Data visualization e BI
Análise de séries temporais
Algebra linear
- Vectors and spaces;
- Linear combinations and spans
- Linear dependence and independence
- Subspaces and the basis for a subspace
- Alternate coordinate systems (bases)
- Estatística Descritiva
- Introdução à Probabilidade
- Variáveis Aleatórias
- Inferência - Introdução
- Inferência – Estimação
- Inferência – Testes de hipóteses
- Modelos de regressão linear
- Modelos de regressão logística
Estatística
Matemática e Estatística
(*) os cursos podem ser ministrados em R e Python
- Estruturas de vizinhanças
- Processos pontuais espaciais
- Dados de área
- Geoestatística
Estatística Espacial
Estatística espacial
- Visão Geral
- Sistema de Informações Geográficas (GIS)
- O R como uma ferramenta para análise de dados espaciais
- Representação em mapas do espaço de interesse e do fenômeno estudado com o R
- Tipos de dados espaciais
- Estruturas de vizinhanças
- Construindo e visualizando estruturas de vizinhança com o R
- Processos pontuais espaciais
- Visualização e análise exploratória
- Medidas para a identificação de dependência espacial
- Estimação dos efeitos de primeira e segunda ordem
- Processo de Poisson
- Dados de área
- Visualização e análise exploratória
- Índice de Moran
- Principais modelos: CAR e SAR
- Geoestatística
- Visualização e análise exploratória
- Interpolação espacial
Linguagem de programação
Python
- Introdução ao Python (parte 1)
- Introdução ao Python (parte 2)
- Pandas
- Matplotlib
- Numpy
- scikit-learn
R
- Introdução ao R (parte 1)
- Introdução ao R (parte 2)
- ggplot2
- Tidyverse
Matlab, Octave, Scala
- Introdução ao Matlab
- Introdução ao Octave
Outros
- Eviews
- SPSS
- Minitab
- Emblem
- LUA
Visualização de dados e Relatórios dinâmicos
-
Data visualization
-
gráfico de pontos ou dispersão;matriz de correlação; pirâmide etária; gráfico de barras; histograma; boxplot; gráfico de pizza, de rosca e diagrama de venn; grafos; treemap; nuvem de palavras; gráfico de séries temporais
-
- Documentos dinâmicos
- escrevendo em markdown
- mesclando texto com códigos em R (chunks)
- algumas opções de personalização no preâmbulo
- tipos de documentos: word, html, pdf
- flexdashboard
- publicando na web
- Aplicativos em Shiny
- como criar um aplicativo básico
- estrutura de um aplicativo Shiny
- inputs e outputs
- ler base dados locais
- adicionando imagens e documentos
- personalização (abas, divisões, temas, menus)
- publicando na webPontos
Introdução ao R
-
Conceitos básicos e a filosofia do R
-
Conhecendo o Ambiente (R e RStudio)
-
Diferentes tipos de variáveis
-
Objetos (Vetor, Data Frames, Matriz)
-
Trabalhando com listas
-
Estrutura de condição: If, else e ifelse
-
Estrutura de Repetição
-
Funções
-
Leitura\exportação arquivos (.xlsx,.csv,.txt entre outros)
Introdução ao Python
-
Por que programar?
-
Hardware Overview
-
Python as a Language
-
Instalando o Python e escrevendo um programa
-
Escrevendo Parágrafos do Código
-
Variáveis e Expressões
Usando o Python para acessar dados da web
-
Expressões regulares
-
Extraindo Dados
-
Tecnologia em Rede
-
Protocolo de transferência de hipertexto (HTTP)
-
Exemplo
-
Usando o console do desenvolvedor para explorar HTTP
-
Caracteres Unicode e Strings
-
Recuperando Páginas da Web
-
Analisando páginas da Web
Trabalhando bases de dados com o Python
-
Caracteres Unicode e Strings
-
Definições e Terminologia Orientada a Objeto
-
Ciclo de Vida do Objeto
-
Herança de Objeto
-
Bancos de dados relacionais
-
Usando bancos de dados
-
Single Table CRUD
-
Criando um modelo de dados
-
Representando um modelo de dados em tabelas
-
Inserindo Dados Relacionais
-
Reconstruindo dados com o JOIN
-
Many-to-Many Relationships
Robótica: Dinâmica e Controle
- A dinâmica dos braços robóticos, robôs móveis e quadrotores;
- Controle de posição e força para robôs;
- Como gerar trajetórias complexas;
- Noções básicas de espaços de configuração para sistemas robóticos;
- Síntese e estabilidade do controlador
Robótica: Engenharia de Locomoção
- Projeto e a análise de sistemas sensório-motores ágeis e bioinspirados;
- Como desenvolver modelos simplificados de sistemas dinâmicos complexos;
- Formas de utilizar modelos simplificados para alcançar tarefas de mobilidade dinâmica
Robótica: Inteligência de Visão e Aprendizado de Máquina
- Fourier Transforms, Image Convolution, Edge Detection;
- Feature Detection: Filters, SIFT, HOG;
- Geometrical Transformation, Affine, Protective and Ransac;
- Image Morphing
- Probability and Statistics, Regression and Classification;
- SVM and Object Recognition;
- Convolutional Neural Network
Robótica
Supervised learning
- Regression (Ridge, Lasso, KNN)
- Regression (SVM, Randon forest regression, Gradient boosting)
- Classification (Decision trees, Randon forest, KNN)
- Classification (Naive bayes, Logistic)
- Clustering (Kmeans, Spectral clustering)
- Anomaly detection
- Dimensionality reduction (PCA, Factorization matrix)
Deep learning
- Recurrent neural networks (LSTM, GRU, Hopfiel network)
- Convulotional neural networks
Outros
- Artificial neural networks (bachpropagation, perceptron)
- Reinforcement learning (Mont carlo, Q-learning)
- Natural language processing (sentment analysis, speech recognition, text-to-speech)
Machine learning
Unsupervised learning
(*) os cursos podem ser ministrados em R e Python
Redes Neurais e Aplicações
- RNA (Histórico, Conceitos iniciais)
- Histórico das redes neurais artificiais
- Estrutura do neurônio artificial
- Perceptron
- O problema do OU-Exclusivo
- RNA
- Multilayer Perceptron com Backpropagation
- Exemplos práticos: classificação e previsão de
séries temporais com RNAs
- Self Organizing Maps (SOMs)
- Conceitos
- Redes de Kohonen
- Exemplo prático: redes de Kohonen na segmentação de clientes
- Deep Learning
- Conceitos
- Keras
- Tensorflow
- Exemplo prático: identificação de algarismos
escritos a mão usando o MNIST dataset.
Machine learning - primeiros passos
-
Introdução
-
Exemplos de utilização de Machine Learning
-
Por que estimar?
-
Como estimar
-
Trade-off precisão-interpretabilidade
-
Diferenças entre aprendizados supervisionado e não supervisionado
-
Trade-Off vício-variância
-
- Regressão Linear
- Representação do modelo e função custo
- Como estimar os coeficientes
- Gradient Descent
- Classificação
- Regressão Logística
- Métodos de Reamostragem
- Cross-Validation
- Regularização
- Shrinkage Methods (Ridge Regression e Lasso)
- Problemas da dimensionalidade
- Métodos de redução da dimensionalidade
Deep learning com Python
-
Noções básicas de deep learning e redes neurais
-
Comparando modelos de redes neurais com a regressão clássica
-
Forward propagation
-
Otimizando uma rede neural com backward propagation
-
Construindo modelos de deep learning com keras
-
Fine-tuning keras models
Machine learning - parte 2
-
Métodos Baseados em Árvores
-
Árvores de decisão
-
Bootstrap Aggregating
-
Random Forests
-
Boosting
-
- Método de aprendizado não supervisionado
- PCA
- K-Means
- Hierarchical Clustering
- Machine Learning com volumes massivos de dados
- Gradient descent at scale
- Aprendizado online
- Paralelização
Predictive Analytics for Business (parte 1)
- Séries Temporais em diferentes frequências;
- Sazonalidade ou Ciclo;
- Função de autocorrelação (ACF);
- Processo Ruído Branco (white noise);
- Intervalo de confiança;
- Valores ajustados e resíduos;
- Acurácia dos modelos de previsão
- Modelos de Holt Winters:
- Modelos (S)ARIMA
- Previsão das vendas de passagens aéreas;
- BETS package e a previsão da produção de bens intermediários;
- Modelos dinâmicos;
- Previsão e estudo das elasticidades da série temporal de venda de sorvete
- Brainstorm Time Series Analysis;
- Previsões automáticas: forecastHybrid
- Prophet: forecasting at scale
- Machine learning + Time series: Regularization and Shrinkage estimators: Ridge regression, LASSO, elastic NET
Análise de séries temporais
Predictive Analytics for Business (parte 2)
Outros
- Modelos econométricos (VAR, SVAR, VEC, SVEC);
- Modelos de machine learning aplicados a séries de tempo;
- Predictive Analytics for Business (parte 4)
Predictive Analytics for Business (parte 3)
Processamento Massivo de Dados: Hadoop & NoSQL
- Fundamentos do Hadoop;
- Business Analytics x Business Intelligence Tradicional;
- Introdução ao Hive;
- Data Lake + Self Service Analytics;
- Ecossistema Hadoop + Spark
- Introdução ao Pig;
- Introdução a NoSQL;
-
Stack ELK
-
ElasticSearch;
-
Kibana;
-
Case: Analise de Dados em Tempo Real
Outros
- Processamento Massivo de Dados: Hadoop & NoSQL (parte 3);
Data streaming e Big data
Processamento Massivo de Dados: Hadoop & NoSQL
Processamento Massivo de Dados: Hadoop & NoSQL (parte1)
- Fundamentos de Hadoop
- Surgimento
- Objetivo
- Arquitetura
- Hadoop 1 X Hadoop 2
- Distribuições
- Ecossistema Hadoop
- Níveis de Maturidade em Análise de Dados
- Business Analytics x Business Intelligence Tradicional
- Hands On sobre Fundamentos
- Hive
- Introdução ao Hive
- Hands On:
- Importar e exportar dados
- Criação de bancos e tabelas
- Operações básicas
- Data Lake
- Objetivo
- Arquiteturas Candidatas
- Data Lake + Self Service Analytics
- RStudio Server
- Notebooks para Big Data
Processamento Massivo de Dados: Hadoop & NoSQL (parte2)
- Spark
- Ecossistema Hadoop + Spark
- Hadoop x Spark
- SparkSQL
- MLlib
- Hands On: Spark com R
- Pig
- Introdução ao Pig
- Arquitetura
- Hands on: (i) Como ler dados (READ); (ii) Como escrever dados (OUTPUT); (iii) Operadores; (iv) Funções
- Introdução a NoSQL
- Conceitos e características
- Teorema de CAP
- Tipos de bancos NoSQL
- Casos de Uso
- Integração com R
- Stack ELK
- Introdução
- Arquitetura
- Logstash
- ElasticSearch
- Kibana
- Case: Analise de Dados em Tempo Real
SQL databases
-
Introdução a Bancos de Dados Estruturados;
-
Diagramas Entidade-Relacionamento
-
SQL
-
Utilização do MySQL;
-
PostgreSQL
-
SQLite
NoSQL databases
- Redis;
- Cassandra;
- MongoDb;
- HBase
Cloud databases
- Google Big table
- Amazon RDS
- Amazon DynamoDB
Cloud storages
- Amazon S3
- Amazon Glacier
Data storages
Search Engines
- Soir
- Elastich search
Data scraping
- Scrapy
- Selenium
Outros
- Data ingestion
- data cleaning
Data engineering
Programming languages based
- Tableau
- SAS Visual Analytics
- Excel
- R e Shiny
- Python (matplotlib, Plotly, Seaborn)
JavaScript based
- Chart.js
- Timeline.js
- Highcharts
- Google maps API
- Mapbox
BI
- Klipfolio
- Tableau
- PowerBI
- Qlik
- Google data studio
Data visualization + BI
Data Science for Managers
- Novas (mas nem tanto) tecnologias
-
4ª Revolução Industrial
-
Economia de dados
-
O que é Big Data e Data Science?
-
Qual o real ritmo da mudança?
-
DSML and AI projects - Pitfalls you must avoid!!
-
Cases Reais de Big Data Analytics
-
Comentários sobre o R e o Python
(*) os cursos podem ser ministrados em R e Python
Business analytics
BA: tendências, desafios e oportunidades
-
Qual é a probabilidade de sua profissão ser automatizada?
-
Big Data Analytics pela ótica de negócios: (i) O que é Business Analytics? (ii) Como é feito? (iii) Quem está usando? (iv) Desafios e dicas
-
Conceitos de Big Data
-
Big Data, Big problems
Portfólio de cursos MTBr
By Pedro Ferreira
Portfólio de cursos MTBr
- 358