Profissão Cientista de Dados
24/10/2018 Salvador - Bahia
Organizado por
PATROCINADORES
roberto@perezcarreiro.com
espectativas SOBRE a CIÊNCIA DE DADOS
Think Like a Data Scientist: Tackle the data science process step-by-step, by Brian Godsey
HABILIDADES
...
CIENTISTA DE DADOS... CONHECIMENTOS VOCÊ PRECISA
um CIENTISTA DE DADOS é multidisciplinar!
A TENDÊNCIA É QUE com o tempo MIGRE PARA ATIVIDADES DE Governança+
Conhecimento do Domínio
COMUNICAÇÃO
apresentação
Adaptado de Brendan Tierney, 2012
questionador
estratégia do negócio
análise do negócio
solução de problemas
CIENTISTA DE DADOS
ANALISTA DE DADOS
analista de big data
combinam estatística, matemática, programação e conhecimento específico do domínio para resolução de problemas com capacidade de gerar novas hipóteses e descobertas a partir dos dados (insights). Processo iterativo limpeza, preparação, organização e enriquecimento dos dados brutos
examina dados brutos com o objetivo de encontrar padrões e tirar conclusões aplicando um processo algoritmo ou mecânico. reside no processo de derivar conclusões que são conhecidas pelo pesquisador (Inferência). Por exemplo, procurar correlações significativas em um conjunto de dados (refuta teorias ou modelos existentes)
prover soluções inovadoras e econômicas que permita processar um grande volume de dados, gerado com alta velocidade e variedade, seja estruturado, semi-estruturado ou não-estruturado, utilizando ambientes computacionais complexos e de alto desempenho. contribui com insights para a tomada de melhores decisões para o negócio
VS
VS
CIENTISTA DE DADOS
ANALISTA DE DADOS
analista de big data
VS
VS
Fonte: https://www.lovemondays.com.br
Cientista de Dados
analista de dados
estatístico
analista de negócios
ciência de dados
arquiteto de dados
engenheiro de dados
analista de big data
matématica
BIOMÉDICO
bioinformata
KDD - knowledge-discovery in databases
extração de conhecimento
1
2
3
4
5
Processo Iterativo
Enquadrar o problema
Entender os dados
Extrair as características
Modelar e Analisar
Apresentar os resultados
Disponbilizar o código
ROteiro para ciência de dados
fluxo DE TRABALHO DE UM CIENTISTA DE DADOS
Busca: Cientista de Dados
Local: Brasil
Encontradas: 43 vagas
Busca: Cientista de Dados
Local: Brasil
Encontradas: 43 vagas
Busca: Cientista de Dados
Local: Brasil
Encontradas: 37 vagas
ferramentas de trabalho
biologia de alto rendimento
High throughput Biology
IMPLICAÇÕES NA ESTRUTURA COMPUTACIONAL UTILIZADA PELO CIENTISTA DE DADOS (BIOINFORMATA)
avanços no campo da biologia molecular, juntamente com os avanços nas tecnologias OMICAS - Next Generation Sequencing (NGS)
um crescimento exponencial na geração de informação biológica por pesquisadores e outros profissionais
dilúvio de informações OMICAS
esse dilúvio de dados ÔMICoS levA ao cientista de dados (bioinformata) a dimensionar os recursos computacionais para que possa atender as suas demandas
computador
servidor
cluster
supercomputador
nuvem
infraestrutura como serviço
Características principais do segundo supercomputador mais potente da américa latina - SENAI Cimatec / BA
A atuação esta direcionada para abordagens do uso de dados genômicos (proteômica, análise metabolômica, exames genéticos, biologia e medicina molecular etc.) dos indivíduos e das doenças (e suas causas), sendo a terapia com drogas (farmacogenética), ou outra abordagem clinica, diferenciada para grupos de indivíduos, incluindo a intervenção precoce para prevenção. Neste contexto, marcadores são buscados e pautados com base em prognósticos esperados para uma abordagem direcionada para um individuo. Contudo, uma visão mais ampla inclui dados clínicos (ex. imagens), ambientais e outros que enriquecem o conhecimento sobre ativação e desativação dos genes, ou seja, para entender a dinâmica da variação fenotípica (epígenômica) frente a genômica funcional.
bioinformática
modelagem computacional
informatica médica
Ciclo de Vida de Dados de Pesquisa
CARACTERÍSTICAS do cientista de dados
- Habilidade Técnica
- Conhecimento do Negócio
- Curiosidade
- Comunicação e Capacidade de Apresentação
- Criatividade
desenvolvimento de produtos
importante conhecer
áreas do negócio
dados não estruturados
dados estruturados
aprendizado de máquinas
big data e dados distribuídos
otimização
modelos gráficos
algoritmos
simulações
estatística temporal
estatística espacial
manipulação de dados
estatística clássica
Programação front-end e back-end
estatística / matemática
necessário profundo conhecimento em pelo menos
uma das áreas
aprendizado de máquinas
armazenamento / processamento de big data
negócio
aprenda fazendo
dicas
aprenda a comunicar seus insights
Aprenda com outros pares da comunidade
tenha uma relação de amor com os dados
trabalhe em grupo e colaborativamente
se desafie aumentando o grau de dificuldade todo tempo
aprender a trabalhar com incertezas
aplicar o método científico nos processos
Fonte: PR Newswire, May 16, 2017
Os BIOMÉDICOS
podem ser cientistas de dados?
Obrigado!
“Que a Força esteja com você(s)"
I Workshop de Bioinformática - UNIFACS
By Roberto Carreiro
I Workshop de Bioinformática - UNIFACS
I Workshop de Bioinformática, é um evento apoiado pelo Diretório Acadêmico de Biomedicina (DABIOMED) que ocorrerá no dia 24 de Outubro de 2018 às 13hrs, na Universidade Salvador (UNIFACS), no campus Professor Barros, Auditório do 7º Andar. Este evento é destinado a toda população estudantil (da instituição e público externo), assim como, os demais profissionais.
- 506