Profissão Cientista de Dados

24/10/2018          Salvador - Bahia

Organizado por

PATROCINADORES

roberto@perezcarreiro.com

espectativas SOBRE a CIÊNCIA DE DADOS

Think Like a Data Scientist: Tackle the data science process step-by-step, by Brian Godsey

HABILIDADES

...

CIENTISTA DE DADOS... CONHECIMENTOS VOCÊ PRECISA

um CIENTISTA DE DADOS é multidisciplinar!

 

A TENDÊNCIA É QUE com o tempo MIGRE PARA ATIVIDADES DE Governança+

Conhecimento do Domínio

COMUNICAÇÃO

apresentação

Adaptado de Brendan Tierney, 2012

questionador

estratégia do negócio

análise do negócio

solução de problemas

CIENTISTA DE DADOS

ANALISTA DE DADOS

analista de big data

combinam estatística, matemática, programação e conhecimento específico do domínio para resolução de problemas com capacidade de gerar novas  hipóteses e  descobertas a partir dos dados (insights). Processo iterativo limpeza, preparação, organização e enriquecimento dos dados brutos

examina dados brutos com o objetivo de encontrar padrões e tirar conclusões aplicando um processo algoritmo ou mecânico. reside no processo de derivar conclusões que são conhecidas pelo pesquisador (Inferência). Por exemplo, procurar correlações significativas em um conjunto de dados (refuta teorias ou modelos existentes)

prover soluções inovadoras e econômicas que permita processar um grande volume de dados, gerado com alta velocidade e variedade, seja estruturado, semi-estruturado ou não-estruturado, utilizando ambientes computacionais complexos e de alto desempenho. contribui com insights para a tomada de melhores decisões para o negócio

VS

VS

CIENTISTA DE DADOS

ANALISTA DE DADOS

analista de big data

VS

VS

Fonte: https://www.lovemondays.com.br

Cientista de Dados

analista de dados

estatístico

analista de negócios

ciência de dados

arquiteto de dados

engenheiro de dados

analista de big data

matématica

BIOMÉDICO

bioinformata

KDD - knowledge-discovery in databases

extração de conhecimento

1

2

3

4

5

Processo Iterativo

Enquadrar o problema

Entender os dados

Extrair as características

Modelar e Analisar

Apresentar os resultados

Disponbilizar o código

ROteiro para ciência de dados

fluxo DE     TRABALHO DE UM CIENTISTA DE DADOS

Busca: Cientista de Dados

Local: Brasil

Encontradas: 43 vagas

Busca: Cientista de Dados

Local: Brasil

Encontradas: 43 vagas

Busca: Cientista de Dados

Local: Brasil

Encontradas: 37 vagas

ferramentas de trabalho

biologia de alto rendimento

High throughput Biology 

IMPLICAÇÕES NA ESTRUTURA COMPUTACIONAL UTILIZADA PELO CIENTISTA DE DADOS (BIOINFORMATA) 

avanços no campo da biologia molecular, juntamente com os avanços nas tecnologias OMICAS  - Next Generation Sequencing (NGS)

um crescimento exponencial na geração de informação biológica por pesquisadores e outros profissionais

dilúvio de informações OMICAS

esse dilúvio de dados ÔMICoS levA ao cientista de dados (bioinformata) a dimensionar os recursos computacionais para que possa atender as suas demandas

computador

servidor

cluster

supercomputador

nuvem

infraestrutura como serviço

Características principais do segundo supercomputador mais potente da américa latina  - SENAI Cimatec / BA

A atuação esta direcionada para abordagens do uso de dados genômicos (proteômica, análise metabolômica, exames genéticos, biologia e medicina molecular etc.) dos indivíduos e das doenças (e suas causas), sendo a terapia com drogas (farmacogenética), ou outra abordagem clinica, diferenciada para grupos de indivíduos, incluindo a intervenção precoce para prevenção. Neste contexto, marcadores são buscados e pautados com base em prognósticos esperados para uma abordagem direcionada para um individuo. Contudo, uma visão mais ampla inclui dados clínicos (ex. imagens), ambientais e outros que enriquecem o conhecimento sobre ativação e desativação dos genes, ou seja, para entender a dinâmica da variação fenotípica (epígenômica) frente a genômica funcional. 

bioinformática

modelagem computacional

informatica médica

Ciclo de Vida de Dados de Pesquisa

CARACTERÍSTICAS do cientista de dados

- Habilidade Técnica

- Conhecimento do Negócio

- Curiosidade

- Comunicação e Capacidade de Apresentação

- Criatividade

desenvolvimento de produtos

importante conhecer

áreas do negócio

dados não estruturados

dados estruturados

aprendizado de máquinas

big data e dados distribuídos

otimização

modelos gráficos

algoritmos

simulações

estatística temporal

estatística espacial

manipulação de dados

estatística clássica

Programação front-end e back-end

estatística / matemática

necessário profundo conhecimento em pelo menos

uma das áreas

aprendizado de máquinas

armazenamento / processamento de big data

negócio

aprenda fazendo

dicas

aprenda a comunicar seus insights

Aprenda com outros pares da comunidade

tenha uma relação de amor com os dados

trabalhe em grupo e colaborativamente

se desafie aumentando o grau de dificuldade todo tempo

aprender a trabalhar com incertezas

aplicar o método científico nos processos

Fonte: PR Newswire, May 16, 2017

Os BIOMÉDICOS

podem ser cientistas de dados?

Obrigado!

“Que a Força esteja com você(s)"

I Workshop de Bioinformática - UNIFACS

By Roberto Carreiro

I Workshop de Bioinformática - UNIFACS

I Workshop de Bioinformática, é um evento apoiado pelo Diretório Acadêmico de Biomedicina (DABIOMED) que ocorrerá no dia 24 de Outubro de 2018 às 13hrs, na Universidade Salvador (UNIFACS), no campus Professor Barros, Auditório do 7º Andar. Este evento é destinado a toda população estudantil (da instituição e público externo), assim como, os demais profissionais.

  • 506