Rayssa Küllian
- Partner / Head of Analytics and Insights (eGenius Founders)
- Instrutora de Big Data (Semantix)
- Mestranda em Ciência da Computação (IME/USP)
- Oito anos de experiência em TI: Unicsul, BASF, ACE Group, Ericsson, IBM Brazil Software Lab., boo-box, Genesys, IBM Watson
- Big Data
- Data Science Inteligência Artificial
- Como entrei nesse universo?
- O que já fiz?
- Carreiras
- O que estudar?
...pelo começo?
Começar...
volume
velocidade
variedade
VOLUME
1.44 MB
3 TB
Petabyte, Exabyte, Zettabyte, Yottabyte, Xenottabyte, Shilentnobyte, DOMEGEMEGROTTEBYTE(!)...
YEAR CAPACITY (GB) GB COST (USD)
1997 2.1 $157
2004 200 $1.05
2014 3.000 $0.036
VELOCIDADE
92% DOS DADOS
foram criados nos DOIS últimos anos
VARIEDADE
?
- Apache Foundation
- Open Source
- Armazenamento e processamento distribuído
- Maiores colaboradores: Facebook, Yahoo, Google
-
-
-
-
?
- Cookies
- Flash cookies
- Web Beacon
-
-
-
...pelo começo?
Começar...
"Automatização de atividades que associamos ao pensamento humano, como a tomada de decisões, a resolução de problemas, o aprendizado..."
- Bellman, 1978
-
- Gestação: 1943-1955
Macculloch, Pitts, Turing ("Computing Machinery and Intelligence")
- Nascimento: 1956
McCarthy, Minsky, Shannon e Rochester
- Indústria: 1980
Digital Equipment Corporation, Du Pont
+
Machine Learning
Natural Language
Processing
A habilidade de um computador em interpretar linguagem natural
- Chatbot
- Correção gramatical
- Tradução automática
- Análise de personalidades
- Autenticação pela escrita
- Análise de sentimentos
- Detecção de spam
I
eat
pizza
with
a
fork
.
noun phrase
NOUN
PREPOSITION
NOUN
VERB
SUBJECT
OBJECT
NLTK (Natural Language Toolkit)
"Campo de estudo que dá ao computador a habilidade de aprender sem ser explicitamente programado."
- Arthur Samuel, 1959
-
supervisionado
não-supervisionado
aprendizado indutivo
por reforço
supervisionado
classificação
regressão
não-supervisionado
agrupamento
sumarização
associação
- Predição de taxas de cura de pacientes com diferenças doenças
- Detecção de fraudes em cartões de crédito
- Sugestões de produtos similares em eCommerce
- Validação de autenticidade de reviews na Amazon
- Predição de revoltas populares
- Observatório da Dengue (UFMG)
IBM Bluemix
- Big Data Consultant
- Hadoop Developer
- Hadoop Administrator
- Data Analyst
- Data Scientist
- Cloudera Apache HBase
- Cloudera Search com Apache Solr
- Cloudera Developer for Apache Hadoop
- Cloudera Data Analytics with Hive, Pig and Impala
- Cloudera Administrator for Apache Hadoop
- Cloudera Developer for Apache Spark
- Machine Learning (Stanford)
- Natural Language Processing (Stanford)
Rayssa Küllian
contato@rayssak.com.br
g+,