leportella.com
leportella
leleportella
Relatórios
Análises Exploratórias
Aprendizado de Máquina
Inteligência Artificial
Big Data
Deep Learning
Processamento Natural de Linguagem
Modelagens preditivas
Análises Estatísticas
Data Science looks to create models that capture the underlying patterns of complex systems, and codify those models into working applications.
Big Data looks to collect and manage large amounts of varied data to serve large scale web applications and vast sensor networks.
Grande comunidade
Jupyter Notebook
É fácil de aprender
Escalável
Muitas bibliotecas de visualização
Multi-propósito
Você é cientista num Hospital
Registro de 569 pacientes
Informações sobre o tamanho do tumor, raio, textura, perímetro, área, simetria...
Informação se era benigno ou maligno
HIPÓTESE:
Eu consigo prever novos casos baseados nos informações sobre o cisto?
Variáveis Independentes (X)
Y
X
y
X_test
X_train
y_test
y_train
Modelo
y_pred
X_test
y_pred
import pandas as pd
import numpy as np
from sklearn.datasets import load_breast_cancer as array_set
from sklearn.linear_model import LogisticRegression
from sklearn.metrics import f1_score, classification_report
from sklearn.model_selection import train_test_split
data = array_set()
X = pd.DataFrame(data.data, columns=data.feature_names,
dtype=np.float)
y = pd.DataFrame(data.target, columns=['y'], dtype=bool)
X_train, X_test, y_train, y_test = train_test_split(X,
y,
test_size=0.3,
random_state=42)
X
y
X_test
X_train
y_test
y_train
Model = LogisticRegression()
Model.fit(X_train, y_train)
X_train
y_train
Modelo
y_pred = Model.predict(X_test)
Modelo
y_pred
X_test
score = classification_report(y_test, y_pred)
X_test
y_test
Modelo
y_pred
X_test
y_pred
Ensino de ciência de dados
Estudos e outras coisinhas mais...
Serenata de Amor
Da oceanografia ao conda-forge
Crawlers e scrapers
Chatbots
Ética, leis e segurança de dados
Data Storytelling
leleportella
leportella
leportella.com