Letícia Portella
@leportella
@leleportella
leportella.com
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from datetime import date
import pandas as pd
ano2016 = pd.read_csv('./orcamento_estado_2016.csv')
ano2016 = pd.read_csv('./orcamento_estado_2016.csv')
ano2015 = pd.read_csv('./orcamento_estado_2015.csv')
ano2014 = pd.read_csv('./orcamento_estado_2014.csv')
ano2016.head()
ano2016 = pd.read_csv('./orcamento_estado_2016.csv')
ano2015 = pd.read_csv('./orcamento_estado_2015.csv')
ano2014 = pd.read_csv('./orcamento_estado_2014.csv')
orcamento = pd.concat([ano2016, ano2015, ano2014])
meses = []
for item, linha in orcamento.iterrows():
ano = linha['ano']
mes = linha['mes']
data = date(ano, mes, 1)
meses.append(data)
orcamento['data'] = pd.Series(meses).values
orcamento.head()
orcamento = orcamento.sort_values(by='data')
orcamento.drop(['ano', 'mes'], inplace=True, axis=1)
orcamento = orcamento.rename(
columns={
'vl_inicial': 'valor_inicial',
'vl_empenhado': 'valor_empenhado',
'vl_atualizado': 'valor_atualizado',
'vl_liquidado': 'valor_liquidado',
'vl_pago': 'valor_pago',
}
)
N = 11
Média em X = 9,0
Variância em x = 11,0
Média em Y = 7,5
Variância em Y = 4,125
Desvio Padrão = 1,236
Correlação = 0,816
Equação da Reta = 3 + 0,5x
N = 11
Média em X = 9,0
Variância em x = 11,0
Média em Y = 7,5
Variância em Y = 4,125
Desvio Padrão = 1,236
Correlação = 0,816
Equação da
Reta = 3 + 0,5x
fig = plt.figure(figsize=(15, 5), dpi=100)
plt.plot(orcamento['data'], orcamento['valor_liquidado'], 'r')
plt.title('Valor Liquidado - Orçamento do Governo de Alagoas - 2014 a 2016')
plt.ylabel('Gastos em Reais')
colunas = ['valor_inicial', 'valor_empenhado',
'valor_atualizado', 'valor_liquidado',
'valor_pago']
for coluna in colunas:
valor_em_milhoes = []
for item, linha in orcamento.iterrows():
valor_linha = linha[coluna]
valor_em_milhoes.append(valor_linha/10**6)
nome_variavel = '{}_milhoes'.format(coluna)
variavel = pd.Series(valor_em_milhoes)
orcamento[nome_variavel] = variavel.values
Univariadas
Gráficas
Univariadas
Não-Gráficas
Multi-variadas
Gráficas
Multi-variadas
Não-Gráficas
Tendência Central: Média, Mediana, Moda
Tendência de distribuição: variância, desvio padrão e range interquartil
Assimetria e curtose
liquidado_media = orcamento['valor_liquidado_milhoes'].mean()
liquidado_mediana = orcamento['valor_liquidado_milhoes'].median()
liquidado_variancia = orcamento['valor_liquidado_milhoes'].var()
liquidado_desvio_padrao = orcamento['valor_liquidado_milhoes'].std()
Questão ou Problema
Aquisição dos dados
Preparação dos dados
Analisar e explorar o dado
Modelar, prever e responder as perguntas
Visualizar, apresentar e reportar os resultados
Letícia Portella
@leportella
@leleportella
leportella.com