# criando um vetor com os máximos [coluna a coluna]
maximos = apply(data,2,max)
# criando um vetor com os mínimos [coluna a coluna]
minimos = apply(data,2,min) # repetir o mesmo para mean, median,...
std = apply(data[,1:7],2,sd) # desvio calculado somente pras colunas numéricas [1:7]
# gerando os percentis
percentis = quantile(data$age, c(.10, .25,.50,.75, .90)) # 10, 25, 50, 75 e 90% [10% == 0.1]
distancia = percentis[4] - percentis[2] # percentis[4] == 75%; percentis[2] == 25%
# Gráficos
# 1. Histograma
hist(data$npreg,breaks = 15,xlab = "Number of Pregnancies",
ylab = "Occurencies", main = "Distribution of pregnancies in PIMA.tr database",col = 'blue')
# 2. Scatterplot
plot(data$age,data$npreg,xlab = "Idade (anos)",ylab = "Número de gestações",
main="Relação entre a idade e o número de gestações",col="red")