Visualização de Dados:

 

Polígono de Frequência e Histograma

A estatística tem como principal propósito coletar dados e organizá-los a fim de originar informações. E um dos pilares dessa organização parte da exposição deles num formato que seja de fácil interpretação.

Distribuição de Frequência

  • Frequência é a quantidade de vezes que uma determinada variável
    ocorre.

 

  • Distribuição de Frequência é uma tabela contendo os dados de acordo com sua frequência.

Polígono de Frequência

Um polígono de frequência é um gráfico que se realiza através da união dos pontos mais altos das colunas num histograma de frequência (que utiliza colunas verticais para mostrar as frequências).

Os polígonos de frequência para dados agrupados, por sua vez, constroem-se a partir da marca de classe que coincide com o ponto médio de cada coluna do histograma. Quando são representadas as frequências acumuladas de uma tabela de dados agrupados, obtém-se um histograma de frequências acumuladas, que permite dispor em diagrama o seu polígono correspondente.

Exemplo: um polígono de frequência permite refletir a média das temperaturas máximas de um país num determinado período de tempo. No eixo X (horizontal), pode-se assinalar os meses do ano (Janeiro, Fevereiro, Março, Abril, etc.). No eixo Y (vertical), indica-se a média das temperaturas máximas de cada mês (24º, 25º, 21º…). O polígono de frequência é criado ao unir, com um segmento, a média de todas as temperaturas máximas.

Histograma

Um histograma é uma espécie de gráfico de barras que demonstra uma distribuição de frequências. No histograma, a base de cada uma das barras representa uma classe e a altura representa a quantidade ou frequência absoluta com que o valor de cada classe ocorre. Ao mesmo tempo, ele pode ser utilizado como um indicador de dispersão de processos.

Quando você precisa apresentar ou tirar conclusões de um grande conjunto de dados e está trabalhando com conceitos envolvendo frequências, sejam absolutas ou relativas, o histograma é o melhor caminho a se tomar.

 

Ele nos auxilia com a representação gráfica dos conjuntos de dados de forma mais amigável, tornando mais fácil a visualização de onde a maioria dos valores se concentram.

Resumir grandes conjuntos de dados de forma visual

  • Muitas vezes quando utilizamos tabelas não é tão fácil tirar conclusões. Nós podemos facilitar nosso trabalho e ganhar muito mais tempo e eficiência utilizando um histograma.

Comparar os resultados

  • É possível, com o auxílio do histograma, rapidamente comparar os resultados e, com o auxílio do eixo y, conhecer, se houver, quais colunas ultrapassaram os limites que você precisava ou não.

Comunicar as informações graficamente

  • Tanto as pessoas da sua equipe, quanto os clientes, podem ver facilmente os valores que ocorrem com mais frequência. Quando você usa um histograma para resumir grandes conjuntos de dados ou para comparar resultados você está utilizando uma poderosa ferramenta de comunicação.

Assim que coletamos os dados, o primeiro passo que vamos dar é obter o melhor entendimento deles, já que nosso cérebro pode ter dificuldade para compreender um extenso conjunto de dados de forma automática. Dessa forma, nossa missão é deixar a visualização dos dados mais inteligível e explícita.

É aqui que entra o histograma, pois permitirá a obtenção das seguintes informações sobre o nosso processo:

  • Centralidade: qual é o centro da distribuição? Onde é esperado que esteja a maioria das observações?

 

  • Amplitude: a distribuição normalmente contém observações entre quais valores? Qual é o ponto de máximo e o ponto de mínimo?

 

  • Simetria: será que devemos esperar a mesma frequência de pontos com valor alto e com valor baixo? Será que o processo é simétrico ou valores mais altos são mais raros?

Os histogramas às vezes são confundidos com gráficos de barras. Um histograma é usado para dados contínuos, em que os intervalos de classe representam a extensão dos dados.

 

Já um gráfico de barra é um gráfico de variáveis categóricas ou discretas. Alguns autores recomendam que os gráficos de barras tenham espaços entre os retângulos para esclarecer a diferença.

O objetivo de um histograma é ilustrar como uma determinada amostra de dados ou população está distribuída, dispondo as informações de modo a facilitar a visualização da distribuição dos dados.

 

Ao mesmo tempo, ressalta a localização do valor central e da distribuição dos dados em torno deste valor central.

 

Agora que já vimos o que é um histograma, será que eles serão sempre iguais, de um único tipo?

 

A resposta é não. Temos diferentes tipos de histogramas, e conhecê-los melhor pode fazer com que você ganhe tempo e eficiência na sua análise. Vamos explorar os principais tipos aqui.

Tipos de histograma

Simétrico

Um histograma simétrico (ou unimodal) centraliza os dados na média (medida central) e possui características por meio da distribuição da média e do desvio padrão. Uma característica do histograma simétrico é conter a partir do centro do gráfico o maior número de dados. Em estatística, este modelo é chamado de normal e permite analisar o quanto outros dados se afastam desse modelo.

Distorcido à direita

Um histograma é distorcido à direita quando a distribuição de dados indica a ocorrência de altos valores com baixa frequência. Este modelo também é comumente chamado de modelo com “cauda à direita”, pois ele vai “afinando” conforme percorremos o eixo x, indicando que a frequência vai diminuindo.

Distorcido à esquerda

Dessa vez vamos chamar o histograma de distorcido à esquerda quando a frequência dos dados está concentrada nos altos valores, do lado esquerdo, conforme percorremos o eixo x. Podemos, então, também chamá-lo de histograma com “cauda à esquerda”, pelo mesmo motivo anterior, já que à esquerda formamos uma espécie de cauda devido à baixa frequência dos dados no início. Observa-se que há mais informações acima da média devido a falta de simetria.

Bimodal

Vamos chamar o histograma de bimodal quando há o aparecimento de dois picos. Dessa forma sabemos que em dois momentos diferentes há uma concentração de frequência que se destaca.

Multimodal

Um histograma é multimodal quando há o aparecimento de vários picos. Os picos vão nos indicar o maior número de ocorrências.

 

Platô (Achatado)

Muito tem se falado atualmente do “efeito platô”. Essa palavra, “platô”, nos remete a um certo tipo de achatamento, de igualdade constante dos dados. Um histograma tem o formato Platô quando suas barras têm praticamente as mesmas alturas. Isto ocorre quando existem várias distribuições juntas com médias diferentes.

Referências

  • https://app.powerbi.com/view?r=eyJrIjoiMDQxMDI4NGItYmQ2OC00OGQ3LTlmMDEtYTlmMDhiMmY3MDJjIiwidCI6Ijk2NjdhMjE3LTU5NDYtNGYzNi1iNDhjLWYyMmE3MzA5Njg5MyJ9
  • https://www.alura.com.br/artigos/o-que-e-um-histograma
  • https://conceito.de/poligono-de-frequencia
  • https://community.atlassian.com/t5/DevOps-articles/DevOps-Metrics-are-here-measure-deployment-and-incident-response/ba-p/1339450

 

Polígono e Histograma

By Vitor Emanuel