10 gráficos estadísticos para sacar petróleo de tus datos antes de analizar nada – Estadística descriptiva Parte 3

¿Cuántas veces has empezado por buscar en tus apuntes cuál es el test que puedes aplicar? ¿Cuántas veces antes de ver cómo son los datos ya quieres aplicar una técnica de análisis? ¡Espera! Utiliza este listado de gráficos estadísticos y te aseguro que vas a sacar petróleo. Tendrás una información muy interesante antes de analizar tus datos. ¡No los olvides!

Este post es un resumen de los gráficos estadísticos más útiles para visualizar tus datos y ser un poco más feliz al traducir tus datos en información interpretable. He dividido esta lista en dos grandes grupos.

  1. Los gráficos que trabajan con variables numéricas o cuantitativas
  2. Los gráficos que trabajan con variables categóricas o nominales

Recuerda que una variable es una observación de fenómenos reales.

Pueden ser cuantificadas. Numéricas. Como por ejemplo, la altura, el peso, la edad.

O pueden ser nombres, etiquetas… Categóricas. El país, el sexo, fumador o no fumador. Dependiendo de qué variable tengas usaremos un tipo de gráfico u otro. Vamos a ver en este post las herramientas gráficos para estos dos grupos de variables:

## Variables numéricas

Te voy a compartir los gráficos estadísticos más interesantes para variables que expresan cantidad. Las variables numéricas o también llamadas cuantitativas.

# Histograma

El histograma es la herramienta fundamental de la estadística descriptiva. Resume la variable numérica de un modo sencillo y eficaz. Utiliza las famosas tablas de frecuencias.

Es un diagrama de barras. La altura de las barras es la frecuencia. Y cada barra se sitúa en su debida clase. En este post puedes ver una explicación mucho más profunda de esta herramienta y los conceptos de frecuencia y clase.

Otra de las ventajas del histograma es que te permite entender qué es una función de densidad de probabilidad. Es un concepto mucho más abstracto y muy importante. Si quieres saber más te recomiendo este post.

# Boxplot

Otra de las herramientas por excelencia es el boxplot. Esta herramienta te permite visualizar la variable numérica con medidas de dispersión. Se basa en los cuartiles.

Es una herramienta fantástica para comparar distintos grupos. Distintas variables numéricas. En este post te explico un poco más sobre esta herramienta.

# Diagrama de líneas

El gráfico de líneas es realmente sencillo. Un diagrama de frecuencias es un diagrama de líneas, por ejemplo.

Recuerda que un diagrama de frecuencias es un histograma que en lugar de barras utiliza una línea para unir estas barras entre ellas. La línea roja que ves que recorre las alturas de las barras forma el diagrama de frecuencias.

La peculiaridad que tiene es que trabajas con más de una variable. Estás representando en dos dimensiones:

  1. En el eje vertical ‘Y’ sitúas la variable numérica que quieres visualizar
  2. Y en el eje horizontal ‘X’ sitúas una escala. Me explico: los meses del año, días de la semana, etc… Es una escala de tiempo.

Como te decía, si en el eje ‘X’ pones la escala de tiempo de tu tiempo, crearás un gráfico de líneas en el tiempo. Es conocido con el nombre de serie temporal. Representas tu variable numérica en función del tiempo.

Una de las series temporales más famosas y polémicas del del mundo es Hockey stick graph. Este gráfico demuestra en una sola gráfica el calentamiento global de la tierra. El cambio climático.

Puedes ver la evolución de la temperatura media de la tierra desde el año 1000 hasta el año 2000. La temperatura de hace siglos se ha extraído del estudio de un tipo de árboles milenarios.

Fuente: wikipedia Hockey stick graph

Si pintas frecuencias en función de las clases obtendrás el diagrama de frecuencias del que te estaba hablando. Fácil.

Este tipo de gráficos es fantástico para comparar diferentes variables en un solo gráfico.

# Scatter

El scatter o nube de puntos también es un gráfico de dos variables. El concepto es el mismo que el anterior. Pero en lugar de unir los puntos con una línea, se dejan los puntos o crucecitas.

Este gráfico es muy útil para intuir cómo se relaciona una variable numérica con otra rápidamente. En la regresión lineal es muy usado para intuir correlaciones o relaciones lineales.

Fuente: wikipedia regresión lineal

Si eres curioso y te mola saber qué pasa cuando tienes 3 variables y las quieres relacionar, también puedes hacer un scatter plot en 3 dimensiones. A veces puede ir bien, pero a los seres humanos nos gusta simplificar y utilizar el papel 🙂

# Matrix plot

Este gráfico se utiliza para graficar 3 o más variables entre sí. Relaciona una variable con las otras en 2D. Mira este ejemplo y lo verás.

El diagrama de puntos son scatters 2D de parejas de variables. Además el matrixplot tiene la peculiaridad de poner el histograma para ver la distribución de la variable numérica. Podrás visualizar también la distribución de un vistazo.

Es muy útil utilizar este tipo de gráficos cuando tienes varias variables numéricas. Puedes intuir muy rápidamente la relación entre variables.

# Mapa de correlaciones

Añado un gráfico muy interesante. Aún no te he contado que es la correlación. Pero el concepto es simple. Es un numerito que te dice cómo depende una variable de manera lineal.

En este caso la dependencia es lineal y la correlación es alta.

Fuente: wikipedia regresión lineal

Una correlación baja sería este ejemplo.

Resultado de imagen de scatterplot

El mapa de correlaciones nos indica en colorines las variables que están más correlacionadas que las otras.

Cuando el color es más cercano a 1, la correlación es más evidente. Ya explicaré más con detenimiento este concepto en otro post.

# Histograma + densidad de probabilidad

Como te he contado, el histograma nos lleva directamente a ver cómo está distribuida la variable numérica.

Una buena práctica es dibujar la variable numérica con la estimación de la densidad de probabilidad. De esta manera puedes saber como se ve la variable numérica.

Si quieres más detalles aquí puedes ver como se puede estimar la densidad de probabilidad.

## Variables categóricas

Las variable categóricas expresan cualidades o etiquetas. Por ejemplo: el país de procedencia, la calidad del vino (bueno, mal, regular), si es fumador o no fumador, si tiene cardiopatía o no…

Te muestro los gráficos más interesantes de las variables categóricas:

# Diagrama de barras

Uno de los gráficos más interesantes es pintar los grupos basados en categorías en forma de barras. Con este ejemplo lo puedes ver muy claro.

Aquí simplemente estás contando el número de girafas, orangutanes y monos que tienes en el zoo. Los grupos o categorías son tres en este caso.

# Diagrama de sectores

Es igual que el ejemplo anterior. Pero se pinta en forma de pastel. Normalmente se expresa en forma de frecuencia relativa. En proporción. En porcentaje. Es muy típico en política. Los que han votado al PSOE, PP , ERC etc…

# Grafico de cotitaziones

Éste es un gráfico también cualitativo expresado en forma de polígono. Es utilizado para vender los resultados de una manera muy interesante. Compara por ejemplo diferentes productos con sus cualidades. O diferentes tratamientos, si es efectivo, caro, etc.

Se trata de graficar teniendo en cuenta las características de lo que quieras comparar: de los distintos métodos, productos, tratamientos, fármacos. 


Y hasta aquí el post sobre un listado de gráficos estadísticos que te pueden ayudar, y mucho, cuando quieras describir los datos. Tanto variables numéricas como variables categóricas.

Si quieres más sobre cómo analizar los datos de forma sencilla y práctica sin liarte con fórmulas y conceptos estadísticos te invito a que veas el training de estadística aplicada gratuito.

1 comentario en “10 gráficos estadísticos para sacar petróleo de tus datos antes de analizar nada – Estadística descriptiva Parte 3”

  1. Felicitaciones por tu excelente material y simplicidad para explicar conceptos complejos…..Muchas Gracias!!!

Los comentarios están cerrados.

Ir arriba