Pro Statistics Lección 5

Bienvenido al curso Pro Statistics

Puedes acceder a la versión Premium con tutoriales paso a paso, soporte y asesoramiento

Índice >> Lección 1 >> Lección 2 >> Lección 3 >> Lección 4 >> Lección 5 >> Lección 6 >> Lección 7 >> Lección 8 >> Lección 9 >> Lección 10 >> Lección 11 >> Lección 12 >> Lección 13 >>  Tutorial R >> Tutorial Excel >>Tutorial SPSS Errores >> Casos de Éxito >> Opciones para Aprender >> FAQ’s >> Lista de Softwares

Explorando una variable numérica (I)

En esta segunda parte vas a entrar en materia.

Hoy te voy a explicar:

  1. Cómo observar una variable numérica con un histograma y una tabla de frecuencias
  2. Qué es una distribución y el concepto de centralidad y dispersión
  3. Un histograma un poco especial: el histograma de densidad

En esta lección aprenderás muchas cosas nuevas.

Así que poco a poco.

¡A por ello valiente!

Tabla de contenidos# De números a barras: el histograma# Distribución de una variable# Un histograma un poco especial

# De números a barras: el histograma

La primera herramienta que te quiero mostrar es el histograma.

El histograma dibuja la distribución de una variable numérica con barras. ¿ves las barras de la imagen? Esa forma que hacen es la distribución de tu variable numérica.

Cuando dibujas un histograma es parecido a colocar las fichas de un cuatro en raya en la columna correspondiente.

  1. Cada columna le corresponde un rango. Un intervalo de la variable numérica. Son las clases. ¿puedes ver los rangos de edad de la imagen del cuatro en ralla?
  2. Las fichas se colocan en la clase que toca. La altura de las fichas es la altura de las barras del histograma. Son las frecuencias.

Vuelve a mirar la imagen y dale 1 minuto. Observa los números de las fichas y los intervalos de cada columna. ¿Se entiende?

Para dibujar un histograma en dos pasos:

  1. Ordenar la variable numérica por clases con una tabla de frecuencias
  2. Pintar las barras. Las alturas de las barras corresponden a las frecuencias

Sé que te habrás quedado igual con esto último. Así que te he preparado un artículo con mucho cariño para que entiendas el histograma y la tabla de frecuencias.

VER ARTÍCULO

Para complementar la explicación tienes un vídeo explicativo con algún que otro ejemplo:

DESCARGA EL MATERIAL EXTRA

# Distribución de una variable

Un concepto ligado al histograma es la distribución. ¡Es crucial para entender tus variables!

La distribución de una variable numérica es el contorno de un histograma.

¿Puedes reseguir el contorno de las barras con un lápiz verdad? Esta imagen mental que te has creado es la distribución.

Y otro concepto súper importante es el de centralidad y dispersión. En el gráfico anterior te los he dibujado con flechas. La discontinua es la media, y la flechita horizontal es la dispersión.

Para tenerlo claro, he resumido estos conceptos en una tabla que seguro que te los va a aclarar:

Concepto

Explicación Gráfica

Distribución

Un histograma se puede convertir en un contorno que puedes imaginar si dibujases una línea uniendo las barras del histograma. Este contorno tiene dos características. En qué valor está centrado y cuánto de disperso es.

Esta distribución más o menos está centrada en 6. Tiene una dispersión de 1.5 aprox

Centralidad

El valor central es dónde se concentran los valores de tu distribución.

Se puede calcular con:

  1. La media o promedio
  2. La mediana o cuartil 2

En la imagen ves dos distribuciones con la misma dispersión pero con el valor central de la variable azul más pequeño que la variable roja.

Dispersión

Cómo de lejos están el resto de valores del valor central

Se puede calcular con:

  1. La desviación estándar (std)
  2. El rango Intercuartílico (IQR)

Dos distribuciones con el mismo valor central pero con la dispersión de la variable azul mucho más grande que la variable roja.

He añadido un vídeo para explicarte un poco más el concepto de distribución, valor central y dispersión:

DESCARGA EL MATERIAL EXTRA

# Un histograma un poco especial

Un aspecto importante a tener en cuenta es que la altura del histograma depende del número de observaciones que tengas.

Y eso no mola si quieres comparar distribuciones entre sí.

Es decir si tienes una muestra de 100 y otra de 1000 no podrás comparar los histogramas directamente.

  1. Porque el histograma de la muestra de 1000 tendrá una altura enorme comparado con la de 100.
  2. Y además también porque depende del número de clases en qué hayas dividido tu variable numérica.

Así que, se inventó una manera mucho más inteligente de hacerlo.

El histograma de densidad. Aquí tienes un ejemplo.

  1. La unidades del eje vertical no son frecuencias absolutas como antes sino densidad. O densidad de probabilidad si prefieres.
  2. La particularidad de este histograma es que el área total de las barras es igual a 1. Es decir, si sumamos el área sombreada de todas las barras una a una es 1.

¡Y esto es fantástico! De esta manera, en un mismo gráfico, puedes comparar diferentes distribuciones. Porque las alturas no dependen ni del tamaño de la muestra ni del número de clases que escojas.

Con este último concepto, sin darte cuenta, estás un pasito de entender el concepto de distribución de densidad de probabilidad que vas a ver en la primera lección de la parte III del curso 😉

Hoy has visto conceptos muy útiles y muy interesantes:

  1. El histograma
  2. La distribución
  3. Qué es el valor central y la dispersión de una distribución
  4. El Histograma de densidad

En la lección siguiente voy a seguir explicándote cómo puedes extraer información útil de una variable numérica con la ayuda del boxplot y el resumen numérico 🙂

¡Let’s go!

ACCEDE A LA FORMACIÓN PREMIUM C2

Training Fast Track Analizar Datos desde cero

ACCEDE AL TRAINING

Curso Analiza tu Estudio

ACCEDE AL CURSO

Scroll al inicio