Bienvenido al curso Pro Statistics
Puedes acceder a la versión Premium con tutoriales paso a paso, soporte y asesoramiento
Índice >> Lección 1 >> Lección 2 >> Lección 3 >> Lección 4 >> Lección 5 >> Lección 6 >> Lección 7 >> Lección 8 >> Lección 9 >> Lección 10 >> Lección 11 >> Lección 12 >> Lección 13 >> Tutorial R >> Tutorial Excel >>Tutorial SPSS Errores >> Casos de Éxito >> Opciones para Aprender >> FAQ’s >> Lista de Softwares
Explorando una variable numérica (I)
En esta segunda parte vas a entrar en materia.
Hoy te voy a explicar:
- Cómo observar una variable numérica con un histograma y una tabla de frecuencias
- Qué es una distribución y el concepto de centralidad y dispersión
- Un histograma un poco especial: el histograma de densidad
En esta lección aprenderás muchas cosas nuevas.
Así que poco a poco.
¡A por ello valiente!
Tabla de contenidos# De números a barras: el histograma# Distribución de una variable# Un histograma un poco especial
# De números a barras: el histograma
La primera herramienta que te quiero mostrar es el histograma.
El histograma dibuja la distribución de una variable numérica con barras. ¿ves las barras de la imagen? Esa forma que hacen es la distribución de tu variable numérica.
Cuando dibujas un histograma es parecido a colocar las fichas de un cuatro en raya en la columna correspondiente.
- Cada columna le corresponde un rango. Un intervalo de la variable numérica. Son las clases. ¿puedes ver los rangos de edad de la imagen del cuatro en ralla?
- Las fichas se colocan en la clase que toca. La altura de las fichas es la altura de las barras del histograma. Son las frecuencias.
Vuelve a mirar la imagen y dale 1 minuto. Observa los números de las fichas y los intervalos de cada columna. ¿Se entiende?
Para dibujar un histograma en dos pasos:
- Ordenar la variable numérica por clases con una tabla de frecuencias
- Pintar las barras. Las alturas de las barras corresponden a las frecuencias
Sé que te habrás quedado igual con esto último. Así que te he preparado un artículo con mucho cariño para que entiendas el histograma y la tabla de frecuencias.
Para complementar la explicación tienes un vídeo explicativo con algún que otro ejemplo:
# Distribución de una variable
Un concepto ligado al histograma es la distribución. ¡Es crucial para entender tus variables!
La distribución de una variable numérica es el contorno de un histograma.
¿Puedes reseguir el contorno de las barras con un lápiz verdad? Esta imagen mental que te has creado es la distribución.
Y otro concepto súper importante es el de centralidad y dispersión. En el gráfico anterior te los he dibujado con flechas. La discontinua es la media, y la flechita horizontal es la dispersión.
Para tenerlo claro, he resumido estos conceptos en una tabla que seguro que te los va a aclarar:
He añadido un vídeo para explicarte un poco más el concepto de distribución, valor central y dispersión:
# Un histograma un poco especial
Un aspecto importante a tener en cuenta es que la altura del histograma depende del número de observaciones que tengas.
Y eso no mola si quieres comparar distribuciones entre sí.
Es decir si tienes una muestra de 100 y otra de 1000 no podrás comparar los histogramas directamente.
- Porque el histograma de la muestra de 1000 tendrá una altura enorme comparado con la de 100.
- Y además también porque depende del número de clases en qué hayas dividido tu variable numérica.
Así que, se inventó una manera mucho más inteligente de hacerlo.
El histograma de densidad. Aquí tienes un ejemplo.
- La unidades del eje vertical no son frecuencias absolutas como antes sino densidad. O densidad de probabilidad si prefieres.
- La particularidad de este histograma es que el área total de las barras es igual a 1. Es decir, si sumamos el área sombreada de todas las barras una a una es 1.
¡Y esto es fantástico! De esta manera, en un mismo gráfico, puedes comparar diferentes distribuciones. Porque las alturas no dependen ni del tamaño de la muestra ni del número de clases que escojas.
Con este último concepto, sin darte cuenta, estás un pasito de entender el concepto de distribución de densidad de probabilidad que vas a ver en la primera lección de la parte III del curso 😉
…
Hoy has visto conceptos muy útiles y muy interesantes:
- El histograma
- La distribución
- Qué es el valor central y la dispersión de una distribución
- El Histograma de densidad
En la lección siguiente voy a seguir explicándote cómo puedes extraer información útil de una variable numérica con la ayuda del boxplot y el resumen numérico 🙂
¡Let’s go!
…
ACCEDE A LA FORMACIÓN PREMIUM C2
Training Fast Track Analizar Datos desde cero
Curso Analiza tu Estudio