Bienvenido al curso Pro Statistics
Puedes acceder a la versión Premium con tutoriales paso a paso, soporte y asesoramiento
Índice >> Lección 1 >> Lección 2 >> Lección 3 >> Lección 4 >> Lección 5 >> Lección 6 >> Lección 7 >> Lección 8 >> Lección 9 >> Lección 10 >> Lección 11 >> Lección 12 >> Lección 13 >> Tutorial R >> Tutorial Excel >>Tutorial SPSS Errores >> Casos de Éxito >> Opciones para Aprender >> FAQ’s >> Lista de Softwares
Ejemplo completo de exploración de datos
La estadística sin ver su aplicación es difícil de entender.
Durante toda las lección de la parte de exploración de Pro Statistics has ido viendo diferentes ejemplos.
Hoy quiero enseñarte un ejemplo completo de exploración de datos.
Voy a utilizar la tabla de datos que has visto en la lección 2.
Si no la tienes la puedes descargar en este botón.
Voy a darte la tabla resumen de los resultados y una pequeña explicación.
¡Venga le doy al play 😉 !
Tabla de contenidosVariables numéricas una a unaResumen NuméricoHistograma – Boxplot – QQplotVariables numéricas por grupo de especiesHistogramas de densidadBoxplots por gruposMatrixplot por gruposDiagrama mixto: densidad, matrixplot, correlaciónVariables categóricasDiagrama de barras
En este tabla resumen encontrarás todos los gráficos de la exploración de la tabla de datos Iris.
4 variables numéricas y una variable categórica:
Gráficos / Exploración |
---|
Variables numéricas una a unaTe recuerdo las posibilidades que tienes para explorar variables numéricas una a una:
Resumen NuméricoCon el valor de la media y desviación estándar te puedes hacer una idea de las distribuciones en cuánto a centralidad y dispersión. Parece ser que las magnitudes más altas son de la longitud del sépalo. |
Histograma – Boxplot – QQplotEstos gráficos son muy interesantes. Primero puedes ver la distribución de los datos. Puedes darte cuenta, por ejemplo, la existencia del al menos dos grupos diferenciados en la longitud del pétalo. Hay dos montañitas. Incluso se ve muy los dos grupos de puntos en el boxplot con puntos. En general las distribuciones no son normales. |
Variables numéricas por grupo de especiesTe recuerdo las posibilidades que tienes para explorar variables numéricas por grupos:
Histogramas de densidadEstos gráficos te dan mucha información sobre las diferencias entre grupos. Puedes ver las diferencias entre las distribuciones por especies. Si están muy alejados o son similares. Para esta tabla de datos estamos aportando mucha información. ¡Bien! |
Boxplots por grupos |
Matrixplot por gruposMás de dos variables numéricas con la variable categórica de especies
Le damos un poco más de vuelta. Aquí nos podemos fijar en ver la relación entre variables numéricas y especies. Añadimos más información a la exploración. |
Diagrama mixto: densidad, matrixplot, correlaciónMás de dos variables numéricas con la variable categórica de especies
Es más de los mismo. Pero aquí añadimos el cálculo de coeficiente R cuadrado. No es más que el valor de correlación al cuadrado. De esta manera lo vemos mucho más fácil. |
Variables categóricasTe recuerdo las posibilidades que tienes para explorar variables categóricas.
Diagrama de barrasEn este caso solo tienes una variable categórica: species. Con lo cual pocas conclusiones puedes sacar. Solo ver qué proporción tienes de cada especie.
No hace falta ni copiar la tabla de contingencias porque ya se ve a simple vista. Tienes 50 observaciones de cada muestra, es decir de cada grupo. |
…
Con este ejemplo ya tienes una visión mucho más práctica de qué es la exploración. Cómo puedes aplicarla y cómo interpretar muchos de los gráficos.
Estás preparado para pasar a la segunda fase.
La fase de análisis.
¿Me acompañas?
…
ACCEDE A LA FORMACIÓN PREMIUM C2
Training Fast Track Analizar Datos desde cero
Curso Analiza tu Estudio