Alguna vez (y yo me uno) has caído en error de pensar que los datos o la estadística sólo sirven para mentir.
Siempre que quieras obtener un resultado sólo tienes que manipular tus datos y obtener resultados que te gusten. ¿Verdad?
Esto es porque nos falta entender que el análisis de datos es una habilidad.
Un oficio que requiere aprender un método.
Unos pasos.
Siguiendo estos pasos todo cobra sentido y no hace falta mentir o manipular porqué tú mismo estarás descubriendo resultados honestos de tus datos.
Es momento de aprender a jugar con los datos y divertirte.
La manipulación la dejamos para los políticos. ¿Te parece?
# La falta de foco es un problema
Si has intentado alguna vez trabajar con datos has querido obtener resultados lo más rápidamente posible.
Es decir, obtener el p-valor que te confirme si tu hipótesis es la cierta o la regresión que andas buscando para justificar tus trabajo.
Es un error muy común. Querer aplicar las técnicas des de un principio.
Y siento decirte, que no es la mejor forma para poder obtener resultados interesantes.
De hecho el análisis de datos es un pequeño juego. O mejor aún, un oficio.
Como un sastre, un carpintero, un pintor, un escultor,…
Para lograr resultados interesantes hay que jugar y pasarlo bien. Disfrutar del camino. Para poder crear un resultado satisfactorio.
Hoy te desvelaré la manera de jugar con datos.
Los pasos que necesitas seguir antes de aplicar técnicas o test complicados.
Y te lo explicaré con un ejemplo.
# Descubre el camino o los pasos para poder analizar los datos de tus proyectos
Observa atentamente esta figura.
En un principio tenemos información en bruto. Una tabla de datos que a simple vista no tienes ni idea que información esconde.
La puedes observar en el centro de la imagen.
Los 4 puntos son loas cuatro pasos que necesitas para tratar datos y obtener resultados que andas buscando.
Déjame explicarte uno por uno los pasos que necesitas para trabajar tus datos.
# Paso 1 Aumenta foco: el objetivo
“Ningún viento es favorable si no sabes hacia dónde te diriges”
Séneca
Eso eso. Primero. Párate a pensar qué quieres solucionar y qué objetivos persigues con tus datos.
Lo primero es entender la tabla de datos y la problemática que quieres resolver.
- Identifica el tipo de variables y su significado
- Y define un objetivo para analizar los datos. Intenta ser concreto y aportar respuestas al principio a aspectos sencillos.
Por ejemplo: comparar el tratamiento A con el tratamiento B. Este objetivo es muy diferente de observar qué variables son que influyen más en la mejora de los pacientes con el tratamiento A.
Dependiendo de lo que busques, deberás trabajar unas técnicas u otras. Unos gráficos u otros.
# Paso 2 Descubre tus datos: la descripción
Cuando ya sabes hacia dónde vas es momento de crear los gráficos, tablas y características de tus datos que te permitan explicar lo que quieres analizar.
Utiliza la estadística descriptiva para poder hablar con tus datos y obtener ya las primeras conclusiones de tus datos.
Se trata de:
- Crear los gráficos que te permitan visualizar lo que quieres para acercarte a tu objetivo
- Interpreta estos gráficos
- Lista las conclusiones que has obtenido
Muchas veces en esta etapa ya estás resolviendo lo que quieres.
Por ejemplo, si tu principal inquietud es mostrar con gráficos y resultados las ventas de los últimos 5 años. Con el paso de la descripción ya eres capaz de aportar suficientemente información a tu audiencia.
# Paso 3 Responde a las preguntas: el análisis
El siguiente paso es utilizar las técnicas de análisis para poder responder a tus preguntas y problemas con rigor estadístico y científico.
Utilizarás la estadística inferencial.
Se tratará de:
- Aplica la técnica apropiada del mapa de técnicas
- Interpreta los resultados
- Responde a tus preguntas como científico estadísticamente
Dependiendo de tu problemática utilizarás una técnica u otra. Pero, en definitiva, siempre estarás aportando respuestas veraces a las preguntas que te marques en el paso 1.
Por ejemplo, el p-valor que he obtenido me confirma que el tratamiento A funciona mejor que el tratamiento B.
Estamos contestando la hipótesis de tu estudio con evidencias estadísticas.
El conocimientos del mapa de técnicas te va a permitir ser más efectivo en este paso 🙂
# Paso 4 Comunica tus resultados: la presentación
Finalmente se trata de presentar los resultados a tu audiencia.
Es muy importante poner en foco en qué la audiencia entiende muy bien la problemática que estás resolviendo.
Si consigues que el público se sienta atraída por la importancia de tu proyecto.
Utiliza ejemplos e historias para poder conquistar la audiencia al principio.
Después, se tratará de listar tus mejores resultados explicando en cada caso lo más relevante.
Es innecesario explicar muchos detalles. Ves al grano y sé ejecutivo en la prestación de tus conclusiones.
# Un ejemplo de aplicación del método: datos demográficos mundiales
Ahora vas a ver cómo aplicar esta metodología con un ejemplo sencillo de análisis de datos.
Vamos a trabajar con esta tabla de datos.
Observa las variables (columnas) que vamos a trabajar durante un par de minutos.
Te ayudará a entender el ejemplo 😉
Paso 1 – Aumenta foco: el objetivo
El primer paso es entender la tabla de datos, las variables.
Se observa que tenemos recogidos los datos de la población, la esperanza de vida, el PIB per cápita de países del mundo des de 1952 a 2007.
¿Qué variables tenemos?
- País – categórica
- Año – Ordinal
- Población – numérica discreta
- Continente – Categórica
- Esperanza de Vida – numérica continua
- PIB per cápita – numérica continua
¿Qué objetivos te puedes plantear para el análisis de datos?
Analizar la:
- Evolución de la población en los diferentes continentes
- Evolución de la esperanza de vida en los diferentes continentes
- Evolución del PIB per cápita en los diferentes continentes
Ó podemos buscar la relación entre riqueza de un país y la esperanza de vida:
- Buscar la relación entre la Esperanza de vida y el PIB per cápita
Acabos de realizar un pequeño ejercicio fundamental.
¡Pararnos a pensar y entender los datos y decidir qué queremos observar y analizar! ¡Genial!
Vamos a seguir.
# Paso 2 Descubre tus datos: la descripción
Se trata de describir. Crear gráficos y tablas interesantes para cada objetivo.
Aportar información gráfica de nuestros datos. Observa los diferentes gráficos de las imágenes y el objetivo marcado en verde.
Para observa la evolución de las variables por continentes de la población, esperanza de vida y PIB per cápita he utilizado un diagrama de líneas para visualizar cómo está cambiando la variable en función del tiempo.
Te invito a que le des un vistazo e intentes explicar qué estás viendo en estos gráficos.
En cuánto a la relación de la riqueza y la esperanza de vida, podemos utilizar un diagrama de dispersión:
Fíjate que la relación es no lineal o exponencial se llama. No es una línea recta.
Podemos utilizar la transformación logarítimica para poder encontrar un relación más sencilla.
Ahora se observa una relación más lineal y podemos crear un modelo lineal sencillo que nos permita explicar el fenómeno causa efecto!
¡La descripción es la clave del éxito!
# Paso 3 Responde a las preguntas: el análisis
Para analizar la evolución temporal de las variables podemos utilizar el ritmo de crecimiento calculado como el crecimiento porcentual por periodo.
Un crecimiento porcentual positivo indica que estamos creciendo.
Para que me entiendas, el crecimiento porcentual es sinónimo del ritmo de crecimiento.
Si es negativo. Estamos decreciendo.
Podemos graficar el crecimiento porcentual de la población, del PIB per cápita, y la esperanza de vida a lo largo del tiempo.
¡Let’s do it!
Ahora que has visto que el ritmo de crecimiento de la población está disminuyendo aunque la población siempre está creciendo.
Lo puedes observar porque el crecimiento porcentual siempre es positivo.
Con estos sencillos gráficos nos estamos dando cuenta del ritmo de crecimientos de los diferentes continentes y la tendencia par el futuro. La población tiene a estabilizarse aunque estamos lejos de ello. Necesitaremos unos cuántos años para conseguirlo.
Vamos a por el segundo objetivo: explicar un fenómeno causa-efecto con un modelo predictivo.
Voy a explicar la esperanza de vida en función del PIB per cápita del país. El PIB per cápita es sinónimo de la riqueza de un país. Podemos continuar con el diagrama de dispersión del anterior paso y calcular una recta de regresión.
¡Observa la fórmula de la recta!
¡Qué bien!
Acabamos de descubrir con un modelo lineal que a mayor PIB per cápita mayor es la esperanza de vida de un país.
Si te fijas en el coeficientes 7.2028 que acompaña la variable explicativa (PIB per cápita), es positivo y por tanto la relación es directa y creciente.
¡Voilà!
Acabos de demostrar el objetivo del estudio con un sencillo modelo 🙂
# Es tu turno, ¡aplica este método en tus datos!
Ahora que entiendes el método que te acabo de explicar solo necesitas aplicarlo.
Seguro que ganarás mucho tiempo y dolores de cabeza con estos 4 pasos.
¡A por ello!
¿Qué paso crees que es el que es más difícil de aplicar en tu caso?
Excelente ejemplo Jordi. Muchas gracias!
Gracias Diana!
Un abrazo
Excelente forma de explicar como analizar datos de forma sencilla!!!!
Me encanta tu contenido Jordi y te agradezco que compartas esta información, me gusta la estadística 🙂
Saludos desde Perú.
excelente, me gusta bastante como explicas y analizas los temas.
Gracias, espero que algún día pase de bastante a mucho 😉