como-analizar-datos

El secreto para Analizar Datos como un pro que un consultor estadístico nunca te contaría

A ver si te suena: «no sé cómo analizar datos … y me temo que es porque no sé de estadística y menos cómo aplicarla»

Has oído hablar de estadística alguna vez. O incluso has estudiado alguna asignatura en la universidad. Llega el momento de aplicarla… y no sabes ni por dónde empezar.

Seguramente ahora mismo tienes una pregunta que te inquieta:

¿Qué método estadístico aplico para analizar datos de mi proyecto?

o, dicho de otro modo

¿Cómo puedo analizar mis datos de forma eficaz?

Es muy normal tener esta preocupación. La estadística aplicada es una herramienta viva que requiere práctica y enfoque.

Hoy te quiero mostrar una visión global y práctica de un proceso de análisis de datos y cómo encontrar el foco necesario para analizar datos como un pro.

¿Empezamos?

# ¿Qué método es el más apropiado para analizar los datos de mi proyecto?

Como te comentaba. No saber qué técnica aplicar ni cómo utilizar la estadística aplicada es una preocupación muy recurrente.

La estadística aplicada es una disciplina con muchas técnicas y conceptos. Y me puedo imaginar el lío que tienes ahora mismo en la cabeza.

En este post voy atacar directamente esta preocupación que te inquieta.

Para llegar a resolverla es necesario abordar 4 aspectos muy importantes.

¿Cuáles son las etapas de un proceso completo de análisis de datos?

¿Qué es una tabla de datos y cómo está ordenada? (Las Variables)

¿Cómo puedo interpretar los datos? (La Exploración)

¿Qué técnica estadística aplico en cada caso? (El Análisis)

¿Qué software utilizo y cómo aprendo a manejarlo?

Ahora te voy a ir desgranando estos aspectos tan importantes:

¿Cuáles son las etapas de un proceso de análisis de datos?

Es esencial que tengas una foto global de un proceso de análisis de datos. Te puedes perder en la cantidad de técnicas y estrategias estadísticas que tienes a tu disposición.

Ser enfocado es clave para tu éxito. A continuación te presento las 6 etapas que componen un proceso completo de análisis de datos:

  1. El Problema. Todo nace de un problema, de una necesidad real. En esta etapa definirás el foco y el objetivo del proyecto. El «cómo analizar los datos» depende de este punto de partida. El más importante.
  2. La Recolección. Es el diseño de un método para obtener DATOS. Más técnicamente es un proceso de experimentación. Puede ser una encuesta, pruebas en laboratorios, con pacientes, nutrirse de datos de marketing en redes sociales etc… Para unos buenos datos de partida es importante definir la tabla de datos previamente.
  3. La Limpieza Homogeneizar los datos en cuanto a formato, deshacer observaciones que no te interesan y almacenar las más útiles. Construir nuevas variables a partir de otras existentes. Entro otras acciones.
  4. La Exploración. Utilizando la estadística descriptiva podrás traducir los DATOS a gráficos y características que puedas interpretar. Esta etapa de exploración es sinónimo de descubrimiento. De «hablar» con los datos.
  5. El Análisis. Con la ayuda de la estadística inferencial encontrarás conclusiones de un conjunto grande (población) con la información de una pequeña parte de este conjunto (muestra). A veces es posible que tengas datos de toda la población. El contraste de hipótesis es la herramienta más famosa de la inferencia. Pero existen otras técnicas increíbles y potentes: la correlación, modelos estadísticos causa-efecto, algoritmos de regresión y clasificación. Y técnicas como el clustering, la reducción dimensional o las reglas de asociación. Entre otras.
  6. La Conclusión Interpretarás los resultados del análisis y listarás las conclusiones. Estarás mucho más cerca del objetivo que te habrás planteado al inicio. Y de la resolución del problema inicial.

Al final de este post te voy a desvelar el secreto que te quería contar. Y está relacionado con las tres últimas etapas que ahora has visto 🙂

Te voy a contar cómo analizar los datos una vez tengas la tabla de datos lista para trabajar.

¡Vamos a ello!

¿Qué es una tabla de datos y cómo está ordenada?

Ahora me paro. En la etapa 4 de exploración. En ella empiezas a trabajar con datos ya limpios y ordenados. Vas a empezar a modelar tu tabla de datos.

Para que me entiendas una tabla de datos es una matriz con sus celdas. Algo así:

  • Las filas son observaciones. Las observaciones son las veces que estás midiendo. Las observaciones puedes ser: pacientes, plantas, animales, individuos, eventos, días etc.
  • Las columnas son variables. Las variables son las características que vas a medir. Y hay dos grandes tipos. Más abajo te lo cuento.
  • El header son los nombres de las variables. Normalmente el nombre está representado en la primera fila.

Esto que parece una tontería es muy importante. Entender que tu tabla de datos son columnas de números o letras es sumamente crucial.

Y también lo es la clasificación de las variables. Las variables son las características que vas a medir. Y en la práctica te vas a encontrar con 2 grandes tipos.

  • Cuantitativa. Son números y tienen unidades. Tienen un sentido de escala. Pueden ser discretas (sin decimales) y continuas (con decimales). Por ejemplo el peso en kg.
  • Cualitativa Son etiquetas o nombres de las cosas. El país de procedencia, el estado civil, el género etc… Pueden ser nominales u ordinales.
  • Ordinal (cualitativa). Son una tipo especial de cualitativas con un tienen un sentido de escala. Por ejemplo: la calidad del servicio puede ser regular, normal, bueno, muy bueno.

Te estoy dando las bases más importantes para saber cómo analizar datos. Y ahora te voy a mostrar la exploración. O también llamada, la descripción. Es una parte fundamental. 🙂

¿Cómo puedo interpretar los datos?

Una vez que tengas tu tabla de datos, limpia. Entiendas qué tipo de variables tienes y qué significan. Es de vital importancia que puedas visualizar la información escondida en esta tabla.

¿Qué quiere decir? Saber interpretar esa tabla de datos y poder comunicarte con tus datos. Descubrir información muy interesante con la ayuda de gráficos.

La estadística descriptiva te va a ayudar a ver información que no puedes ver a simple vista. Vas a utilizar gráficos y también características numéricas simples.

En este post vas a ver una lista con los gráficos más típicos explicados uno a uno 🙂

¿Qué técnica estadística aplico en cada caso?

O dicho de otro forma, ¿qué test estadístico aplico?. La sensación de no controlar todas las técnicas estadísticas es un poco agobiante. ¡Pero no te preocupes! Voy a intentar deshacer esta sensación.

Lo más importante es entender los problemas tipo. Y hoy te voy a mostrar los 6 problemas más comunes:

  1. Comparación de medias. Distinguir si un grupo es diferente a otro. Por ejemplo “ver si la presión arterial es más alta en un grupo de pacientes con obesidad y los que no” Por un lado tienes la variable numérica (presión arterial) y por el otro grupos de pacientes (con o sin obesidad)
  2. Comparación de proporciones. Distinguir si las proporciones son diferentes de un grupo al otro. Por ejemplo: “¿La proporción de accidentes de moto es diferente por rangos de edad 15-20, 20-25, 25-30 y 30-35?» Tenemos 4 proporciones que queremos comparar.
  3. Asociación. Ver si los grupos tienen relación en la tabla de contingencias. Por ejemplo “¿Hay relación en cuanto a la precisión (buena, regular, mala) de un aparato de medida analógico y uno óptico?” En el fondo, es relacionar variables cualitativas.
  4. Correlación. Analizar si hay relación entre variables numéricas. La asociación entre variables cuantitativas. Por ejemplo “Tienes datos de 200 familias sobre las ganancias y los gastos. ¿Es verdad que se cumple que cuánto más tienes más gastas?”
  5. Modelos estadísticos causales. Calcular un modelo matemático que permita predecir una variable en función de otras. Por ejemplo “Un modelo que te permita calcular la frecuencia cardíaca máxima en función de datos como la edad, la presión baja y alta, el sexo, la altura y el peso”
  6. Técnicas avanzadas de reconocimiento de patrones o machine learningModelos y algoritmos predictivos para poder aportar respuestas de tus datos y solucionar problemas reales con aplicaciones personalizadas para  tu caso. Por ejemplo: «Estimar la probabilidad de que un paciente tenga diabetes solamente con las características como la Edad, peso, altura y un análisis de sangre»

Estos problemas forman parte del Mapa de Claridad Total que voy a compartir contigo el training gratuito. Vas a comprender mucho mejor estos casos con ejemplos para saber qué técnica aplicar en los distintos casos. Y además te voy a mostrar cómo Analizar Datos con éxito con ejemplos:

Training Gratuito Estadística

"Cómo Analizar los Datos de tus proyectos con Éxito sin perder miles de horas leyendo libros de estadística." 👇

¿Qué software utilizo y cómo aprendo a manejarlo?

Uno de los puntos más importantes es saber aplicar los conceptos y técnicas estadísticas con datos reales. Es la magia de la estadística aplicada. Existen mucho softwares. Unos comerciales otros no. Y la decisión puede parecer difícil pero no lo es.

Para mi el software que me ha aportado mayor beneficios a medio plazo ha sido R con RStudio. ¿Por qué? Por estos motivos:

  1. Primero, porque es gratuito.
  2. Segundo, porque es un software consolidado con una comunidad enorme. Con gran peso tanto dentro de los centros de investigación como en las empresas.​
  3. Y tercero, porque una vez superas la curva inicial de aprendizaje, ​puedes seguir creciendo en modo DIY. ¡Y no habrá quien te pare!

Y es posible que pienses que es sólo para programadores porque hace uso de código. Pero no es del todo cierto. Si posees las plantillas de código tipo puedes realizar análisis estadísticos muy rápidos y eficaces sin aprender la estructura de programación en detalle.

Pero no te voy a engañar, si quieres utilizar este programa a un nivel avanzado necesitarás utilizar la programación para aprovechar todo su potencial del software.

Aquí tienes un artículo que te va a ayudar a empezar con R y entender el potencial de esta herramienta.

# ¿Cómo analizar datos como un pro? La metodología probada paso a paso

¡Y este es el secreto que quería desvelarte hoy! Y para entender este secreto me he querido asegurar de englobar los aspectos básicos en el funcionamiento de un proyecto de análisis de datos. Por este motivo, te he explicado los puntos del principio 😉 

Este secreto es un método paso a paso. Una metodología de aplicación.

Son los 4 pasos que, por mi experiencia, se van repitiendo en cualquier proceso de análisis de datos.  Y hoy, te los voy a desvelar:

# PASO1. Define UN objetivo para tu proyecto (y sólo uno)

En este paso vas a definir un objetivo de tu proyecto y SÓLO uno. El ser humano tiende a complicarse (yo el primero) es muy importante focalizar los esfuerzos en un sólo objetivo. Defínelo siguiendo estos puntos:

  1. ¿Qué problema quiero solucionar con estos datos?
  2. ¿Qué significan las variables?
  3. ¿Qué tipo de variables tienes?
  4. Definir 1 objetivo y sólo 1 que ayude a solucionar el problema que has definido en el punto 1

# PASO2. Explorar los datos a lo Sherlock Holmes

Me gusta Holmes. Porque es capaz de ordenar toda la información de diferentes escenas y sospechosos para poder aclarar el lío inicial.

Antes que Sherlock Holmes sepa quién es el asesino, Holmes explora diferentes escenas: busca objetos, interroga a los sospechosos y los presentes, etc. “Explora” con su lupa lugares inverosímiles. Consigue un listado de objetos y hechos relevantes. Después los analiza para atar cabos y encontrar el culpable.

Y nosotros vamos a hacer lo mismo. Primero de todo exploraremos y después analizaremos.

La etapa de descripción (o exploración) se compone de estos puntos:

  1. Crea los gráficos más apropiados
  2. Interpreta los gráficos
  3. Encuentra tus primeros indicios. Tus primeras pre conclusiones
  4. Lista por orden de importancia los indicios que te han desvelado los gráficos

Esta paso es fundamental y muy muy importante.

Podrás recoger información muy útil de tu tabla de datos y la listarás por orden de importancia.

El conocimiento de las herramientas gráficas de la estadística descriptiva es muy importante. Si accedes al training gratuito podrás descargarte un PDF que incluye, entre otras cosas, un listado de gráficos que podrás aplicar hoy:

Training Gratuito Estadística

"Cómo Analizar los Datos de tus proyectos con Éxito sin perder miles de horas leyendo libros de estadística." 👇

# PASO3. Analiza los datos con un software y un mapa

Ahora es momento de decidir si tus pre-conclusiones son ciertas o no. Te vas a apoyar de la estadística inferencial: modelos estadísticos causales, contraste de hipótesis e incluso algoritmos de reconocimiento de patrones.

Para hacerlo necesitas dos cosas:

  • Conocimiento de un mapa de técnicas estadísticas
  • Cómo aplicar estas técnicas con un software

Los puntos necesarios en este paso son:

  1. Encuentra las técnicas más apropiadas para corroborar las pre-conclusiones con la ayuda de un mapa
  2. Diseña la metodología de análisis
  3. Aplica esta metodología
  4. Resume los resultados

El conocimiento de las técnicas estadísticas y tu experiencia juegan un gran papel en esta etapa.

Si quieres más puedes encontrar 6 técnicas estadísticas más utilizadas en la práctica que te ayudarán a ampliar el conocimiento de las técnicas.

Training Gratuito Estadística

"Cómo Analizar los Datos de tus proyectos con Éxito sin perder miles de horas leyendo libros de estadística." 👇

# PASO4. Crear el informe final listando conclusiones cristalinas

Es el último y muy importante. Saber comunicar tus hallazgos delante de tu audiencia. Es un proceso muy, muy importante. Los datos sólo son útiles si se muestran los resultados de forma cristalina.

Me ha pasado que en ocasiones no he sabido transmitir la importancia de mis resultados y conclusiones. Y, ¡es el resultado final lo que importa! Te he preparado 6 puntos que todo informe o presentación debe incluir:

  1. Contextualiza tu proyecto
  2. Explica muy bien el problema que resuelves
  3. Define tu objetivo alineado al problema que quieres resolver
  4. Muestra la información escondida (etapa de exploración)
  5. Define tu metodología de análisis por encima (etapa de análisis)
  6. Muestra los resultados. Los más importantes (etapa de análisis)
  7. Resume las conclusiones
  8. Problemas encontrados durante el estudio
  9. Siguientes pasos del proyecto

# Más detalles de cómo analizar datos y del método paso a paso:

Entender estos pasos fue de verdad una revelación. Seguir este orden me dio claridad y foco para analizar los datos de forma práctica sin complicarme con fórmulas complejas.

Como has visto es una combinación de conocimientos estadísticos y de manejo de softwares.

Pero lo que realmente es más importante es comprender un sistema. Un método para saber cómo analizar los datos.

Gracias a conocer y aplicar este método tuve la oportunidad de acceder a en un buen puesto de trabajo en el departamento de I+D de un gran empresa de diseño de turbinas eólicas.

De verdad, recomiendo este método.

Puede ser que te interese entrar un poquito más en este método y entender paso a paso esta metodología y cómo analizar los datos con éxito.

Si es así puedes reservar plaza al training gratuito: «Cómo Analizar los Datos con éxito sin perder miles de horas leyendo libros de estadística».

Me hubiera encantado poder recibir esta descripción del método paso a paso cuando empecé. Así que si quieres profundizar te espero en el training de Analiza tus Datos 🙂 

Ya sabes que si quieres entrar en más profundidad y cómo aplicarlo con un par de ejemplos puedes acceder aquí al training gratuito para descubrir cómo analizar los datos.

¡Un abrazo!

Acerca del autor

Jordi Olle Sanchez

Autor de ConceptosClaros.com. Ayuda a investigadores apasionados a aplicar estadística y análisis de datos en sus proyectos para catapultar su carrera investigadora y adaptarse a la era de los datos. Accede a los recursos gratuitos para aplicar estadística en tus datos

Interacciones con los lectores

Comentarios

  1. Georgina Calvimontes dice

    Necesito una metodología clara y sencilla que permita realizar un buen análisis de datos y estadísticas en salud

    • Jordi Ollé dice

      Hola Jorge,

      Una vez te suscribes encontrarás un link donde podrás descargarte las guías.
      Y en otros formularios te daré acceso con un email. Además de un curso gratuito.

      Abrazos

  2. Roberto dice

    Hola Jordi Ollé C2
    Ayudaria un curso de como enseñar la estadistica como una herramienta
    guiada por la nececidad y no como una herramienta esteril.

    Hay que conciderar como tema las estadisticas engañosas (envié Libro)

  3. mercedes dice

    Hola voy a hacer un proyecto de intervencion con un solo grupo son mujeres con edades de 35 a 45 años y estoy algo perdida con la estadistica si me orientaras seria genial, por favor

  4. cecilia dice

    Hola buen dia
    Acabo de agregarme al grupo y no puedo descargar la información de ¨Tecnicas Estadisticas indispensables
    me dice que existe un problema con el contenido

  5. Maximo Parco Quispe dice

    Es excelente la información y compartir sus conocimientos poniendo al alcance de todos para contribuir en el desarrollo de la ciencia para míes sumamente importante, felicitaciones.

  6. brenda dice

    hola!
    Me gustaría me pudiera orientar en como aplicar la estadística en una empresa, realmente no tengo mucha idea y la verdad estoy muy confundida.

    • Edgar Nossa dice

      Hola Brenda. soy estadístico administrativo, hay un curso de estadística aplicada a la empresa de DKA, es gratis, o compra el libro de estadistica comercial, hay bastantes ejemplos y aplicaciones, lo importante de la estadística no es su proceso, lo importante es la interpretación de los datos para convertirlos en información para la toma de decisiones y eso se logra cuando se conoce,como lo dice en este tutorial, el problema que vamos a resolver, el resto lo hace un sofware,


Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

  Acepto la política de privacidad

Responsable del fichero: Jordi Ollé Sánchez
Finalidad; envío de mis publicaciones así como correos comerciales.
La Legitimación; es gracias a tu consentimiento.
Destinatarios:Como usuario e interesado te informo que los datos que me facilitas estarán ubicados en los servidores de Webempresa (proveedor de hosting de Conceptos claros) dentro de la UE. Ver política de privacidad de Webempresa
Podrás ejercer Tus Derechos de Acceso, Rectificación, Limitación o Suprimir tus datos enviando un email a jordi @ conceptosclaros.com o ante la Autoridad de Control
Encontrarás más información en política de privacidad
6-tecnicas-Mockup-presentacion

Descubre cómo Analizar tus Datos con éxito y convertirte en Científico de Datos en tu sector