como-analizar-datos

El secreto para Analizar Datos como un pro que un consultor estadístico nunca te contaría

 

A ver si te suena.

Has oído hablar de estadística alguna vez. O incluso has estudiado alguna asignatura en la universidad. Llega el momento de aplicarla… y no sabes ni por dónde empezar.

Seguramente ahora mismo tienes una pregunta que te inquieta:

 

¿Qué método estadístico aplico para analizar datos de mi proyecto?

o, dicho de otro modo

¿Cómo puedo analizar mis datos de forma eficaz?

 

Es muy normal tener esta preocupación. La estadística aplicada es una herramienta viva que requiere práctica y enfoque.

Hoy te quiero mostrar una visión global y práctica de un proceso de análisis de datos y cómo encontrar el foco necesario para analizar datos como un pro.

¿Empezamos?

 

# ¿Qué método es el más apropiado para analizar los datos de mi proyecto?

Como te comentaba. No saber qué técnica aplicar ni cómo utilizar la estadística aplicada. Es una preocupación muy recurrente.

La estadística aplicada es una disciplina con muchas técnicas y conceptos. Y me puedo imaginar el lío que tienes ahora mismo en la cabeza.

En este post voy atacar directamente esta preocupación que te inquieta.

Para llegar a resolverla es necesario abordar 4 aspectos muy importantes.

¿Cuáles son las etapas de un proceso completo de análisis de datos?

¿Qué es una tabla de datos y cómo está ordenada?

¿Cómo puedo interpretar los datos? (La Exploración)

¿Qué técnica estadística aplico en cada caso? (El Análisis)

¿Qué software utilizo y cómo aprendo a manejarlo?

 

Ahora te voy a ir desgranando estos aspectos tan importantes:

¿Cuáles son las etapas de un proceso de análisis de datos?

Es esencial que tengas una foto global de un proceso de análisis de datos. Te puedes perder en la cantidad de técnicas y estrategias estadísticas que tienes a tu disposición.

Ser en enfocado es clave para tu éxito. A continuación puedes ver las 6 etapas.

  1. El Problema. Todo nace de un problema, de una necesidad real. En esta etapa definirás el foco del estudio.
  2. La Recolección. Es el diseño de un método para obtener DATOS Más técnicamente es un proceso de experimentación. Puede ser una encuesta, pruebas en laboratorios, con pacientes, nutrirse de datos de marketing en redes sociales etc…
  3. La Limpieza Homogeneizar los datos en cuanto a formato, deshacer observaciones que no te interesan y almacenar las más útiles.
  4. La Exploración. Utilizando la estadística descriptiva podrás traducir los DATOS a gráficos y características que puedas interpretar.
  5. El Análisis.Con la ayuda de la estadística inferencia encontrarás conclusiones de un conjunto grande (población) con la información de una pequeña parte de este conjunto (muestra). El contraste de hipótesis es la herramienta más famosa de esta etapa. Pero existen otras técnicas como: la predicción, la clasificación o los métodos de causa-efecto. Entre otros.
  6. La Conclusión Interpretarás los resultados del análisis y listarás las conclusiones. Estarás mucho más cerca del objetivo que te habrás planteado al inicio.

Al final de este post te voy a desvelar el secreto que te quería contar. Y está relacionado con las tres últimas etapas que ahora has visto 🙂

¿Qué es una tabla de datos y cómo está ordenada?

Ahora me paro. En la etapa 4 de exploración. En ella empiezas a trabajar con datos ya limpios y ordenados. Vas a empezar a modelar tu tabla de datos.

Para que me entiendas una tabla de datos es una matriz con sus celdas. Algo así:

  • Las filas son observaciones. Las observaciones son las veces que mides la realidad
  • Las columnas son variables. Las variables son las características que vas a medir.
  • El header son los nombres de las variables.

Esto que parece una tontería es muy importante. Entender que tu tabla de datos son columnas de números o letras en columnas es sumamente crucial.

Y también lo es la clasificación de las variables. Las variables son las características que vas a medir. Y en la práctica te vas a encontrar con 3 tipos.

  • Cuantitativa. Son números y tienen unidades. Tienen un sentido de escala. Pueden ser discretas (sin decimales) y continuas (con decimales). Por ejemplo el peso en kg.
  • Cualitativa Son etiquetas o nombres de las cosas. El país de procedencia, el estado civil, el género etc…
  • Ordinal (cualitativa). Son una tipo especial de cualitativas con un tienen un sentido de escala. Por ejemplo: la calidad del servicio puede ser regular, normla, bueno, muy bueno.

Te estoy dando las bases más importantes para saber analizar datos. Y ahora te voy a mostrar la exploración. O también llamada, la descripción. Es una parte fundamental. 🙂

¿Cómo puedo interpretar los datos?

Una vez que tengas tu tabla de datos, limpia. Entiendas qué tipo de variables tienes y qué significan. Es de vital importancia que puedas visualizar la información escondida en esta tabla.

¿Qué quiere decir? Saber interpretar esa tabla de datos y poder comunicarte con tus datos. Descubrir información muy interesante con la ayuda de gráficos.

La estadística descriptiva te va a ayudar a ver información que no puedes ver a simple vista. Vas a utilizar gráficos y también características numéricas simples.

En este post vas a ver una lista con los gráficos más típicos explicados uno a uno 🙂

 

¿Qué técnica estadística aplico en cada caso?

O dicho de otro forma, ¿qué test estadístico aplico?. La sensación de no controlar todas las técnicas estadísticas es un poco agobiante. ¡Pero no te preocupes! Voy a intentar deshacer esta sensación.

Lo más importante es entender los problemas tipo. Y hoy te voy a mostrar los 6 problemas más comunes:

  1. Distinguir si un grupo es diferente a otro. Por ejemplo “ver si la presión arterial es más alta en un grupo de pacientes con obesidad y los que no” Por un lado tienes la variable numérica (presión arterial) y por el otro grupos de pacientes (con o sin obesidad)
  2. Distinguir si las proporciones son diferentes de un grupo al otro. Por ejemplo: “¿La proporción de accidentes de moto es diferente por rangos de edad 15-20, 20-25, 25-30 y 30-35?” Tenemos 4 proporciones que queremos comparar.
  3. Ver si los grupos tienen relación en la tabla de contingencias. Por ejemplo “¿Hay relación en cuanto a la precisión (buena, regular, mala) de un aparato de medida analógico y uno óptico?” En el fondo, es relacionar variables cualitativas.
  4. Analizar si hay relación entre variables numéricas. La asociación entre medidas. Por ejemplo “Tienes datos de 200 familias sobre las ganancias y los gastos. ¿Es verdad que se cumple que cuánto más tienes más gastas?”
  5. Calcular un modelo matemático que permita predecir una variable en función de otras. Por ejemplo “Un modelo que te permita calcular la frecuencia cardíaca máxima en función de datos como la edad, la presión baja y alta, el sexo, la altura y el peso”
  6. Técnicas avanzadas de reconocimiento de patrones o machine learningModelos y algoritmos predictivos para poder aportar respuestas de tus datos y solucionar problemas reales con aplicaciones personalizadas para  tu caso.

 

Estos problemas se pueden resolver con diferentes técnicas estadísticas. Y muchas de estas técnicas siguen la estrategia más famosa: el contraste de hipótesis. En este formulario te puedes descargar una guía dónde te explico paso por paso esta estrategia tan común y tan complicada de entender al inicio:

Accede a la guía PDF "Las 6 Técnicas Estadísticas" y al curso gratuito "Pro Statistics"

Con este material vas a descubrir:

  • Cómo  analizar los datos para justificar tus hipótesis y resultados de tus proyectos
  • Una método para aplicar la estadística en tus datos para poder presentar tus estudios con éxito delante de la comunidad científica
  • Aportar resultados estadísticamente relevantes para demostrar con seguridad tus hipótesis

¿Qué software utilizo y cómo aprendo a manejarlo?

Uno de los puntos más importantes es saber aplicar los conceptos y técnicas estadísticos con datos reales. Es la magia de la estadística aplicada. Existen mucho softwares. Unos comerciales otros no. Y la decisión puede parecer difícil pero no lo es.

Para mi el software que me ha aportado mayor beneficios a medio plazo ha sido R con RStudio. ¿Por qué? Por estos motivos:

  1. Primero, porque es gratuito.
  2. Segundo, porque es un software consolidado con una comunidad enorme. Con más peso tanto dentro de los centros de investigación como en las empresas.​
  3. Y tercero, porque una vez superas la curva inicial de aprendizaje, ​puedes seguir creciendo en modo DIY. ¡Y no habrá quien te pare!

Y es posible que pienses que es sólo para programadores porque hace uso de comandos. Pero no es del todo cierto. Si posees las plantillas de código tipo puedes realizar análisis estadísticos muy rápidos y eficaces sin aprender la estructura de programación.

Pero no te voy a engañar, si quieres utilizar este programa a un nivel avanzado necesitarás utilizar la programación para aprovechar todo su potencial del software.

Aquí tienes un artículo que te va a ayudar a empezar con R y entender el potencial de esta herramienta.

# ¿Cómo analizar datos como un pro? La metodología probada paso a paso

¡Y este es el secreto que quería desvelarte hoy! Y para entender este secreto me he querido asegurar de englobar los aspectos básicos en el funcionamiento de un proyecto de análisis de datos. Por este motivo, te he explicado los puntos del principio 😉 

Este secreto es un método paso a paso. Una metodología de aplicación.

Son los 4 pasos que, por mi experiencia, se van repitiendo en cualquier proceso de análisis de datos.  Y hoy, te los voy a desvelar:

# PASO1. Define UN objetivo para tu estudio (y sólo uno)

En este paso vas a definir un objetivo de tu estudio y SÓLO uno. El ser humano tiende a complicarse (yo el primero) es muy importante focalizar los esfuerzos en un sólo objetivo. Defínelo siguiendo estos puntos:

  1. ¿Qué problema quiero solucionar con estos datos?
  2. ¿Qué significan las variables?
  3. ¿Qué tipo de variables tienes?
  4. Definir 1 objetivo y sólo 1 que ayude a solucionar el problema que has definido en el punto 1

 

# PASO2. Explorar los datos a lo Sherlock Holmes

Me gusta Holmes. Porque es capaz de ordenar toda la información de diferentes escenas y sospechosos para poder aclarar el lío inicial.

Antes que Sherlock Holmes sepa quién es el asesino, Holmes explora diferentes escenas: busca objetos, interroga a los sospechosos y los presentes, etc. “Explora” con su lupa lugares inverosímiles. Consigue un listado de objetos y hechos relevantes. Después los analiza para atar cabos y encontrar el culpable.

Y nosotros vamos a hacer lo mismo. Primero de todo exploraremos y después analizaremos.

La etapa de descripción se compone de estos puntos:

  1. Crea los gráficos más apropiados
  2. Interpreta los gráficos
  3. Encuentra tus primeros indicios. Tus primeras preconclusiones
  4. Lista por orden de importancia los indicios que han desvelado los gráficos

Esta paso es fundamental y muy muy importante.

Podrás recoger información muy útil de tu tabla de datos y la listarás por orden de importancia.

El conocimiento de las herramientas gráficas de la estadística descriptiva es muy importante. Si accedes al bonus te voy a desvelar los gráficos más utilizados en la práctica ordenados caso por caso en el curso Pro Statiscs 🙂 

Curso Gratuito de Estadística + Guía PDF

Con este material vas a descubrir:

  • Cómo utilizar el contraste de hipótesis para responder a tus preguntas como investigador
  • Clarificar conceptos estadísticos que te servirán en el 95% de tus estudios e investigaciones
  • Utilizar una metodología para analizar los datos de tus investigaciones y poder presentar los resultados con éxito

# PASO3. Analiza los datos con un software y un mapa

Ahora es momento de decidir si tus preconclusiones son ciertas o no. Te vas a apoyar de la estadística inferencial y de estrategias estadísticas.

Para hacerlo necesitas dos cosas:

  • Conocimiento de un mapa de técnicas estadísticas
  • Cómo aplicar estas técnicas con un software

Los puntos necesarios en este paso son:

  1. Encuentra las técnicas más apropiadas para corroborar las preconclusiones con la ayuda de un mapa
  2. Diseña la metodología de análisis
  3. Aplica esta metodología
  4. Resume los resultados

El conocimiento de las técnicas estadísticas y tu experiencia juegan un gran papel en esta etapa.

Si quieres más puedes encontrar 6 técnicas estadísticas más utilizadas en la práctica que te ayudarán a amplicar el conocimiento de las técnicas.

Accede a la guía PDF "Las 6 Técnicas Estadísticas" y al curso gratuito "Pro Statistics"

Con este material vas a descubrir:

  • Cómo  analizar los datos para justificar tus hipótesis y resultados de tus proyectos
  • Una método para aplicar la estadística en tus datos para poder presentar tus estudios con éxito delante de la comunidad científica
  • Aportar resultados estadísticamente relevantes para demostrar con seguridad tus hipótesis

 

# PASO4. Crear el informe final listando conclusiones cristalinas

Es el último y muy importante. Saber comunicar tus hallazgos delante de tu audiencia. Es un proceso muy, muy importante. Los datos sólo son útiles si se muestran los resultados de forma cristalina.

Me ha pasado que en ocasiones no he sabido transmitir la importancia de mis resultados y conclusiones. Y, ¡es el resultado final lo que importa! Te he preparado 6 puntos que todo informe o presentación debe incluir:

  1. Contextualiza tu estudio
  2. Cita la problemática
  3. Define tu objetivo alineado al problema que quieres resolver
  4. Muestra la información escondida (etapa de exploración)
  5. Define tu metodología de análisis (etapa de análisis)
  6. Muestra los resultados (etapa de análisis)
  7. Resume las conclusiones
  8. Problemas encontrados durante el estudio y siguientes pasos

 

# ¿Quieres más detalle de este método paso a paso?

Entender estos pasos fue de verdad una revelación. Seguir este orden me dió claridad y foco para aplicar la estadística de forma práctica sin complicarme con fórmulas complejas.

Como has visto requiere de conocimientos estadísticos y de manejo de softwares.

En mis principios utilicé R como software de aplicación y gracias a él tuve la oportunidad de acceder a en un buen puesto de trabajo en el departamento de I+D de un gran empresa de diseño de turbinas eólicas.

De verdad, recomiendo esta herramienta.

Puede ser que te interese entrar un poquito más en este método y entender paso a paso esta metodología y cómo aplicarla con R.

Si es así puedes echar un vistazo a los recursos exclusivos + mini curso incluido dónde resumo con la máxima claridad los pasos de la metodología y cómo empezar a utilizar R con éxito 🙂

Me hubiera encantado poder recibir esta descripción del método paso a paso cuando empecé. Espero que a ti también te haya sido útil.

Ya sabes que si quieres entrar en más profundidad puedes acceder aquí al mini curso estadística gratuito.

¡Un abrazo!

Acerca del autor

Jordi Olle Sanchez

Autor de ConceptosClaros.com. Ayuda a investigadores apasionados a aplicar estadística y análisis de datos en sus proyectos para catapultar su carrera investigadora y adaptarse a la era de los datos. Accede a los recursos gratuitos para aplicar estadística en tus datos

Interacciones del lector

Comentarios

  1. Necesito una metodología clara y sencilla que permita realizar un buen análisis de datos y estadísticas en salud

    • Hola Jorge,

      Una vez te suscribes encontrarás un link donde podrás descargarte las guías.
      Y en otros formularios te daré acceso con un email. Además de un curso gratuito.

      Abrazos

  2. Hola Jordi Ollé C2
    Ayudaria un curso de como enseñar la estadistica como una herramienta
    guiada por la nececidad y no como una herramienta esteril.

    Hay que conciderar como tema las estadisticas engañosas (envié Libro)

  3. Hola voy a hacer un proyecto de intervencion con un solo grupo son mujeres con edades de 35 a 45 años y estoy algo perdida con la estadistica si me orientaras seria genial, por favor


Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

  Acepto la política de privacidad

Responsable del fichero: Jordi Ollé Sánchez
Finalidad; envío de mis publicaciones así como correos comerciales.
La Legitimación; es gracias a tu consentimiento.
Destinatarios:Como usuario e interesado te informo que los datos que me facilitas estarán ubicados en los servidores de Webempresa (proveedor de hosting de Conceptos claros) dentro de la UE. Ver política de privacidad de Webempresa
Podrás ejercer Tus Derechos de Acceso, Rectificación, Limitación o Suprimir tus datos enviando un email a jordi @ conceptosclaros.com o ante la Autoridad de Control
Encontrarás más información en política de privacidad
Pro-statistics-Mockup-presentacion

Descárgate los recursos gratuitos y empieza a construir las bases para analizar los datos de tus proyectos de investigación