tabla de contingencias

¿Qué es una tabla de contingencias y para qué sirve? Tutorial: cómo interpretar variables categóricas en menos de 5 minutos con Excel

 

Hoy quiero enseñarte a explorar datos que seguramente has visto alguna vez.

Y la herramienta principal para conseguirlo es la tabla de contingencias. Te explicaré qué es y para qué sirve esta tabla.

¿Sabes a qué tipo de datos me estoy refiriendo?

Sigue leyendo y podrás crear e interpretar tablas de contingencias en Excel en menos de 5 minutos. Incluye tutorial con 3 vídeos 😉

# Qué es una variable categórica y cómo interpretarla

Antes de nada quiero asegurarme de que entiendes qué es una tabla de datos, qué es una variable y qué es una observación.

Con esta imagen quiero darte la radiografía de una tabla de datos. Puedes distinguir:

  1. Variables: medidas de la realidad (columnas)
  2. Observaciones: las veces que mides las variables (filas)
  3. El header: nombres de las variables
  4. Los datos: son los valores de todas las variables de tu tabla

Una vez ya tienes en mente este esquema ya puedes pensar en el tipo de variables de las que quiero hablarte hoy: las variables categóricas.

Una variable categórica es una etiqueta. Expresa los nombres de las cosas.

Te pongo unos cuantos ejemplos para que me entiendas lo que quiero decir:

El país de procedencia. El género. Si es fumador o no fumador. Nombre del instituto

De los ejemplos anteriores hay una que me interesa remarcar. La categórica fumador y no fumador. Tienes dos grupos. Es una variable categórica dicotómica.

Categóricas dicotómicas: identifican 2 grupos. Por ejemplo:

Fumador o NO fumador. Masculino y femenino. Alto y bajo. Grande y pequeño

Categóricas politómicas: expresan muchos grupos. Por ejemplo:

País de procedencia. Nombres de universidades. Carrera estudiada. Cargo en una empresa

Un tipo especial de variables categóricas son las variables ordinales. Tienen un sentido de escala.

La calidad del servicio puede ser:

malo, regular, bueno, muy bueno

O la importancia de la enfermedad puede ser

leve, sin riesgo, grave, muy grave

A veces las variables categóricas pueden expresarse con números. Cada número identifica un grupo. Por ejemplo:

1 = masculino. 2 = femenino

Ahora ya sabes qué es una tabla de datos, cómo situar las variables, y qué es una variable categórica.

Estás listo para aprender cómo explorar (entender) las variables categóricas de manera efectiva con la ayuda de la tabla de contingencias y un software: Excel

Descubre cómo analizar los datos de tus proyectos con éxito.

Sin perder miles de horas descifrando fórmulas estadísticas incomprensibles.

# ¿Cómo hacer una tabla de contingencias con Excel, qué es y para qué sirve?

Para ir al grano y no enrollarme mucho te voy a poner un ejemplo dónde te voy a explicar:

  1. ¿Qué son los factores?
  2. ¿Qué son los grupos?
  3. ¿Qué es una tabla de contingencias o frecuencias? ¿Cómo la puedes crear en Excel?

Esta tabla de datos muestra dos variables categóricas inventadas. Te puedes descargar el ejemplo aquí.

Cada variable es un factor. En este caso tienes dos factores porque tienes dos variables categóricas.

Cada variable categórica tiene diferentes grupos. En este caso:

El factor “categoría 1” tiene los grupos:

A , E , F , I

El factor “categoría 2” tiene los grupos:

B , I , P , S

Ahora ya sabes qué es un factor y qué es un grupo. Reordenando tu tabla de datos puedes encontrar maravillas. Por ejemplo de la pareja F y P ¿cuántas observaciones aparecen en mi tabla de datos? Esta pregunta la puedes replicar con tantas parejas como quieras.

Al repetir este sencillo ejercicio, puedes resumir en una tabla las veces que tienes de cada pareja. Esto es la famosa tabla de contingencias.

Es una tabla resumen, resultado de contar todas las combinaciones posibles de cada pareja de factores.

El recuadro que ves en rojo corresponde a la celda del grupo E del factor “categoría 1” con el grupo I del factor “categoría 2”. ¿Se entiende?

  1. El valor de esta celda es la frecuencia absoluta. Son las veces que se repite la combinación E-I en tu tabla de datos.
  2. El total general de la parte inferior es la suma por filas.
  3. El total general de la derecha es la suma por columnas.

Si recuerdas en un histograma también trabajas con tablas de frecuencias (con variables numéricas). Es el mismo concepto que la tabla de contingencias.

Te recuerdo que la frecuencia es el número de observaciones de un determinado grupo.

Es un recuento. Como has visto es muy fácil hacerlo con Excel o cualquier programa estadístico.

Fíjate que cada casilla o celda como le quieras llamar, es el número de individuos de un grupo con el otro.

¡Tan fácil como esto! Esta es la magia de la estadística descriptiva. Te permite resumir las variables categóricas en algo más fácil de entender.

# Convirtiendo frecuencias: absoluta, relativa, condicionada

Como te decía, la frecuencia es el número de observaciones de cada grupo. El número absoluto es la frecuencia absoluta.

Pero puedes trabajar con porcentajes (relativas o proporciones). Es dividir por el número total de observaciones.

O trabajar con las distribuciones condicionadas que son la fila o la columna de la tabla de contingencias. Están sujetas a una condición.

Para que me entiendas mejor he creado un pequeño vídeo donde te explico cómo crear las tablas de frecuencias de frecuencias relativas y frecuencias condicionadas. Y qué significa cada tipo.

Para resumir los conceptos:

  1. Variable categórica: expresa una etiqueta. Cada etiqueta es un grupo.
  2. Los factores son las variables categóricas. Si tienes 2 variables categóricas tendrás dos factores.
  3. La frecuencia absoluta es el número de observaciones por cada grupo (o parejas de grupos)
  4. Las frecuencia relativa es una proporción. Un porcentaje. Es la frecuencia absoluta dividida por el número total de observaciones.
  5. Las frecuencias condicionadas son la fila o la columna de la tabla de contingencias. Son frecuencias que cumplen una condición de pertenencia de un grupo.

Descubre cómo analizar los datos de tus proyectos con éxito.

Sin perder miles de horas descifrando fórmulas estadísticas incomprensibles.

# Cómo explorar variables categóricas con la ayuda de gráficos y tablas de contingencias en Excel

Espero que te haya quedado mucho más claro qué es un tabla de contingencias, cómo puedes reordenar las variables categóricas, y las distintas maneras de calcular las frecuencias.

Ahora quiero que practiques con esta tabla de datos. En este vídeo tutorial te voy a enseñar cómo puedes explorar variables categóricas siguiendo 3 pasos:

  1. Tabla de contingencias de dos categóricas (2 factores)
  2. Gráficos de barra y de sectores
  3. Buscar combinaciones que te interesen entre variables categóricas

He trabajado en Excel porque puedes calcular fácilmente las tablas de contingencia con la ayuda de tablas dinámicas 🙂

Es bastante sencillo, ¡ya lo verás!

Hasta aquí el tutorial de cómo explorar variables categóricas en Excel. He explicado bastantes cositas en este post. Ya tienes material para practicar y para replicar estos conceptos con tus datos.

Descarga el Excel y ¡cuéntame si has podido aplicar lo que has aprendido!

¡Un abrazo!

 

8 comentarios en “¿Qué es una tabla de contingencias y para qué sirve? Tutorial: cómo interpretar variables categóricas en menos de 5 minutos con Excel”

  1. Jose A. Farfán-Ale

    Hola Jordi, Saludos desde Mexico.
    Gracias por la información, es muy util, pero se me hace muy confusa. Los videos son buenos pero para mi no hay nada como la info escrita.
    Te agradeceré pongas en unos documentos los puntos claves de los videos, como te dije anteriormente, soy médico y me es dificil sentarme a ver los videos y a veces, ir a material que ya nos enviaste.
    Mi respetuosa sugerencia, es poner un orden en el material que amablemente nos envias.

    Saludos y bendiciones
    José Arturo
    México

    1. Gracias Dr. Jose por tus comentarios y sugerencias!
      Es buena idea lo de poner los puntos que explico en los vídeos!
      Intentaré hacerlo si el tiempo me lo permite
      1 fuerte abrazo!

  2. GILMA TACHE ARDILA

    Hola Jordi
    mi nombre es Gilma soy de Colombia y también soy médico , te cuento que tu blog es maravilloso me ha ayudado de manera grandiosa a entender y poder desenredar mis datos para poder terminar mi artículo, te confieso que te he leído mucho porque como decía el Dr. José la información hay que organizarla y buscar la que mas se nos acomode a nuestras necesidades inmediatas, por ejemplo este post que me acabo de leer donde prácticamente responde a mi pregunta mas inquietante como organizar todos los conocimientos y poderlos poner en practica con la herramienta que tengo a mano en el momento que es excel, pero comprendo también como es tu negocio no siempre hay que dar toda la información de una vez para dejar esa necesidad de querer mas conocimiento y adquirir tu curso. Pero celebro tu voluntad de querer ayudar a otras personas y guiarlas en este proceso mediante estos post que me parecen maravillosos y con los que he aprendido demasiado; Me pareces una persona muy inteligente y con gran capacidad de transmitir el conocimiento que tienes de una manera sencilla y humilde. Dios te siga bendiciendo y llenando de éxitos y aunque no pude adquirir tu curso te agradezco toda la ayuda que me has brindado a través de tu pagina y te haré mas propaganda que la que se le hace a la coca-cola por la tele. Personas como tú dispuestas a ayudar son las que más se necesitan en este mundo, te deseo lo mejor, que se resten tus dificultades, se dividan tus preocupaciones, te sumen muchas bendiciones y tus éxitos se multipliquen elevados a la potencia de 10.

Los comentarios están cerrados.

Scroll al inicio