tabla de contingencias

¿Qué es una tabla de contingencias y para qué sirve? Tutorial: cómo interpretar variables categóricas en menos de 5 minutos con Excel

tabla de contingencias

Hoy quiero enseñarte a explorar datos que seguramente has visto alguna vez.

Y la herramienta principal para conseguirlo es la tabla de contingencias. Te explicaré qué es y para qué sirve esta tabla.

¿Sabes a qué tipo de datos me estoy refiriendo?

Sigue leyendo y podrás crear e interpretar tablas de contingencias en Excel en menos de 5 minutos. Incluye tutorial con 3 vídeos 😉

# Qué es una variable categórica y cómo interpretarla

Antes de nada quiero asegurarme de que entiendes qué es una tabla de datos, qué es una variable y qué es una observación.

Con esta imagen quiero darte la radiografía de una tabla de datos. Puedes distinguir:

  1. Variables: medidas de la realidad (columnas)
  2. Observaciones: las veces que mides las variables (filas)
  3. El header: nombres de las variables
  4. Los datos: son los valores de todas las variables de tu tabla

Una vez ya tienes en mente este esquema ya puedes pensar en el tipo de variables de las que quiero hablarte hoy: las variables categóricas.

Una variable categórica es una etiqueta. Expresa los nombres de las cosas.

Te pongo unos cuantos ejemplos para que me entiendas lo que quiero decir:

El país de procedencia. El género. Si es fumador o no fumador. Nombre del instituto

De los ejemplos anteriores hay una que me interesa remarcar. La categórica fumador y no fumador. Tienes dos grupos. Es una variable categórica dicotómica.

Categóricas dicotómicas: identifican 2 grupos. Por ejemplo:

Fumador o NO fumador. Masculino y femenino. Alto y bajo. Grande y pequeño

Categóricas politómicas: expresan muchos grupos. Por ejemplo:

País de procedencia. Nombres de universidades. Carrera estudiada. Cargo en una empresa

Un tipo especial de variables categóricas son las variables ordinales. Tienen un sentido de escala.

La calidad del servicio puede ser:

malo, regular, bueno, muy bueno

O la importancia de la enfermedad puede ser

leve, sin riesgo, grave, muy grave

A veces las variables categóricas pueden expresarse con números. Cada número identifica un grupo. Por ejemplo:

1 = masculino. 2 = femenino

Ahora ya sabes qué es una tabla de datos, cómo situar las variables, y qué es una variable categórica.

Estás listo para aprender cómo explorar (entender) las variables categóricas de manera efectiva con la ayuda de la tabla de contingencias y un software: Excel

# ¿Cómo hacer una tabla de contingencias con Excel, qué es y para qué sirve?

Para ir al grano y no enrollarme mucho te voy a poner un ejemplo dónde te voy a explicar:

  1. ¿Qué son los factores?
  2. ¿Qué son los grupos?
  3. ¿Qué es una tabla de contingencias o frecuencias? ¿Cómo la puedes crear en Excel?

Esta tabla de datos muestra dos variables categóricas inventadas. Te puedes descargar el ejemplo aquí.

Cada variable es un factor. En este caso tienes dos factores porque tienes dos variables categóricas.

Cada variable categórica tiene diferentes grupos. En este caso:

El factor “categoría 1” tiene los grupos:

A , E , F , I

El factor “categoría 2” tiene los grupos:

B , I , P , S

Ahora ya sabes qué es un factor y qué es un grupo. Reordenando tu tabla de datos puedes encontrar maravillas. Por ejemplo de la pareja F y P ¿cuántas observaciones aparecen en mi tabla de datos? Esta pregunta la puedes replicar con tantas parejas como quieras.

Al repetir este sencillo ejercicio, puedes resumir en una tabla las veces que tienes de cada pareja. Esto es la famosa tabla de contingencias.

Es una tabla resumen, resultado de contar todas las combinaciones posibles de cada pareja de factores.

El recuadro que ves en rojo corresponde a la celda del grupo E del factor “categoría 1” con el grupo I del factor “categoría 2”. ¿Se entiende?

  1. El valor de esta celda es la frecuencia absoluta. Son las veces que se repite la combinación E-I en tu tabla de datos.
  2. El total general de la parte inferior es la suma por filas.
  3. El total general de la derecha es la suma por columnas.

Si recuerdas en un histograma también trabajas con tablas de frecuencias (con variables numéricas). Es el mismo concepto que la tabla de contingencias.

Te recuerdo que la frecuencia es el número de observaciones de un determinado grupo.

Es un recuento. Como has visto es muy fácil hacerlo con Excel o cualquier programa estadístico.

Fíjate que cada casilla o celda como le quieras llamar, es el número de individuos de un grupo con el otro.

¡Tan fácil como esto! Esta es la magia de la estadística descriptiva. Te permite resumir las variables categóricas en algo más fácil de entender.

# Convirtiendo frecuencias: absoluta, relativa, condicionada

Como te decía, la frecuencia es el número de observaciones de cada grupo. El número absoluto es la frecuencia absoluta.

Pero puedes trabajar con porcentajes (relativas o proporciones). Es dividir por el número total de observaciones.

O trabajar con las distribuciones condicionadas que son la fila o la columna de la tabla de contingencias. Están sujetas a una condición.

Para que me entiendas mejor he creado un pequeño vídeo donde te explico cómo crear las tablas de frecuencias de frecuencias relativas y frecuencias condicionadas. Y qué significa cada tipo.

Para resumir los conceptos:

  1. Variable categórica: expresa una etiqueta. Cada etiqueta es un grupo.
  2. Los factores son las variables categóricas. Si tienes 2 variables categóricas tendrás dos factores.
  3. La frecuencia absoluta es el número de observaciones por cada grupo (o parejas de grupos)
  4. Las frecuencia relativa es una proporción. Un porcentaje. Es la frecuencia absoluta dividida por el número total de observaciones.
  5. Las frecuencias condicionadas son la fila o la columna de la tabla de contingencias. Son frecuencias que cumplen una condición de pertenencia de un grupo.

# Cómo explorar variables categóricas con la ayuda de gráficos y tablas de contingencias en Excel

Espero que te haya quedado mucho más claro qué es un tabla de contingencias, cómo puedes reordenar las variables categóricas, y las distintas maneras de calcular las frecuencias.

Ahora quiero que practiques con esta tabla de datos. En este vídeo tutorial te voy a enseñar cómo puedes explorar variables categóricas siguiendo 3 pasos:

  1. Tabla de contingencias de dos categóricas (2 factores)
  2. Gráficos de barra y de sectores
  3. Buscar combinaciones que te interesen entre variables categóricas

He trabajado en Excel porque puedes calcular fácilmente las tablas de contingencia con la ayuda de tablas dinámicas 🙂

Es bastante sencillo, ¡ya lo verás!

Hasta aquí el tutorial de cómo explorar variables categóricas en Excel. He explicado bastantes cositas en este post. Ya tienes material para practicar y para replicar estos conceptos con tus datos.

Descarga el Excel y ¡cuéntame si has podido aplicar lo que has aprendido!

¡Un abrazo!

 

Acerca del autor

Jordi Olle Sanchez

Autor de ConceptosClaros.com. Ayuda a investigadores apasionados a aplicar estadística y análisis de datos en sus proyectos para catapultar su carrera investigadora y adaptarse a la era de los datos. Accede a los recursos gratuitos para aplicar estadística en tus datos

Interacciones del lector

Comentarios

  1. Hola Jordi, Saludos desde Mexico.
    Gracias por la información, es muy util, pero se me hace muy confusa. Los videos son buenos pero para mi no hay nada como la info escrita.
    Te agradeceré pongas en unos documentos los puntos claves de los videos, como te dije anteriormente, soy médico y me es dificil sentarme a ver los videos y a veces, ir a material que ya nos enviaste.
    Mi respetuosa sugerencia, es poner un orden en el material que amablemente nos envias.

    Saludos y bendiciones
    José Arturo
    México

    • Gracias Dr. Jose por tus comentarios y sugerencias!
      Es buena idea lo de poner los puntos que explico en los vídeos!
      Intentaré hacerlo si el tiempo me lo permite
      1 fuerte abrazo!


Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

  Acepto la política de privacidad

Responsable del fichero: Jordi Ollé Sánchez
Finalidad; envío de mis publicaciones así como correos comerciales.
La Legitimación; es gracias a tu consentimiento.
Destinatarios:Como usuario e interesado te informo que los datos que me facilitas estarán ubicados en los servidores de Webempresa (proveedor de hosting de Conceptos claros) dentro de la UE. Ver política de privacidad de Webempresa
Podrás ejercer Tus Derechos de Acceso, Rectificación, Limitación o Suprimir tus datos enviando un email a jordi @ conceptosclaros.com o ante la Autoridad de Control
Encontrarás más información en política de privacidad
Pro-statistics-Mockup-presentacion

Reserva tu plaza para el Training Gratuito y descubre los pasos exactos para convertir tus datos en resultados de impacto en tu proyecto