¿Qué técnica estadística usar según el tipo de variable? [Guía práctica con ejemplos]

¿Tienes dudas sobre qué análisis aplicar según tus datos? En este artículo vas a ver qué técnica usar en diferentes situaciones y te aseguro que lo verás un poco más claro cuando termines el artículo.

Es una de las preguntas más comunes de estudiantes, investigadores, técnicos y profesionales que trabajan con datos. Y tiene sentido: no basta con saber «que existe el test t» o «que Pearson mide correlaciones» si no sabes cuándo debes usarlos.

Este artículo te da justo eso: un mapa práctico para elegir la técnica adecuada según el tipo de variables que tengas y lo que quieras averiguar.

Al final te comparto una tabla resumen con todas las técnicas estadísticas y de machine learning supervisado y no supervisado, para que puedas usarla como referencia en todos tus proyectos.


El primer paso: identificar tu objetivo y tus variables

Antes de buscar qué técnica aplicar, hay que responder a dos preguntas esenciales:

  1. ¿Qué quiero saber? (Objetivo)
  2. ¿Qué tipo de variables tengo? (Numéricas, categóricas, ordinales…)

Con esto claro, ya puedes navegar el mapa de técnicas que te muestro a continuación.

Y como siempre digo, cuántas más técnicas conozcas mejores preguntas harás a tus datos. Así que si compredes las preguntas de las 12 técnicas que vas a ver en este artículo llegarás mucho más lejos que ahora.


Técnicas estadísticas clásicas

Comparación de medias o medianas

Objetivo: Comparar una variable numérica entre dos grupos.

  • Variables: Una categórica (2 grupos), una numérica.
  • Técnica:
    • t-Student: si hay normalidad
    • Mann-Whitney: si no hay normalidad
  • Ejemplo: Comparar la nota media de alumnos que duermen más de 6 horas vs menos.

Comparación de proporciones

Objetivo: Comparar proporciones entre grupos (por ejemplo, éxito/fracaso).

  • Variables: Dos categóricas.
  • Técnica:
    • Chi-cuadrado
    • Test exacto de Fisher (si hay valores bajos)
  • Ejemplo: ¿Hay más tasa de éxito en mujeres que en hombres?

Relación entre variables numéricas

Objetivo: Ver si dos variables se mueven juntas.

  • Variables: Dos numéricas.
  • Técnica:
    • Pearson: relación lineal y normalidad
    • Spearman: no normalidad o datos ordinales
    • Kendall: cuando hay empates frecuentes
  • Ejemplo: ¿Más horas de estudio se asocian a mejor nota?

Comparación entre más de dos grupos

Objetivo: Comparar una variable numérica en varios grupos.

  • Variables: Una categórica (>2 niveles), una numérica.
  • Técnica:
    • ANOVA: sin covariables
    • ANCOVA: con covariables (edad, peso…)
  • Ejemplo: ¿Influye el tipo de dieta en el rendimiento deportivo?

Modelado predictivo (estadística clásica)

Objetivo: Predecir un resultado o explicar una variable dependiente.

  • Variables: Una dependiente, varias independientes.
  • Técnica:
    • Regresión lineal: para variable numérica
    • Regresión logística: para variable binaria
  • Ejemplo: ¿Qué factores predicen el éxito académico?

Técnicas de Machine Learning Supervisado

Árboles de decisión

Objetivo: Clasificar o predecir con múltiples variables.

  • Variables: Mixtas (categóricas y numéricas).
  • Técnica:
    • Árboles de clasificación (si variable dependiente es categórica)
    • Árboles de regresión (si variable dependiente es numérica)
  • Ejemplo: ¿Qué combinación de variables predice el riesgo de abandono escolar?

Regresión regularizada (Ridge, Lasso, Elastic Net)

Objetivo: Mejorar modelos lineales cuando hay muchas variables o multicolinealidad.

  • Técnica:
    • Ridge: penaliza todos los coeficientes
    • Lasso: puede eliminar variables irrelevantes
    • Elastic Net: combinación de ambos
  • Ideal cuando: Tienes más variables que observaciones.

Técnicas de Machine Learning No Supervisado

PCA (Análisis de Componentes Principales)

Objetivo: Reducir dimensiones conservando la estructura.

  • Variables: Todas numéricas.
  • Técnica: PCA
  • Ejemplo: Agrupar perfiles de clientes según 10 variables de comportamiento.

Clustering (agrupamiento no supervisado)

Objetivo: Descubrir grupos ocultos sin variable objetivo.

  • Variables: Numéricas o categóricas transformadas.
  • Técnicas:
    • K-Means
    • DBSCAN
    • HDBSCAN
  • Ejemplo: ¿Qué grupos de pacientes aparecen según sus síntomas?

Reglas de asociación

Objetivo: Encontrar patrones de co-ocurrencia entre variables categóricas.

  • Técnica: Algoritmo Apriori o FP-Growth
  • Ejemplo: “Quien compra A y B suele comprar también C.”

Detección de anomalías

Objetivo: Identificar observaciones inusuales o errores.

  • Técnicas:
    • Isolation Forest
    • One-Class SVM
    • Autoencoders
  • Ejemplo: Detectar fraudes en operaciones bancarias.

Sistemas de recomendación

Objetivo: Sugerir elementos a usuarios basados en preferencias pasadas.

  • Técnicas:
    • Filtrado colaborativo
    • Filtrado basado en contenido
  • Ejemplo: ¿Qué artículos recomendar a un investigador en función de los que ya leyó?

Mapa de qué técnica estadística usar y técnicas de machine learning según el objetivo del análisis

A continuación tienes la tabla de técnicas de análisis de datos para que puedas entender qué técnica utilizar en cada situación con mini ejemplos simples.

Te sirve de guía para saber qué técnica estadística usar según el tipo de variable:

🎯 Objetivo🔢 Variables implicadas🧪 Técnica sugerida🕒 Cuándo usarla📌 Ejemplo aplicado
Comparar medias (2 grupos)1 categórica binaria + 1 numéricat-Student (si normal) / Mann-WhitneyComparar promedio entre 2 grupos¿Hay diferencia en la nota media entre hombres y mujeres?
Comparar proporciones2 categóricasChi-cuadrado / Test de FisherRelación entre categorías¿Aprobaron más mujeres que hombres en el examen?
Correlación (relación entre 2 variables)2 numéricas (o ordinales)Pearson / Spearman / KendallVer si dos variables se mueven juntas¿A más horas de estudio, mejor nota?
Comparar medias (>2 grupos)1 categórica (>2 niveles) + 1 numéricaANOVA / ANCOVAComparar promedio entre 3 o más grupos¿Qué tipo de dieta genera mejor rendimiento físico?
Predecir una variable numérica1 dependiente numérica + varias independientesRegresión linealPredicción de resultado continuo¿Influye el sueño y la dieta en el tiempo de carrera?
Predecir una variable categórica1 categórica + varias independientesRegresión logística / Árbol de decisiónClasificación binaria o múltiple¿Qué factores predicen el abandono académico?
Clasificación automática (no supervisada)Variables mixtas o numéricasClustering (K-means, DBSCAN)Agrupar sin variable objetivo¿Existen perfiles de usuarios según su comportamiento?
Reducción de dimensionalidadVariables numéricasPCA (Análisis de Componentes Principales)Visualizar o simplificar datos complejos¿Cómo agrupar a pacientes por 10 variables clínicas?
Detectar anomalíasVariables numéricas / mixtasIsolation Forest / One-Class SVMDetectar outliers o fraudes¿Qué clientes tienen patrones de compra inusuales?
Descubrir patrones de comportamientoÍtems categóricos / transaccionesReglas de asociación (Apriori, FP-Growth)Analizar co-ocurrencias o secuencias¿Qué síntomas suelen aparecer juntos?
Recomendaciones personalizadasUsuario + ítemsFiltrado colaborativo / ALS / KNNRecomendaciones automáticas¿Qué producto recomendar a cada usuario según su historial?

¿Te gustaría tener este mapa claro y aplicarlo en tus propios datos?

Entonces apúntate al training gratuito de Analiza tus Datos donde te enseño el mapa completo de técnicas estadísticas y cómo aplicarlo paso a paso según tus datos, sin fórmulas y con ejemplos reales.

Accede aquí al training gratuito

Scroll al inicio