¿Qué es un Árbol de Decisión y cómo interpretarlo?

El Árbol de Decisión es una herramienta súper gráfica y poderosa para ayudarte a sacar patrones de tus datos.

Por ejemplo: en el campo de la salud, imagínate que quieres ver qué determinadas condiciones de un paciente hacen que sea un paciente de riesgo. Y qué combinación de esas características.

Y además lo verás en forma de “árbol” que te permitirá ver gráficamente esas combinaciones.

En el campo del deporte: qué características de un jugador hacen que sea propenso a lesionarse o no.

Ahora te cuento más en el artículo.

Es una herramienta muy fácil de utilizar y muy muy útil.

¿Qué es un árbol de decisión? … y para qué sirve (la clásica pregunta antes de empezar)

Para entenderlo te voy a poner tres ejemplos con los resultados del árbol de decisión de esta manera entenderás la utilidad y qué es de forma rápida.

El primer ejemplo:

Ejemplo 1: qué características o combinación de ellas te permite clasificar una especie de flor

Aquí el objetivo es ver si puedes encontrar una combinación de características que te permitan clasificar una especie de flor.

En este caso tienes variables de ancho y largo del pétalo y sépalo.

Y has observado datos de tres especies: versicolor, virginica y setosa.

El típico ejemplo de las flores “iris” jejeje

¿Es el ancho del pétalo más importante que el largo del pétalo?

O, ¿me debo fijar más con las variables de ancho que de largo de las flores?

Todo ello y mucho más lo puedes ver en un simple árbol:

¡Allá va el resultado!

Este es el árbol de decisión de este ejemplo.

El nombre de setosa, versicolor y virginica son las tres especies de flores que se analizan.

Entonces puedes interpretar tres camino de decisión:

  • Camino 1: la longitud del pétalo < 2.5 entonces lo más probable es que sea setosa
  • Camino 2: si la longitud del pétalo es mayor a 2.5 y el ancho del pétalo es menos a 1.8 entonces es versicolor
  • Camino 3: si la longitud del pétalo es mayor a 2.5 y el ancho del pétalo es mayor a 1.8 entonces es virginica

¿Se ve?

Esto es magnífico 🙂

La de resultados interesantes que puedes obtener.

Seguro que te vienen ideas para utilizar esta técnica en tus proyectos 🙂

Ejemplo 2: qué característica o combinación de ellas te permite clasificar la aparición de diabetes

En este caso es un ejemplo de embarazadas con diabetes y no diabetes y se trata de ver qué características de estas pacientes nos puedes ayudar a decidir la aparición de diabetes.

¡Buenísimo!

Y este es el árbol de decisión simplificado (no es el completo para que sea más visual de entender.

Tu mismo/a ya puedes descifrar este árbol de decisión.

También hay tres caminos.

 

Ejemplo 3: qué características o combinación de ellas te permite clasificar la supervivencia de un pasajero del famoso Titanic

El objetivo aquí es encontrar qué características de los pasajeros del Titanic fueron importantes en la supervivencia en el trágico accidente.

El resultado no te lo voy a desvelar aún…

Bueno va… aquí lo tienes.

Es el árbol completo que lo veremos en el vídeo de más abajo.

En el vídeo que tienes más adelante dónde te explico cómo ejecutar este mismo ejemplo con R.

¿Se ve la idea del árbol de clasificación?

Se trata de observar combinaciones de variables que nos permitan decidir en qué grupo podemos clasificar.

 

La estructura interna de un Árbol de Decisión 

Antes de enseñarte con la vídeo lección con R voy a compartir contigo la estructura de un Árbol a nivel de algoritmo.

Es la típica que ya conoces jejeje

Es un algoritmo con entradas y salida.

Las entradas corresponden a las características y la salida a la variable objetivo.

Ejemplo 1: Especies de flores

Ejemplo 2: Diabetes en embarazadas

Ejemplo 3: Supervivientes del Titanic

En los tres ejemplos puedes ver exactamente la misma estructura. Y es la que necesitas para poder ejecutar el árbol clasificador.

Con todo esto claro. ¿Qué te parece si te muestro un ejemplo en vídeo?

¡Vamos a ello!

Vídeo lección: el árbol de decisión del TITANIC 

¡Vamos a por más!

En el vídeo siguiente te muestro un ejemplo de TITANIC resuelto.

Te puedes descargar el código y los datos aquí.

En el vídeo vas a ver:

  • Qué es un Árbol de Decisión y para qué sirve
  • ¿Cómo se interpreta un Árbol de Decisión?
  • Un ejemplo de aplicación de un árbol clasificador con el típico ejemplo de TITANIC
Vídeo Lección: qué es un Árbol de Decisión con un ejemplo de R

DESCARGA EL EJEMPLO

Ahora te toca a ti.

¡Aplicarlo en tus datos 🙂 y jugar un rato!

Espero que te haya gustado el material que te he preparado y sobretodo que se entiende qué es un árbol de decisión.

Ahora es momento de empezar a aplicarlo a tus datos y proyectos.

1 fuerte abrazo

Scroll al inicio