que-es-un-arbol-de-decision

¿Qué es un Árbol de Decisión y cómo interpretarlo?

El Árbol de Decisión es una herramienta súper gráfica y poderosa para ayudarte a sacar patrones de tus datos.

Por ejemplo: en el campo de la salud, imagínate que quieres ver qué determinadas condiciones de un paciente hacen que sea un paciente de riesgo. Y qué combinación de esas características.

Y además lo verás en forma de “árbol” que te permitirá ver gráficamente esas combinaciones.

En el campo del deporte: qué características de un jugador hacen que sea propenso a lesionarse o no.

Ahora te cuento más en el artículo.

Es una herramienta muy fácil de utilizar y muy muy útil.

¿Qué es un árbol de decisión? … y para qué sirve (la clásica pregunta antes de empezar)

Para entenderlo te voy a poner tres ejemplos con los resultados del árbol de decisión de esta manera entenderás la utilidad y qué es de forma rápida.

El primer ejemplo:

Ejemplo 1: qué características o combinación de ellas te permite clasificar una especie de flor

Aquí el objetivo es ver si puedes encontrar una combinación de características que te permitan clasificar una especie de flor.

En este caso tienes variables de ancho y largo del pétalo y sépalo.

Y has observado datos de tres especies: versicolor, virginica y setosa.

El típico ejemplo de las flores “iris” jejeje

¿Es el ancho del pétalo más importante que el largo del pétalo?

O, ¿me debo fijar más con las variables de ancho que de largo de las flores?

Todo ello y mucho más lo puedes ver en un simple árbol:

¡Allá va el resultado!

Este es el árbol de decisión de este ejemplo.

El nombre de setosa, versicolor y virginica son las tres especies de flores que se analizan.

Entonces puedes interpretar tres camino de decisión:

  • Camino 1: la longitud del pétalo < 2.5 entonces lo más probable es que sea setosa
  • Camino 2: si la longitud del pétalo es mayor a 2.5 y el ancho del pétalo es menos a 1.8 entonces es versicolor
  • Camino 3: si la longitud del pétalo es mayor a 2.5 y el ancho del pétalo es mayor a 1.8 entonces es virginica

¿Se ve?

Esto es magnífico 🙂

La de resultados interesantes que puedes obtener.

Seguro que te vienen ideas para utilizar esta técnica en tus proyectos 🙂

Ejemplo 2: qué característica o combinación de ellas te permite clasificar la aparición de diabetes

En este caso es un ejemplo de embarazadas con diabetes y no diabetes y se trata de ver qué características de estas pacientes nos puedes ayudar a decidir la aparición de diabetes.

¡Buenísimo!

Y este es el árbol de decisión simplificado (no es el completo para que sea más visual de entender.

Tu mismo/a ya puedes descifrar este árbol de decisión.

También hay tres caminos.

Ejemplo 3: qué características o combinación de ellas te permite clasificar la supervivencia de un pasajero del famoso Titanic

El objetivo aquí es encontrar qué características de los pasajeros del Titanic fueron importantes en la supervivencia en el trágico accidente.

El resultado no te lo voy a desvelar aún…

Bueno va… aquí lo tienes.

Es el árbol completo que lo veremos en el vídeo de más abajo.

En el vídeo que tienes más adelante dónde te explico cómo ejecutar este mismo ejemplo con R.

¿Se ve la idea del árbol de clasificación?

Se trata de observar combinaciones de variables que nos permitan decidir en qué grupo podemos clasificar.

La estructura interna de un Árbol de Decisión 

Antes de enseñarte con la vídeo lección con R voy a compartir contigo la estructura de un Árbol a nivel de algoritmo.

Es la típica que ya conoces jejeje

Es un algoritmo con entradas y salida.

Las entradas corresponden a las características y la salida a la variable objetivo.

Ejemplo 1: Especies de flores

Ejemplo 2: Diabetes en embarazadas

Ejemplo 3: Supervivientes del Titanic

En los tres ejemplos puedes ver exactamente la misma estructura. Y es la que necesitas para poder ejecutar el árbol clasificador.

Con todo esto claro. ¿Qué te parece si te muestro un ejemplo en vídeo?

¡Vamos a ello!

Vídeo lección: el árbol de decisión del TITANIC 

¡Vamos a por más!

En el vídeo siguiente te muestro un ejemplo de TITANIC resuelto.

Te puedes descargar el código y los datos aquí.

En el vídeo vas a ver:

  • Qué es un Árbol de Decisión y para qué sirve
  • ¿Cómo se interpreta un Árbol de Decisión?
  • Un ejemplo de aplicación de un árbol clasificador con el típico ejemplo de TITANIC
Vídeo Lección: qué es un Árbol de Decisión con un ejemplo de R

DESCARGA EL EJEMPLO

Ahora te toca a ti.

¡Aplicarlo en tus datos 🙂 y jugar un rato!


Espero que te haya gustado el material que te he preparado y sobretodo que se entiende qué es un árbol de decisión.

Ahora es momento de empezar a aplicarlo a tus datos y proyectos.

1 fuerte abrazo

Acerca del autor

Jordi Olle Sanchez

Autor de ConceptosClaros.com. Ayuda a investigadores apasionados a aplicar estadística y análisis de datos en sus proyectos para catapultar su carrera investigadora y adaptarse a la era de los datos. Accede a los recursos gratuitos para aplicar estadística en tus datos

Interacciones con los lectores

Si te ha servido puedes comentar aquí ;)

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

  Acepto la política de privacidad

Responsable del fichero: Jordi Ollé Sánchez
Finalidad; envío de mis publicaciones así como correos comerciales.
La Legitimación; es gracias a tu consentimiento.
Destinatarios:Como usuario e interesado te informo que los datos que me facilitas estarán ubicados en los servidores de Webempresa (proveedor de hosting de Conceptos claros) dentro de la UE. Ver política de privacidad de Webempresa
Podrás ejercer Tus Derechos de Acceso, Rectificación, Limitación o Suprimir tus datos enviando un email a jordi @ conceptosclaros.com o ante la Autoridad de Control
Encontrarás más información en política de privacidad
6-tecnicas-Mockup-presentacion

Descubre cómo Analizar tus Datos con éxito y convertirte en Científico de Datos en tu sector