Árboles de Decisión

📖

términos

Árbol de Decisión

Modelo predictivo supervisado que utiliza una estructura arbórea para modelar las decisiones y sus posibles consecuencias a través de una serie de pruebas sobre las características de los datos.

📖

términos

Nodo Raíz

Punto de partida de un árbol de decisión que representa el conjunto completo de datos de entrenamiento y contiene la primera división basada en la característica más discriminante.

📖

términos

Nodo Interno

Nodo intermedio en un árbol de decisión que representa una prueba sobre una característica específica y divide los datos en subconjuntos homogéneos.

📖

términos

Hoja

Nodo terminal de un árbol de decisión que representa una decisión final o una predicción de clase, sin ninguna división posterior posible.

📖

términos

Criterio de División

Método cuantitativo utilizado para evaluar la calidad de una división en un árbol de decisión, con el objetivo de maximizar la homogeneidad de los subconjuntos resultantes.

📖

términos

Entropía

Medida matemática del desorden o la incertidumbre en un conjunto de datos, utilizada para cuantificar la impureza de un nodo en los árboles de decisión.

📖

términos

Ganancia de Información

Métrica que mide la reducción de entropía obtenida al dividir un nodo según una característica específica, utilizada para seleccionar la mejor división.

📖

términos

Índice de Gini

Medida de impureza que varía entre 0 y 1, calculando la probabilidad de que un elemento elegido al azar sea clasificado incorrectamente, alternativa a la entropía en los árboles de decisión.

📖

términos

Poda

Técnica de reducción de la complejidad de un árbol de decisión eliminando las ramas que aportan poco poder predictivo para evitar el sobreajuste.

📖

términos

Sobreajuste

Fenómeno donde un modelo aprende excesivamente los detalles y el ruido de los datos de entrenamiento en detrimento de su capacidad de generalización en nuevos datos.

📖

términos

Profundidad del Árbol

Número máximo de divisiones desde el nodo raíz hasta una hoja, parámetro crucial que controla la complejidad y el sesgo del modelo.

📖

términos

CART

Algoritmo de Clasificación y Árboles de Regresión (Classification and Regression Trees) que construye árboles binarios utilizando el índice de Gini como criterio de división para la clasificación.

📖

términos

ID3

Algoritmo pionero de árboles de decisión que utiliza la ganancia de información como criterio de división, limitado a variables categóricas y divisiones binarias.

📖

términos

C4.5

Mejora del algoritmo ID3 que utiliza la ratio de ganancia de información para evitar el sesgo hacia las características con muchos valores.

📖

términos

Variable Objetivo

Variable a predecir en un problema de aprendizaje supervisado, representada por las hojas terminales del árbol de decisión.

📖

términos

Regla de Decisión

Conjunto lógico de condiciones SI-ENTONCES (IF-THEN) extraído de un camino en el árbol de decisión, que permite interpretar y explicar las predicciones del modelo.

📖

términos

Importancia de las Variables

Medida cuantitativa de la contribución de cada característica predictiva en la mejora de la pureza de las divisiones a lo largo del árbol.

📖

términos

Coste de Complejidad

Parámetro de poda que penaliza el tamaño del árbol, equilibrando el ajuste a los datos y la simplicidad del modelo para optimizar la generalización.

Glosario IA

Árbol de Decisión

Nodo Raíz

Nodo Interno

Hoja

Criterio de División

Entropía

Ganancia de Información

Índice de Gini

Poda

Sobreajuste

Profundidad del Árbol

CART

ID3

C4.5

Variable Objetivo

Regla de Decisión

Importancia de las Variables

Coste de Complejidad

No se encontraron resultados