Glosario IA
El diccionario completo de la Inteligencia Artificial
Árbol de Decisión
Modelo predictivo supervisado que utiliza una estructura arbórea para modelar las decisiones y sus posibles consecuencias a través de una serie de pruebas sobre las características de los datos.
Nodo Raíz
Punto de partida de un árbol de decisión que representa el conjunto completo de datos de entrenamiento y contiene la primera división basada en la característica más discriminante.
Nodo Interno
Nodo intermedio en un árbol de decisión que representa una prueba sobre una característica específica y divide los datos en subconjuntos homogéneos.
Hoja
Nodo terminal de un árbol de decisión que representa una decisión final o una predicción de clase, sin ninguna división posterior posible.
Criterio de División
Método cuantitativo utilizado para evaluar la calidad de una división en un árbol de decisión, con el objetivo de maximizar la homogeneidad de los subconjuntos resultantes.
Entropía
Medida matemática del desorden o la incertidumbre en un conjunto de datos, utilizada para cuantificar la impureza de un nodo en los árboles de decisión.
Ganancia de Información
Métrica que mide la reducción de entropía obtenida al dividir un nodo según una característica específica, utilizada para seleccionar la mejor división.
Índice de Gini
Medida de impureza que varía entre 0 y 1, calculando la probabilidad de que un elemento elegido al azar sea clasificado incorrectamente, alternativa a la entropía en los árboles de decisión.
Poda
Técnica de reducción de la complejidad de un árbol de decisión eliminando las ramas que aportan poco poder predictivo para evitar el sobreajuste.
Sobreajuste
Fenómeno donde un modelo aprende excesivamente los detalles y el ruido de los datos de entrenamiento en detrimento de su capacidad de generalización en nuevos datos.
Profundidad del Árbol
Número máximo de divisiones desde el nodo raíz hasta una hoja, parámetro crucial que controla la complejidad y el sesgo del modelo.
CART
Algoritmo de Clasificación y Árboles de Regresión (Classification and Regression Trees) que construye árboles binarios utilizando el índice de Gini como criterio de división para la clasificación.
ID3
Algoritmo pionero de árboles de decisión que utiliza la ganancia de información como criterio de división, limitado a variables categóricas y divisiones binarias.
C4.5
Mejora del algoritmo ID3 que utiliza la ratio de ganancia de información para evitar el sesgo hacia las características con muchos valores.
Variable Objetivo
Variable a predecir en un problema de aprendizaje supervisado, representada por las hojas terminales del árbol de decisión.
Regla de Decisión
Conjunto lógico de condiciones SI-ENTONCES (IF-THEN) extraído de un camino en el árbol de decisión, que permite interpretar y explicar las predicciones del modelo.
Importancia de las Variables
Medida cuantitativa de la contribución de cada característica predictiva en la mejora de la pureza de las divisiones a lo largo del árbol.
Coste de Complejidad
Parámetro de poda que penaliza el tamaño del árbol, equilibrando el ajuste a los datos y la simplicidad del modelo para optimizar la generalización.