Glosario IA
El diccionario completo de la Inteligencia Artificial
Ganancia de información
Métrica cuantitativa que mide la reducción de entropía obtenida al particionar un conjunto de datos según un atributo específico, utilizada por ID3 para seleccionar el atributo óptimo de división en cada nodo del árbol.
Entropía de Shannon
Medida matemática de la incertidumbre o desorden en un conjunto de datos, calculada como la suma negativa de las probabilidades multiplicadas por su logaritmo binario, que sirve de base para el cálculo de la ganancia de información en ID3.
Atributo de división
Variable seleccionada en un nodo dado para particionar el conjunto de datos en subconjuntos más homogéneos, elegida por ID3 basándose en la ganancia de información máxima entre todos los atributos disponibles.
Nodo hoja
Nodo terminal del árbol de decisión ID3 que no contiene subdivisiones adicionales, representando una decisión final o una clasificación basada en la clase mayoritaria de las muestras contenidas en este nodo.
Ratio de ganancia de información
Variante de la ganancia de información normalizada por la entropía intrínseca del atributo, introducida para corregir el sesgo de ID3 hacia los atributos con muchos valores posibles.
Conjunto de entrenamiento
Subconjunto de datos utilizado por ID3 para construir el árbol de decisión, que contiene ejemplos etiquetados que permiten al algoritmo aprender las relaciones entre atributos y clases objetivo.
Predicción de clase
Proceso de clasificación en ID3 donde una nueva muestra atraviesa el árbol desde la raíz hasta una hoja, siendo la clase predicha aquella asociada al nodo hoja alcanzado según las pruebas de atributos sucesivas.
Profundidad del árbol
Número máximo de ramas atravesadas desde la raíz hasta cualquier hoja en el árbol ID3, influyendo directamente en la complejidad del modelo y su capacidad para capturar patrones en los datos.
Criterio de pureza
Medida de homogeneidad de las clases en un nodo, donde un nodo perfectamente puro contiene muestras de una sola clase, sirviendo como base para la evaluación de la calidad de las particiones en ID3.
Variables explicativas
Conjunto de atributos utilizados por ID3 para construir el árbol de decisión, cada uno siendo evaluado por su potencial de división basado en su capacidad para reducir la incertidumbre respecto a la variable objetivo.