Glosario IA
El diccionario completo de la Inteligencia Artificial
CF Tree (Clustering Feature Tree)
Estructura de datos de árbol en el corazón de BIRCH, que almacena resúmenes estadísticos (Características de Clustering) en sus nodos para representar de forma compacta subclústeres.
Clustering Feature (CF)
Un triplete (N, LS, SS) que resume estadísticamente un subclúster, donde N es el número de puntos, LS la suma lineal de los puntos y SS la suma de los cuadrados de los puntos.
Seuil de diamètre (Threshold)
Parámetro de BIRCH que define el diámetro máximo de un subclúster en una hoja del árbol CF, controlando la granularidad del resumen de clustering.
Facteur de branchement (Branching Factor)
Parámetro que limita el número de entradas (hijos) por nodo en el árbol CF, influyendo en el tamaño y la forma del árbol para optimizar el rendimiento.
Micro-clustering
Fase inicial de BIRCH donde los puntos de datos se organizan en microclústeres, representados por las entradas de las hojas del árbol CF.
Macro-clustering
Fase final de BIRCH que aplica un algoritmo de clustering (como K-Means) sobre los microclústeres (hojas del árbol CF) para generar los clústeres finales.
Résumé incrémental
Capacidad de BIRCH de actualizar el árbol CF con nuevos puntos de datos sin necesidad de recalcular completamente desde el principio, ideal para flujos de datos.
Distance additive CF (CF Additive Distance)
Métrica de distancia utilizada en BIRCH para medir la proximidad entre dos Características de Clustering (CF), calculable directamente a partir de sus resúmenes estadísticos sin acceder a los puntos originales.
Entrada de hoja (Leaf Entry)
Elemento de una hoja del árbol CF que representa un micro-clúster, conteniendo un Clustering Feature y un puntero hacia el nodo siguiente en la lista enlazada de hojas.
Lista enlazada de hojas (Leaf Linked List)
Estructura en el árbol CF que conecta todas las hojas para un barrido secuencial eficiente durante la fase de macro-clustering.
Absorción de un punto (Point Absorption)
Proceso en BIRCH donde un nuevo punto de datos se integra en el micro-clúster más cercano si la adición no excede el umbral de diámetro.
División de un nodo (Node Splitting)
Mecanismo activado en BIRCH cuando la inserción de un punto haría exceder el umbral de diámetro o el factor de ramificación, dividiendo el nodo para mantener las restricciones.
Fase de reconstrucción (Rebuilding Phase)
Paso opcional en BIRCH donde el árbol CF se reconstruye con un umbral de diámetro más bajo para aumentar la precisión del clustering antes de la fase final.
Costo computacional incremental
Ventaja clave de BIRCH, donde el costo para insertar un punto de datos es logarítmico con respecto al número de puntos, haciendo que el algoritmo sea muy escalable.
Resumen de clúster (Cluster Summary)
Concepto fundamental de BIRCH donde un grupo de puntos se representa por un resumen estadístico (el CF) en lugar de por los puntos individuales, reduciendo el espacio de memoria.