Glosario IA
El diccionario completo de la Inteligencia Artificial
Clasificación de Flujos
Proceso de asignación de etiquetas predefinidas a las instancias de datos que llegan secuencialmente en un flujo continuo, sin posibilidad de revisitar los datos anteriores. Esta técnica permite clasificar datos en tiempo real mientras se adapta a los cambios dinámicos de las distribuciones.
Árbol de Hoeffding
Algoritmo de árbol de decisión incremental que construye un modelo a partir de un flujo de datos utilizando la desigualdad de Hoeffding para decidir cuándo dividir un nodo. Garantiza que el árbol construido es asintóticamente idéntico al construido sobre datos por lotes con una probabilidad controlable.
Minería de Flujos de Datos
Dominio de estudio de algoritmos y técnicas para extraer conocimiento a partir de flujos de datos continuos y potencialmente infinitos. Estos algoritmos deben procesar los datos en una sola pasada con recursos de memoria y computacionales limitados.
Aprendizaje Incremental
Paradigma de aprendizaje donde el modelo se actualiza continuamente a medida que nuevos datos están disponibles, sin requerir un reentrenamiento completo. Este enfoque es esencial para sistemas que evolucionan en entornos dinámicos con flujos de datos continuos.
Evolución de Conceptos
Fenómeno distinto del cambio de concepto donde nuevas clases emergen en el flujo de datos a lo largo del tiempo. La detección de la evolución de conceptos es crítica para mantener la relevancia de los modelos de clasificación en entornos donde las etiquetas pueden evolucionar.
Métodos de Conjunto para Flujos
Técnicas que combinan varios clasificadores para mejorar el rendimiento y la robustez en la clasificación de flujos de datos. Estos métodos incluyen bagging adaptativo, boosting en línea y enfoques basados en la diversidad para gestionar eficazmente el cambio de concepto.
VFDT (Árbol de Decisión Muy Rápido)
Algoritmo pionero de árbol de decisión para flujos de datos que utiliza la desigualdad de Hoeffding para garantizar decisiones estadísticamente válidas con un número mínimo de instancias. Constituye la base de muchos algoritmos modernos de clasificación de flujos.
Método de Detección de Cambio (DDM)
Técnica estadística para detectar el cambio de concepto mediante el monitoreo de la tasa de error del clasificador y sus variaciones. Utiliza límites de confianza basados en la distribución binomial para identificar cuándo el rendimiento del modelo se degrada significativamente.
K-Vecinos Más Cercanos para Flujos
Adaptación del algoritmo KNN para flujos de datos utilizando estructuras de datos eficientes como kd-trees o LSH para mantener consultas de vecindad rápidas. Estos métodos deben manejar la evolución de los datos y las restricciones de memoria inherentes a los flujos.
Naive Bayes para Flujos
Versión incremental del clasificador Naive Bayes que actualiza las probabilidades condicionales a medida que llegan nuevas instancias en el flujo. Este algoritmo es particularmente eficiente para flujos de datos de alta dimensionalidad gracias a su complejidad computacional lineal.
Funciones de Decaimiento Temporal
Mecanismos que asignan pesos decrecientes a las instancias más antiguas en un flujo para dar mayor importancia a los datos recientes. Estas funciones son esenciales para adaptar los modelos a cambios graduales y mantener su relevancia temporal.
Minería de Flujos Consciente de Recursos
Enfoque de clasificación de flujos que adapta dinámicamente el uso de recursos computacionales y de memoria según las restricciones y la carga del sistema. Permite mantener rendimientos aceptables incluso bajo limitaciones estrictas de recursos.
Evaluación Prequencial
Metodología de evaluación específica para flujos de datos donde cada instancia se utiliza primero para probar el modelo antes de ser usada para entrenarlo. Este enfoque 'probar luego entrenar' proporciona una medida realista del rendimiento sobre datos no estacionarios.