Glosario IA
El diccionario completo de la Inteligencia Artificial
Embedding de Entidad
Técnica de representación vectorial que transforma variables categóricas en vectores densos de baja dimensión, capturando sus relaciones semánticas y similitudes dentro de un espacio continuo.
Codificación de Características Categóricas
Proceso de conversión de variables categóricas en formato numérico adecuado para modelos de machine learning, incluyendo métodos como one-hot, label encoding y entity embeddings.
Dimensión del Embedding
Tamaño del vector que representa cada entidad categórica, un hiperparámetro crucial que equilibra la capacidad de expresión del modelo y el riesgo de sobreajuste.
Representación Aprendida
Representación vectorial de datos adquirida automáticamente por el modelo durante el entrenamiento, optimizada para la tarea específica sin intervención manual de ingeniería de características.
Matriz de Embedding
Matriz de pesos que contiene todos los vectores de embedding para una variable categórica dada, donde cada fila corresponde a la representación vectorial de una categoría.
Características de Alta Cardinalidad
Variables categóricas con un gran número de valores únicos, donde los entity embeddings superan significativamente los métodos de codificación tradicionales como one-hot.
Inicialización del Embedding
Estrategia de inicialización de los pesos de la capa de embedding, influyendo en la velocidad de convergencia y la calidad final de las representaciones aprendidas por el modelo.
Regularización del Embedding
Técnicas como L2 o dropout aplicadas específicamente a las capas de embedding para prevenir el sobreajuste y mejorar la generalización de las representaciones vectoriales.
Visualización de Embeddings
Técnicas como t-SNE o UMAP para proyectar espacios de embedding de alta dimensión a 2D/3D, permitiendo el análisis visual de las relaciones y clústeres entre categorías.
Embeddings Multi-entidad
Enfoque avanzado donde entidades de diferentes variables categóricas comparten un espacio de embedding común, capturando complejas relaciones inter-categóricas.
Transferencia de Aprendizaje de Embeddings
Reutilización de entity embeddings pre-entrenados en una tarea fuente para mejorar el rendimiento en una tarea objetivo similar con menos datos de entrenamiento.
Topología del Espacio de Embedding
Estructura geométrica y relaciones de vecindad en el espacio de embedding, reflejando la jerarquía y similitudes implícitas entre las categorías originales.
Convergencia de Embeddings
Estabilización de los vectores de embedding durante el entrenamiento, indicando que el modelo ha aprendido representaciones coherentes y óptimas para las entidades categóricas.
Flujo de Gradiente de Embeddings
Propagación del gradiente a través de la capa de embedding durante la retropropagación, mecanismo por el cual las representaciones vectoriales se optimizan para minimizar la pérdida.
Dispersión de Embeddings
Propiedad de los espacios de embedding donde ciertos vectores pueden contener muchos ceros, a veces introducida intencionadamente para mejorar la eficiencia computacional.
Interpolación de Embeddings
Capacidad de los espacios de embedding para representar conceptos intermedios mediante combinación lineal de vectores existentes, demostrando la continuidad semántica de la representación.