Glosario IA
El diccionario completo de la Inteligencia Artificial
Transliteración
Proceso de conversión de un texto de un sistema de escritura a otro basado en la correspondencia fonética, esencial para sistemas multilingües que manejan lenguas con diferentes alfabetos como el árabe o el cirílico.
Modelos Multilingües (mBERT, XLM-R)
Transformadores preentrenados en vastos corpus paralelos o concatenados en numerosos idiomas, capaces de comprender y generar texto en más de 100 lenguas sin entrenamiento específico por idioma.
Ancla Lingüística (Language Anchor)
Estrategia de arquitectura que utiliza un idioma pivote (generalmente el inglés) como espacio de representación semántica común para facilitar la transferencia de información entre múltiples lenguas en un sistema de diálogo.
Pipeline de Procesamiento Multilingüe
Arquitectura secuencial que integra módulos especializados (detección de idioma, tokenización adaptada, modelos específicos) para gestionar las diferentes etapas del procesamiento del lenguaje natural en un contexto multilingüe.
Evaluación Multilingüe (BLEU, chrF)
Métricas de evaluación adaptadas a contextos multilingües que miden la calidad de traducciones o respuestas generadas, como chrF++ que es más sensible a las características morfológicas de diferentes lenguas.
Gestión de la Diversidad Cultural
Conjunto de técnicas que permiten a un sistema de diálogo adaptar sus respuestas no solo lingüísticamente sino también culturalmente, considerando normas sociales, referencias y contextos culturales específicos.
Modelos de Lenguaje Débilmente Supervisados Multilingües
Enfoques de entrenamiento que combinan grandes cantidades de datos no etiquetados en varios idiomas con anotaciones mínimas para construir sistemas robustos donde los datos supervisados son escasos.
Alineación de Espacios Semánticos Multilingües
Técnica de proyección de espacios vectoriales de diferentes lenguas en un espacio semántico común, permitiendo comparaciones directas de significado entre palabras y frases de idiomas diferentes.
Normalización Textual Multilingüe
Proceso de estandarización del texto que incluye la gestión de variaciones escriturales (simplificado/tradicional), diacríticos, mayúsculas y convenciones específicas de cada idioma para un tratamiento coherente.
Sistema de Diálogo Híbrido Multilingüe
Arquitectura que combina enfoques basados en reglas (para idiomas con pocos recursos) y modelos neuronales (para idiomas bien dotados) en un marco unificado para optimizar el rendimiento general.
Transferencia Interlingüística
Paradigma de traducción donde el texto fuente se convierte primero en una representación semántica intermedia independiente del idioma, y luego se genera en el idioma objetivo, facilitando las traducciones multilingües.
Retrotraducción (Back-Translation)
Técnica de aumento de datos donde se generan traducciones sintéticas traduciendo datos monolingües objetivo al idioma fuente, y luego de vuelta al objetivo para crear pares paralelos artificiales.