Modelos Autoregresivos

📖

términos

Modelo Autoregresivo

Arquitectura de modelo generativo que predice el siguiente token basándose en todos los tokens anteriores, construyendo la secuencia de manera iterativa y secuencial.

📖

términos

Ventana de Contexto

Tamaño máximo de secuencia que el modelo puede procesar simultáneamente, limitando la cantidad de información histórica utilizable para la predicción.

📖

términos

Predicción del Siguiente Token

Objetivo fundamental de los modelos autoregresivos que consiste en maximizar la probabilidad condicional P(token_t|tokens_1...t-1).

📖

términos

Muestreo por Temperatura

Técnica de generación que controla el grado de aleatoriedad en la selección del siguiente token ajustando la distribución de probabilidad de los logits.

📖

términos

Muestreo Top-k

Método de generación que limita la selección a los k tokens más probables, evitando tokens de baja probabilidad mientras mantiene diversidad.

📖

términos

Muestreo Nucleus

Estrategia de selección dinámica basada en una masa de probabilidad acumulativa, adaptando el número de candidatos según la confianza del modelo.

📖

términos

Búsqueda por Haz

Algoritmo de decodificación que explora simultáneamente múltiples secuencias candidatas para encontrar la secuencia global más probable.

📖

términos

Modelo de Lenguaje Causal

Tipo de modelo autoregresivo entrenado para predecir tokens futuros basado en el contexto pasado, sin acceso a tokens futuros durante el entrenamiento.

📖

términos

Transformer Solo Decodificador

Arquitectura neuronal que utiliza únicamente capas de decodificador con enmascaramiento causal, preferida para modelos de lenguaje autorregresivos modernos.

📖

términos

Decodificación Voraz

Estrategia de generación que selecciona sistemáticamente el token de probabilidad máxima en cada paso, garantizando coherencia pero pudiendo carecer de creatividad.

📖

términos

Generación Autorregresiva

Proceso de generación textual donde cada token producido se añade inmediatamente al contexto para influir en la generación de los tokens siguientes.

📖

términos

Ajuste Fino de Modelo de Lenguaje

Proceso de adaptación especializada de un modelo autorregresivo preentrenado en datos específicos para mejorar su rendimiento en un dominio objetivo.

📖

términos

Aprendizaje Zero-shot

Capacidad de los modelos autorregresivos para realizar tareas no vistas durante el entrenamiento aprovechando sus conocimientos generales del lenguaje.

📖

términos

Caché KV

Mecanismo de optimización que almacena los estados clave-valor de los tokens anteriores para acelerar la generación autorregresiva secuencial.

📖

términos

Longitud de Secuencia Variable

Capacidad de los modelos autorregresivos para generar secuencias de longitudes diferentes adaptadas dinámicamente según el contenido generado.

Glosario IA

Modelo Autoregresivo

Ventana de Contexto

Predicción del Siguiente Token

Muestreo por Temperatura

Muestreo Top-k

Muestreo Nucleus

Búsqueda por Haz

Modelo de Lenguaje Causal

Transformer Solo Decodificador

Decodificación Voraz

Generación Autorregresiva

Ajuste Fino de Modelo de Lenguaje

Aprendizaje Zero-shot

Caché KV

Longitud de Secuencia Variable

No se encontraron resultados