Glossário IA
O dicionário completo da Inteligência Artificial
Fine-tuning com eficiência de parâmetros (PEFT)
Métodos de fine-tuning que modificam apenas um pequeno subconjunto de parâmetros do modelo enquanto congelam a maioria dos pesos, reduzindo assim os custos computacionais e de armazenamento.
QLoRA (LoRA Quantizado)
Variante do LoRA que combina quantização de 4 bits e adaptação de baixo posto, permitindo o fine-tuning de modelos muito grandes em recursos de hardware limitados.
Ajuste de prefixo
Método que otimiza apenas prefixos contínuos adicionados às sequências de entrada, sem modificar os pesos do modelo, para adaptar seu comportamento a tarefas específicas.
Ajuste de prompt
Otimização de embeddings de prompt aprendidos especificamente para guiar o comportamento de um modelo pré-treinado sem modificar seus parâmetros internos.
Fine-tuning com instruções
Processo de treinamento adicional em pares instrução-resposta para ensinar o modelo a seguir precisamente as instruções e gerar respostas apropriadas.
DPO (Otimização Direta de Preferências)
Alternativa ao RLHF que otimiza diretamente o modelo a partir de dados de preferências humanas sem exigir um modelo de recompensa intermediário, simplificando o processo de alinhamento.