🏠 Início
Avaliações
📊 Todos os Benchmarks 🦖 Dinossauro v1 🦖 Dinossauro v2 ✅ Aplicações To-Do List 🎨 Páginas Livres Criativas 🎯 FSACB - Showcase Definitivo 🌍 Benchmark de Tradução
Modelos
🏆 Top 10 Modelos 🆓 Modelos Gratuitos 📋 Todos os Modelos ⚙️ Kilo Code
Recursos
💬 Biblioteca de Prompts 📖 Glossário de IA 🔗 Links Úteis

Glossário IA

O dicionário completo da Inteligência Artificial

242
categorias
3.306
subcategorias
39.932
termos
📖
termos

Jailbreaking

Processo que consiste em contornar intencionalmente os mecanismos de segurança de um modelo de linguagem para fazê-lo gerar conteúdo normalmente restrito.

📖
termos

RLHF

Método de treinamento que utiliza o aprendizado por reforço baseado no feedback humano para alinhar os comportamentos dos LLMs com as preferências humanas.

📖
termos

Red Teaming

Processo sistemático de teste das vulnerabilidades dos modelos por equipes especializadas que simulam ataques para identificar as fraquezas de segurança.

📖
termos

Safety Layer

Camada de proteção adicional integrada aos LLMs para filtrar e modificar as saídas potencialmente perigosas ou inadequadas antes de sua geração final.

📖
termos

Content Moderation

Sistema automatizado de detecção e filtragem de conteúdo inadequado, odioso ou perigoso nas interações com os modelos de linguagem.

📖
termos

Ethical Alignment

Processo que visa garantir que as decisões e comportamentos das IAs respeitem os princípios éticos fundamentais e as normas sociais aceitáveis.

📖
termos

Value Alignment

Disciplina que busca alinhar os objetivos e comportamentos dos sistemas de IA com os valores humanos complexos e muitas vezes implícitos.

📖
termos

Guardrails

Mecanismos de controle preventivos e reativos implantados nos LLMs para limitar seu comportamento dentro de limites seguros e éticos predefinidos.

📖
termos

Filtragem de Saída

Técnica de pós-processamento aplicada às respostas geradas pelos LLMs para detectar e bloquear conteúdo não conforme antes de sua entrega ao usuário.

📖
termos

Princípios Constitucionais

Conjunto de regras fundamentais e explícitas que definem comportamentos aceitáveis e inaceitáveis para um sistema de IA, servindo como um quadro ético operacional.

📖
termos

Detecção de Conteúdo Nocivo

Sistema de classificação automática que identifica conteúdos potencialmente nocivos, perigosos ou inadequados nas gerações de modelos de linguagem.

📖
termos

Mitigação de Viés

Conjunto de técnicas que visam reduzir ou eliminar os vieses sistêmicos presentes nos modelos de IA para garantir respostas equitativas e não discriminatórias.

📖
termos

Restrições de Segurança

Limitações operacionais programadas nos LLMs para impedir a geração de conteúdo que viole as políticas de segurança ou regulamentações aplicáveis.

📖
termos

Modelagem de Preferências

Processo de aprendizado de preferências humanas complexas para guiar os modelos de IA em direção a comportamentos considerados desejáveis pelos usuários.

📖
termos

Recompensa Hacking

Fenômeno em que os modelos otimizam sua função de recompensa de forma literal, mas não intencional, produzindo comportamentos indesejáveis, mas recompensados.

📖
termos

Pesquisa em Segurança de IA

Campo de pesquisa dedicado ao desenvolvimento de métodos e técnicas para garantir que os sistemas de IA funcionem de maneira segura e benéfica.

📖
termos

Supervisão Constitucional

Mecanismo de supervisão contínua que garante que os modelos de IA respeitem permanentemente os princípios constitucionais e as restrições éticas estabelecidas.

🔍

Nenhum resultado encontrado