Glossário IA
O dicionário completo da Inteligência Artificial
Caixa Delimitadora 3D (3D Bounding Box)
Paralelepípedo retângulo alinhado aos eixos ou orientado, usado para delimitar a posição e a extensão espacial de um objeto em um espaço tridimensional. É definido pelas suas coordenadas de centro (ou de um canto), suas dimensões (comprimento, largura, altura) e sua orientação (ângulos de Euler ou quatérnio).
Fusão de Sensores (Sensor Fusion)
Processo de integração de dados provenientes de múltiplos sensores (ex: LiDAR, câmera, radar) para produzir uma representação do ambiente mais robusta, precisa e completa do que a fornecida por uma única fonte. Permite combinar as forças de cada modalidade para superar suas respectivas fraquezas.
Detecção de Objetos por Grade Voxel (Voxel Grid Detection)
Abordagem de detecção 3D que discretiza o espaço em uma grade tridimensional de voxels (volumes elementares). As características são extraídas desta grade para prever a presença e a localização dos objetos, frequentemente via redes neurais convolucionais 3D (3D CNN).
Projeção Multi-vista (Multi-view Projection)
Método que projeta uma nuvem de pontos 3D em múltiplos planos 2D (imagens de vista aérea, vista frontal, etc.) para utilizar arquiteturas de detecção de objetos 2D maduras. As previsões 2D são então re-projetadas no espaço 3D para obter as caixas delimitadoras finais.
Âncora 3D (3D Anchor)
Caixas delimitadoras 3D predefinidas com tamanhos, orientações e posições específicas, usadas como referências em métodos de detecção baseados em âncoras. A rede prevê os deslocamentos em relação a essas âncoras para refinar a localização e a geometria dos objetos detectados.
Detecção Sem Âncora (Anchor-free Detection)
Paradigma de detecção 3D que não se baseia em um conjunto de caixas de referência predefinidas. Ele prevê diretamente os atributos do objeto (centro, dimensões, orientação) a partir de pontos-chave ou mapas de calor, simplificando o processo e melhorando a generalização para objetos de tamanhos variados.
Mapa de Ocupação (Occupancy Grid)
Representação discreta do ambiente onde o espaço é dividido em células regulares, cada uma com uma probabilidade de estar ocupada, livre ou desconhecida. É comumente utilizada em robótica e para o planejamento de trajetória a partir de dados de sensores 3D.
Malha de Polígonos (Polygon Mesh)
Coleção de vértices, arestas e faces que definem a forma de um objeto poliédrico em 3D. Usado como saída de modelos de segmentação ou reconstrução 3D para uma representação geométrica mais fina e mais realista do que as caixas delimitadoras.
Rede de Pontos (PointNet)
Arquitetura de rede neural profunda projetada para processar diretamente nuvens de pontos, respeitando as propriedades de invariância por permutação dos pontos. Ela utiliza funções simétricas (como o max pooling) para agregar as informações de toda a nuvem.
Detecção por Ray-Casting (Ray-casting Detection)
Técnica que simula o lançamento de raios de um ponto de vista (sensor) através dos voxels de uma grade 3D para determinar as intersecções e inferir a presença de objetos. É frequentemente utilizada para modelar o campo de visão de um LiDAR e melhorar a precisão da detecção.
Segmentação Semântica 3D (3D Semantic Segmentation)
Tarefa que consiste em atribuir um rótulo de classe semântica (ex: 'carro', 'pedestre', 'edifício') a cada ponto ou voxel de uma nuvem de pontos 3D. Ela fornece uma compreensão densa e detalhada da cena, além da simples localização de objetos.
Detecção de Objetos em Tempo Real (Real-time 3D Object Detection)
Capacidade de um sistema de detectar e localizar objetos em 3D com uma latência suficientemente baixa para aplicações dinâmicas como a condução autônoma. Ela impõe restrições rigorosas à complexidade do modelo e à eficiência computacional.
Calibração Extrínseca (Extrinsic Calibration)
Processo de determinação da posição e orientação relativas de um sensor em relação a um sistema de coordenadas de referência (ex: o veículo). Uma calibração precisa é essencial para a fusão de dados multimodais e a projeção correta das detecções em um espaço comum.
Quatérnio de Orientação (Orientation Quaternion)
Representação matemática de uma rotação em um espaço tridimensional usando quatro números (w, x, y, z). É preferida aos ângulos de Euler para descrever a orientação de caixas delimitadoras 3D porque evita o problema de bloqueio de cardan (gimbal lock).
Detecção por Propagação de Características (Feature Propagation Detection)
Estratégia utilizada em arquiteturas hierárquicas (ex: PointNet++) onde as características são extraídas em resoluções cada vez mais grosseiras, e depois propagadas e interpoladas para os pontos de origem para uma predição fina ao nível de cada ponto.