Glosario IA
El diccionario completo de la Inteligencia Artificial
Frustum PointNets
Arquitectura de red neuronal que opera en un volumen de visión (frustum) proyectado desde una caja delimitadora 2D para predecir una caja delimitadora 3D precisa.
Bird's-Eye-View (BEV) Projection
Técnica de transformación de datos de sensores (imágenes, nubes de puntos) en una representación cartográfica vista desde arriba para simplificar la detección y localización de objetos.
Multi-View Fusion
Proceso de agregación de información proveniente de múltiples puntos de vista (cámaras) para reconstruir una escena u objeto 3D coherente y robusto.
Ray Casting
Algoritmo que lanza rayos virtuales desde un punto de observación para determinar las intersecciones con los objetos en una escena 3D, fundamental para el renderizado y la proyección.
3D Bounding Box
Paralelepípedo rectángulo parametrizado por su posición, sus dimensiones (longitud, ancho, altura) y su orientación (ángulos de guiñada, cabeceo, alabeo) para encuadrar un objeto 3D.
IoU 3D (Intersection over Union)
Métrica de evaluación para la detección 3D, calculando la relación entre el volumen de intersección y el volumen de unión de la caja delimitadora predicha y la caja delimitadora real.
LiDAR (Light Detection and Ranging)
Tecnología de telemetría activa que emite impulsos láser y mide el tiempo de retorno de su reflexión para generar nubes de puntos 3D precisas del entorno.
Monocular 3D Object Detection
Tarea que consiste en estimar la posición, el tamaño y la orientación 3D de un objeto a partir de una sola imagen 2D, basándose en pistas geométricas y contextuales.
Visión Estéreo
Método que utiliza dos o más cámaras calibradas para simular la visión humana y calcular la profundidad por triangulación a partir de la disparidad de las imágenes.
PointNet
Red neuronal profunda pionera diseñada para procesar directamente nubes de puntos no estructurados, aprendiendo funciones simétricas sobre el conjunto de puntos.
Imagen de Rango
Representación 2D de datos de un sensor de profundidad donde cada píxel almacena la distancia medida, similar a una imagen pero con la intensidad reemplazada por el rango.
Detección 3D Basada en Anclajes
Enfoque de detección que predice desplazamientos con respecto a una cuadrícula predefinida de cajas 3D (anclajes) de diferentes tamaños y orientaciones en el espacio.
Detección 3D Basada en Centros
Paradigma de detección que predice directamente el centro de cada objeto y sus propiedades (tamaño, orientación), simplificando el postprocesamiento y evitando los cálculos complejos de IoU.