Glosario IA
El diccionario completo de la Inteligencia Artificial
GFS (Google File System)
Arquitectura de sistema de archivos distribuido desarrollado por Google, optimizado para cargas de trabajo Big Data con accesos secuenciales a los datos y gestión automática de la replicación.
NameNode
Nodo maestro en HDFS que mantiene los metadatos del sistema de archivos, incluyendo la estructura de directorios, la ubicación de los bloques y la topología del clúster.
DataNode
Nodo trabajador en HDFS responsable del almacenamiento físico de los bloques de datos, de su replicación y de la comunicación con el NameNode para los informes de estado.
Block Replication
Mecanismo de tolerancia a fallos donde cada bloque de datos se almacena en múltiples copias en diferentes DataNodes para garantizar la disponibilidad de los datos en caso de fallo de hardware.
Rack Awareness
Algoritmo de optimización que coloca las réplicas de datos en diferentes racks físicos para maximizar la tolerancia a fallos en caso de fallo de un rack completo.
HDFS Federation
Arquitectura escalable de HDFS que permite múltiples NameNamespaces independientes, cada uno gestionando una porción del espacio de nombres para mejorar la escalabilidad y el aislamiento.
Checkpoint Node
Nodo especializado en HDFS que crea periódicamente puntos de control del sistema de archivos fusionando el registro de modificaciones con la imagen del sistema de archivos para optimizar el reinicio.
Erasure Coding
Técnica de protección de datos más eficiente que la replicación, dividiendo los datos en fragmentos y codificando fragmentos de paridad para reducir el espacio de almacenamiento manteniendo la tolerancia a fallos.
FsImage
Instantánea persistente de los metadatos del sistema de archivos HDFS, que contiene la estructura completa de directorios y los atributos de los archivos en el momento de su creación.
Edit Log
Registro transaccional en HDFS que registra secuencialmente todas las modificaciones de los metadatos del sistema de archivos para garantizar la coherencia y permitir la recuperación tras fallos.
Safe Mode
Estado de solo lectura de HDFS durante el cual el NameNode verifica la replicación mínima de los bloques antes de aceptar modificaciones, asegurando la coherencia de datos al inicio.
Distributed Namespace
Arquitectura donde la gestión de metadatos se distribuye entre varios servidores para eliminar cuellos de botella y permitir una escalabilidad horizontal del sistema de archivos.
Block Placement Policy
Algoritmo que determina la ubicación óptima de las réplicas de bloques en el cluster considerando la topología de red, la carga de los nodos y los requisitos de tolerancia a fallos.
Journal Node
Componente en HDFS High Availability que almacena persistentemente los registros de modificaciones del NameNode activo para permitir una conmutación por fallo transparente hacia el NameNode de respaldo.
Data Balancer
Herramienta que redistribuye los bloques entre los DataNodes para equilibrar el uso del espacio en disco y la carga de red en el cluster, optimizando el rendimiento general.
Heartbeat Mechanism
Señal periódica enviada por los DataNodes al NameNode para confirmar su estado operativo, permitiendo la detección rápida de fallos y el desencadenamiento de la replicación.
Cuota de Espacio de Nombres
Límite configurado sobre el número de archivos y directorios que un usuario o grupo puede crear en HDFS para controlar el uso de recursos del sistema.