Glossário IA
O dicionário completo da Inteligência Artificial
GFS (Google File System)
Arquitetura de sistema de arquivos distribuído desenvolvida pelo Google, otimizada para cargas de trabalho Big Data com acessos sequenciais aos dados e gerenciamento automático de replicação.
NameNode
Nó mestre no HDFS que mantém os metadados do sistema de arquivos, incluindo a estrutura de diretórios, a localização dos blocos e a topologia do cluster.
DataNode
Nó worker no HDFS responsável pelo armazenamento físico dos blocos de dados, sua replicação e comunicação com o NameNode para relatórios de status.
Block Replication
Mecanismo de tolerância a falhas onde cada bloco de dados é armazenado em várias cópias em diferentes DataNodes para garantir a disponibilidade dos dados em caso de falha de hardware.
Rack Awareness
Algoritmo de otimização que coloca as réplicas de dados em diferentes racks físicos para maximizar a tolerância a falhas em caso de falha de um rack inteiro.
HDFS Federation
Arquitetura escalável do HDFS permitindo múltiplos NameNamespaces independentes, cada um gerenciando uma porção do namespace para melhorar a escalabilidade e o isolamento.
Checkpoint Node
Nó especializado no HDFS que cria periodicamente pontos de verificação do sistema de arquivos mesclando o log de modificações com a imagem do sistema de arquivos para otimizar a reinicialização.
Erasure Coding
Técnica de proteção de dados mais eficiente que a replicação, dividindo os dados em fragmentos e codificando fragmentos de paridade para reduzir o espaço de armazenamento mantendo a tolerância a falhas.
FsImage
Snapshot persistente dos metadados do sistema de arquivos HDFS, contendo a estrutura completa de diretórios e os atributos dos arquivos no momento de sua criação.
Edit Log
Log transacional no HDFS que registra sequencialmente todas as modificações dos metadados do sistema de arquivos para garantir a consistência e permitir a recuperação após falhas.
Safe Mode
Estado de somente leitura do HDFS durante o qual o NameNode verifica a replicação mínima dos blocos antes de aceitar modificações, assegurando a consistência dos dados na inicialização.
Distributed Namespace
Arquitetura onde o gerenciamento de metadados é distribuído por vários servidores para eliminar gargalos e permitir uma escalabilidade horizontal do sistema de arquivos.
Block Placement Policy
Algoritmo que determina a localização ótima das réplicas de blocos no cluster considerando a topologia de rede, a carga dos nós e os requisitos de tolerância a falhas.
Journal Node
Componente no HDFS High Availability que armazena persistentemente os logs de modificações do NameNode ativo para permitir um failover transparente para o NameNode de reserva.
Data Balancer
Ferramenta que redistribui os blocos entre os DataNodes para equilibrar o uso de espaço em disco e a carga de rede no cluster, otimizando o desempenho geral.
Heartbeat Mechanism
Sinal periódico enviado pelos DataNodes ao NameNode para confirmar seu estado operacional, permitindo a detecção rápida de falhas e o acionamento da replicação.
Quota de Namespace
Limite configurada no número de arquivos e diretórios que um usuário ou grupo pode criar no HDFS para controlar o uso de recursos do sistema.