AI 词汇表
人工智能完整词典
GFS (Google File System)
由Google开发的分布式文件系统架构,针对大数据工作负载进行了优化,支持数据顺序访问和自动复制管理。
NameNode
HDFS中的主节点,维护文件系统的元数据,包括目录结构、块位置和集群拓扑。
DataNode
HDFS中的工作节点,负责数据块的物理存储、复制以及与NameNode进行状态报告通信。
Block Replication
容错机制,每个数据块在不同DataNode上存储多个副本,以确保在硬件故障时数据的可用性。
Rack Awareness
优化算法,将数据副本放置在不同的物理机架上,以在整机架故障时最大化容错能力。
HDFS Federation
HDFS的可扩展架构,允许多个独立的命名空间,每个命名空间管理部分命名空间以提高可扩展性和隔离性。
Checkpoint Node
HDFS中的专用节点,定期创建文件系统检查点,通过合并修改日志与文件系统映像来优化重启过程。
Erasure Coding
比复制更有效的数据保护技术,将数据分割成片段并编码奇偶校验片段,以减少存储空间同时保持容错能力。
FsImage
HDFS文件系统的持久化元数据快照,包含创建时完整的目录结构和文件属性。
Edit Log
HDFS中的事务日志,顺序记录所有文件系统元数据的修改,以确保一致性并支持故障恢复。
Safe Mode
HDFS的只读状态,在此模式下NameNode会检查块的最小复制数后才接受修改,确保启动时的数据一致性。
Distributed Namespace
将元数据管理分布到多个服务器上的架构,以消除瓶颈并实现文件系统的水平扩展。
Block Placement Policy
确定块副本在集群中最佳位置的算法,考虑网络拓扑、节点负载和容错要求。
Journal Node
HDFS高可用性中的组件,持久化存储活动NameNode的修改日志,以便无缝切换到备用NameNode。
Data Balancer
在DataNodes之间重新分配块数据的工具,以平衡集群中的磁盘空间使用和网络负载,优化整体性能。
Heartbeat Mechanism
DataNodes定期向NameNode发送的心跳信号,用于确认运行状态,实现快速故障检测和触发复制。
命名空间配额
在HDFS上为用户或组设置的文件和目录创建数量限制,用于控制系统资源使用。