人工智能完整詞典
数据湖的中间层,原始数据在此进行转换、清洗和丰富,然后用于分析或机器学习。
数据湖中存储原始格式数据且未经任何转换的区域,作为所有未来分析的不可变事实来源。
数据湖中包含已清洗、转换和结构化数据,可供业务应用程序和分析工具使用的区域。
一种策略,在数据湖中使用多种不同的数据存储技术,根据每种数据的特定特性进行优化。
一套服务和工具,可以直接在数据湖中存储的数据上执行复杂的分析查询,无需预先转换。
数据湖的临时工作区,在此进行复杂的数据转换、聚合和丰富,然后进行最终存储。