本课程面向大数据平台运维工程师、系统架构师及技术决策人员,重点培养以下三大核心能力:
技术领域 | 掌握要点 | 应用场景 |
---|---|---|
分布式存储 | HDFS架构设计/数据副本策略 | PB级数据存储方案 |
计算框架 | Spark内存计算优化 | 实时推荐系统开发 |
数据治理 | Kerberos安全认证 | 企业级权限管理 |
技术模块 | 核心知识点 | 实验项目 |
---|---|---|
FusionInsight HD | 集群部署/监控告警 | 金融风控系统搭建 |
实时计算体系 | Flink窗口机制/状态管理 | 物联网数据处理 |
数据采集工具链 | Flume多路复用/拦截器 | 日志采集系统设计 |