课程周期:4个月强化训练 | 开课校区:北京中关村/上海浦东 | 授课方式:面授+项目实战
技术栈 | 核心内容 | 实战案例 |
---|---|---|
Linux系统管理 | 文件权限管理/Shell脚本编程/服务配置 | Hadoop集群环境部署 |
Hadoop 2.x | YARN资源调度/HDFS存储原理/MapReduce优化 | CSDN日志分析系统 |
掌握分区表设计与ETL流程,完成用户行为数据统计
RDD弹性数据集操作与Streaming流处理实战
技术指标 | Hadoop 3.x | Spark 3.0 |
---|---|---|
数据处理模式 | 批处理 | 内存计算 |
机器学习支持 | Mahout库 | MLlib模块 |