本进阶课程聚焦R语言在商业分析中的实战应用,设置16个教学模块系统培养数据处理、统计建模与机器学习能力。课程延续基础课程知识架构,通过金融、电商等真实案例展开教学。
教学模块 | 核心技术要点 |
---|---|
数据预处理技术 | 异常值检测方法对比(箱线图/3σ原则)、多重插补法处理缺失值、数据标准化流程 |
统计建模专题 | 广义线性模型构建、方差分析模型优化、非参数检验方法应用 |
机器学习实战 | 支持向量机参数调优、决策树算法比较(C4.5/CART)、随机森林特征选择 |
基于百万级用户日志数据,运用关联规则挖掘技术构建商品推荐系统。涉及数据清洗、特征工程、Apriori算法实现等完整流程。
dplyr数据操作
tidyr数据整理
lubridate时间处理
ggplot2基础绘图
plotly交互图表
shiny可视化仪表盘