培训时长 | 0 |
授课对象 | 业务支持部、IT系统部、大数据系统开发部、大数据分析中心、信息技术部等相关技术人员。 |
授课方式 | 内训 |
掌握SAS语言,掌握数据挖掘
第一部分:SAS基础 1、SAS简介和构成 2、SAS的主要模块和功能 3、SAS的四种运行模式 Ø 窗口环境模式 Ø 非交互模式 Ø 交互式运行模式 Ø 批处理模式 4、掌握SAS的基本数据结构和数据对象 Ø 逻辑库、逻辑引擎、数据集、数据文件、视图 5、SAS基本程序结构 Ø 数据步(DATA STEP) Ø 过程步(PROC STEP) 6、SAS基本语言介绍 7、数据集的操作 Ø 从文本文件获取 Ø 从外部数据库获取 Ø 数据集导出到外部文件 Ø 读取、浏览、编辑数据集 Ø 创建、编辑、修改、删除 8、对多个数据集的操作 Ø 横向合并 Ø 纵向串接 9、SAS SQL语言 10、 SAS宏语言 案例:演练SAS编程语句 第二部分:数据可视化处理 1、数据报表输出 Ø 基本报表 Ø 高级报表 2、统计图形 Ø GCHART过程 Ø GPLOT过程 Ø CAPABILITY过程 3、各种图形的画法 Ø 柱状图/条形图 Ø 饼图 Ø 折线图 Ø 散点图/气泡图 4、绘图的美化技巧 案例:用SAS作图来实现产品销量分析 第三部分:数据统计分析 1、描述性统计分析 Ø 集中程序 Ø 离散程序 Ø 分布形态 2、参数估计与假设检验 Ø 单样本均值T检验 Ø 独立两样本均值T检验 Ø 配对两样本均值T检验 3、非参数检验文件操作处理 Ø 单样本 Ø 独立两样本 Ø 配对两样本 4、影响因素分析 Ø 相关分析:原理、公式、应用 Ø 方差分析:原理、公式、应用 Ø 卡方分析:原理、公式、应用 Ø 主成分分析/因子分析:降维 案例:掌握常用的过程对数据进行分析 第四部分:数据挖掘基础 1、数据挖掘概述 2、数据挖掘的标准流程(CRISP-DM) Ø 商业理解 Ø 数据准备 Ø 数据理解 Ø 模型建立 Ø 模型评估 Ø 模型应用 3、数据挖掘常用任务与算法 第五部分:聚类分析(客户细分)实战 1、客户细分常用方法 2、聚类分析(Clustering) Ø 聚类方法原理介绍及适用场景 Ø 常用聚类分析算法 Ø 聚类算法的评价 案例:使用FASTCLUS实现K均值聚类 案例:使用CLUSTER实现层次聚类法 3、判别分析 Ø 判别分析法原理 Ø 判别分析常见方法:距离判别、Bayes判别、Fisher判别 案例:使用DISCRIM、CANDISC、STEPDISC实现判别分析 4、RFM模型分析 Ø RFM模型,更深入了解你的客户价值 Ø RFM模型与市场策略 案例:航空公司客户价值分析 第六部分:数值预测模型实战 1、常用数值预测的模型 Ø 通用预测模型:回归模型 Ø 季节性预测模型:相加、相乘模型 Ø 新产品预测模型:珀尔曲线与龚铂兹曲线 2、回归分析概念 3、常见回归分析类别 4、回归分析检验 Ø 模型的显著性检验 Ø 回归系数的显著性检验 Ø 残差检验 Ø 拟合程度 Ø 共线性诊断 案例:回归分析 第七部分:分类预测模型实战 1、常见分类预测的模型与算法 2、如何评估分类预测模型的质量 Ø 查准率 Ø 查全率 Ø ROC曲线 3、逻辑回归分析模型 Ø 逻辑回归的原理 Ø 逻辑回归建模的步骤 Ø 逻辑回归结果解读 4、时间序列分析 案例:用LOGISTIC过程实现银行贷款违约预测 第八部分:SAS优化建模 1、优化模型的基本概念 2、优化建模的步骤 3、线性规划问题 案例:使用OPTMODEL建立线性规划模型 第九部分:SAS智能平台构建及行业解决方案 1、构建SAS解决方案平台 2、平台的体系架构设计 3、实现SAS应用服务器集群 4、平台的安全管理 第十部分:辅导 结束:课程总结与问题答疑。