来源:在职研究生联盟网 时间:2023-12-15 15:50:27
课时安排:10天培训方式:企业内训课程类别:项目管理
大数据分析之SAS软件技术培训课程特色与背景
【课程目标】
本课程基于SAS工具来实现大数据的数据分析和数据挖掘项目。
SAS是公认的比较完善、全面的大数据分析和数据挖掘工具,对处理大型数据是最有优势的,可用于经济管理、社会科学、质量控制、风险管理等领域。
本课程是全面的SAS语言学习、代码编写、项目实施培训。基于常见的业务问题,在数据挖掘标准过程指导下,采用SAS分析工具,实现数据挖掘项目的每一步操作,从数据预处理、数据建模、数据可视化,到最终数据挖掘结束,帮助学员掌握SAS用于数据挖掘,提升学员的数据化运营及数据挖掘的能力。
通过本课程的学习,达到如下目的:
1、 全面掌握SAS语言以及其编程思想。
2、 掌握SAS解决方案平台的构建,熟悉SAS各模块的使用。
3、 学会使用SAS完成数据挖掘项目整个过程。
4、 掌握利用SAS实现可视化呈现,实现数据探索性分析。
5、 掌握数据挖掘常见算法在SAS中的实现。
课程大纲
【课程大纲】
第一部分:SAS基础
1、 SAS简介和构成
2、 SAS的主要模块和功能
3、 SAS的四种运行模式
? 窗口环境模式
? 非交互模式
? 交互式运行模式
? 批处理模式
4、 掌握SAS的基本数据结构和数据对象
? 逻辑库、逻辑引擎、数据集、数据文件、视图
5、 SAS基本程序结构
? 数据步(DATA STEP)
? 过程步(PROC STEP)
6、 SAS基本语言介绍
7、 数据集的操作
? 从文本文件获取
? 从外部数据库获取
? 数据集导出到外部文件
? 读取、浏览、编辑数据集
? 创建、编辑、修改、删除
8、 对多个数据集的操作
? 横向合并
? 纵向串接
9、 SAS SQL语言
10、 SAS宏语言
案例:演练SAS编程语句
第二部分:数据可视化处理
1、 数据报表输出
? 基本报表
? 高级报表
2、 统计图形
? GCHART过程
? GPLOT过程
? CAPABILITY过程
3、 各种图形的画法
? 柱状图/条形图
? 饼图
? 折线图
? 散点图/气泡图
4、 绘图的美化技巧
案例:用SAS作图来实现产品销量分析
第三部分:数据统计分析
1、 描述性统计分析
? 集中程序
? 离散程序
? 分布形态
2、 参数估计与假设检验
? 单样本均值T检验
? 独立两样本均值T检验
? 配对两样本均值T检验
3、 非参数检验文件操作处理
? 单样本
? 独立两样本
? 配对两样本
4、 影响因素分析
? 相关分析:原理、公式、应用
? 方差分析:原理、公式、应用
? 卡方分析:原理、公式、应用
? 主成分分析/因子分析:降维
案例:掌握常用的过程对数据进行分析
第四部分:数据挖掘基础
1、 数据挖掘概述
2、 数据挖掘的标准流程(CRISP-DM)
? 商业理解
? 数据准备
? 数据理解
? 模型建立
? 模型评估
? 模型应用
3、 数据挖掘常用任务与算法
第五部分:聚类分析(客户细分)实战
1、 客户细分常用方法
2、 聚类分析(Clustering)
? 聚类方法原理介绍及适用场景
? 常用聚类分析算法
? 聚类算法的评价
案例:使用FASTCLUS实现K均值聚类
案例:使用CLUSTER实现层次聚类法
3、 判别分析
? 判别分析法原理
? 判别分析常见方法:距离判别、Bayes判别、Fisher判别
案例:使用DISCRIM、CANDISC、STEPDISC实现判别分析
4、 RFM模型分析
? RFM模型,更深入了解你的客户价值
? RFM模型与市场策略
案例:航空公司客户价值分析
第六部分:数值预测模型实战
1、 常用数值预测的模型
? 通用预测模型:回归模型
? 季节性预测模型:相加、相乘模型
? 新产品预测模型:珀尔曲线与龚铂兹曲线
2、 回归分析概念
3、 常见回归分析类别
4、 回归分析检验
? 模型的显著性检验
? 回归系数的显著性检验
? 残差检验
? 拟合程度
? 共线性诊断
案例:回归分析
第七部分:分类预测模型实战
1、 常见分类预测的模型与算法
2、 如何评估分类预测模型的质量
? 查准率
? 查全率
? ROC曲线
3、 逻辑回归分析模型
? 逻辑回归的原理
? 逻辑回归建模的步骤
? 逻辑回归结果解读
4、 时间序列分析
案例:用LOGISTIC过程实现银行贷款违约预测
第八部分:SAS优化建模
1、 优化模型的基本概念
2、 优化建模的步骤
3、 线性规划问题
案例:使用OPTMODEL建立线性规划模型
第九部分:SAS智能平台构建及行业解决方案
1、 构建SAS解决方案平台
2、 平台的体系架构设计
3、 实现SAS应用服务器集群
4、 平台的安全管理
第十部分:辅导
结束:课程总结与问题答疑。