培训时长 | 4天 |
授课对象 | |
授课方式 | 内训 |
概述概念与术语(人工智能、数据挖掘、机器学习…)数据挖掘的对象数据挖掘的关键技术知识的表达数据预处理变量类型数据清理数据集成和变换数据仓库与数据方(OLAP)规范化数据压缩(DCT、小波变换)降维与维度归约无标签时:PCA有标签时:Fisher线性判别(第一个“LDA”)知识的约简决策表的约简粗糙集回归与时序分析线性回归非线性回归logistics回归平稳性、截尾与拖尾ARIMA决策树分类和预测熵减过程与贪心法ID3C4.5其他改进方法决策树剪枝归纳学习聚类监督学习与无监督学习K-means与k-medoids层次的方法基于密度的方法基于网格的方法孤立点分析案例:鸢尾花数据的聚类关联规则与序列挖掘频繁项集支持度与置信度Apriori性质连接与剪枝总有“啤酒与尿布”以外的案例吧?序列挖掘惰性学习迫切学习与惰性学习K-NN分类算法基于案例的推理机器学习中性能评价指标准确率;精确率、召回率;F1真阳性率、假阳性率混淆矩阵ROC与AUC对数损失Kappa系数回归:平均绝对误差、平均平方误差聚类:兰德指数、互信息朴素贝叶斯与贝叶斯网络概率论基础:条件概率、联合概率、分布、共轭先验。“概率派”与“贝叶斯派”朴素贝叶斯模型贝叶斯信念网络应用案例介绍极大似然估计与EM算法极大似然估计半监督学习EM算法EM算法应用:贝叶斯线性回归支持向量机统计学习问题结构风险最小归纳原理支持向量机核函数多分类的支持向量机用于连续值预测的支持向量机小案例:“拆蚊香”BP神经网络人工神经元及感知机模型前向神经网络sigmoid径向基函数神经网络误差反向传播其他神经网络hopfield网络自组织特征映射神经网络受限布尔兹曼机神经网络的应用案例介绍机器学习中的最优化方法参数学习方法损失函数(或目标函数)梯度下降随机梯度下降牛顿法拟牛顿法蛮力法也算吗?遗传算法交叉、选择、变异基本算法神经网络与遗传算法结合的案例:井字棋隐马尔科夫模型马尔科夫过程隐马尔科夫模型三个基本问题(评估、解码、学习)前向-后向算法Viterbi算法Baum-Welch算法条件随机场最大熵理论无向图模型与MRFCRF与MRF的关系最大团与势函数CRF的三个问题(概率计算、参数学习、预测)CRF进行词性标注的案例文本挖掘1、文本分析功能2、文本特征的提取4、文本分类5、文本聚类6、文本摘要Monte-Carlo法扔飞镖计算圆周率Monte-Carlo积分接受-拒绝采样重要性采样MCMC方法的基本思路Metropolis-Hastings算法Gibbs采样从LSA到LDALSA(潜在语义分析)pLSA第二个“LDA”(潜在狄利克雷分布)网页排序与商品推荐page rank基于人口统计学的推荐基于内容的推荐协同过滤基于关联规则推荐组合推荐组合的模型baggingco-trainingadaboost随机森林GBDT强化学习MDPs中的agent的属性exploration and exploitationBellman期望方程最优策略策略迭代与价值迭代Q学习算法DQN综合案例如何教电脑玩“flappy bird”待定