课程简介
python进阶课程为想希望从事数据挖掘、机器学习工程师相关岗位的人员或者希望通过CDA三级认证考试人员开设。课程设计循序渐进,从基础工具与理论知识入门,进阶机器学习模型、文本挖掘模型,以实战项目案例贯穿课程讲解。其中包括:Python编程基础、数据清洗、数据处理与特征工程、Python机器学习、自然语言处理等课程模块。课程理论知识涵盖CDA LEVEL III等级考试的所有考点,有利于对应等级考试的学员备考。
学习目标
熟练掌握数据科学领域最受欢迎的编程语言-Python
掌握使用Python和pandas库进行数据清洗和预处理
学会使用matplotlib、seaborn进行初级可视化
学会使用Pyecharts进行高级数据可视化
学会构建机器学习算法进行分类、预测和聚类模型
善用机器学习解决用户画像、精准营销、风险管理等商业问题
面向对象
机器学习零基础学员
高校在校生
待业、期待转行从事数据挖掘相关岗位的在职人员
CDA数据分析师levelⅢ考生。
希望借助数据挖掘算法来提升解决企业运营、产品运营中涉及的预测问题者
对数据挖掘技术感兴趣的各界人士
产品、运营、营销、管理、咨询相关岗位从业者,希望增加数据挖掘技能与思维的学员
培训内容
1章预习课(录播)——数据库SQL
1-1数据库基本概念
1-2DDL数据定义语言
1-3DML数据操作语言
1-4单表查询
1-5多表查询
1-6Python连接SQL
2章预习课(录播)——Python编程基础
2-1Python标准数据类型
2-2控制流语句
2-3自定义函数
2-4异常和错误
2-5类与面向对象编程
2-6Numpy数组操作
3章预习课(录播)——数学与统计学基础
3-1线性代数
3-2微积分
3-3描述性统计
3-4参数估计
3-5假设检验
3-6相关分析
3-7卡方分析
3-8一元线性回归理论推导
3-9多元线性回归理论推导
4章机器学习进阶(Level 3)第1周-数据接入与大数据平台
4-1分布式存储与计算
4-2Spark与Flink工作原理
4-3使用PySpark实现分布式计算
4-4数据接入策略与调度工具
5章机器学习进阶(Level 3)第1周-数据挖掘导论
5-1数据挖掘导论
5-2KNN
5-3贝叶斯
5-4SVM
6章机器学习进阶(Level 3)第2周-决策树
6-1决策树(ID3,C4.5,CART)
6-2决策树的模型调优
6-3病马死亡归类与识别案例
6-4用户分类-保险行业用户分类分析
7章机器学习进阶(Level 3)第2周-带正则项的回归分析与SVM
7-1带正则项的回归分析
7-2大数据环境下的回归分析实现(Spark实现)
8章机器学习进阶(Level 3)第3周-集成与提升方法
8-1集成学习的理论基础
8-2AdaBoost
8-3随机森林及其Spark实现
8-4GBDT,XGBoost,LightGBM及Python实现
9章机器学习进阶(Level 3)第3周-关联规则与协同过滤
9-1关联规则(关联规则的概念,评估指标,Apriori算法)
9-2协同过滤
9-3大数据环境下的协同过滤实现
9-4产品组合策略-电信公司产品捆绑销售策略分析案例
10章机器学习进阶(Level 3)第4周-高级数据处理与特征工程,神经网络
10-1数据处理的前沿方法:特征工程概要
10-2数据不平衡问题
10-3特征工程(特征的建构、选择、转换、学习)
10-4感知器及多层感知器
11章机器学习进阶(Level 3)第4周-深度学习基础
11-1深度神经网络基础
11-2BP神经网络架构
11-3反向传播算法
11-4梯度与学习率专题
11-5图像分析-手写数字自动识别
12章机器学习进阶(Level 3)第5周-爬虫,文本分析
12-1数据的爬取(http原理、requests应用)
12-2文本数据清洗(正则表达式、HTML结构及xpath应用)
13章机器学习进阶(Level 3)第5周-NLP之文本挖掘
13-1分词与词性标注
13-2文本信息提取
13-3词嵌入(CBOW与Skip-gram)
13-4构建文本信息库
13-5文本聚类算法
14章机器学习进阶(Level 3)第6周-聚类分析进阶与异常识别
14-1聚类分析进阶(密度聚类,高斯混合聚类,谱聚类)
14-2异常识别(孤立森林,局部异常因子)
14-3交易反欺诈-异常交易识别案例
15章机器学习进阶(Level 3)第6周-大型项目案例
15-1实战项目-金融行业反欺诈
16章机器学习进阶(Level 3)第7周-深度学习与NLP前沿技术
16-1卷积神经网络CNN
16-2循环神经网络RNN与LSTM
16-3残差网络ResNet
16-4注意力机制Attention
16-5预训练框架Transformer与迁移学习
16-6Bert专题
16-7Pytorch框架与代码实践(NLP案例)
16-8大型项目案例-实战项目-信用评分卡
17章CDA认证考试辅导(仅限报名考试的学生)
17-1数据挖掘概论
17-2高级数据处理与特征工程
17-3自然语言处理与文本分析
17-4机器学习算法
17-5机器学习进阶(自动机器学习,样本不平衡问题,半监督学习,模型优化)
18章拓展选修课
18-1互联网数字化运营
18-2何为数据产品经理
18-3Python爬虫
18-4人工智能(深度学习)实战之图像识别
18-5Tableau多维可视化分析
18-6SPSS统计分析