唐宇迪:python数据分析与机器学习实战

  • A+
所属分类:教程资源 精品课程


唐宇迪:python数据分析与机器学习实战

课程简介:


适用人群

数据分析,机器学习,数据挖掘领域研究者。Python语言使用者。


课程概述:

使用数据领域最主流语言Python及其分析与建模库作为核心武器。对于机器学习经典算法给出完整的原理推导并基于实例进行讲解,基于案例演示如何应用机器学习算法解决实际问题。


课程特色:

1. 通俗易懂,快速入门

对机器学习经典算法结合数学推导进行形象解释,实例演示。

2. Python主导,实用高效

使用数据领域最主流语言Python及其分析与建模库作为课程核心工具。

3. 案例为师,实战护航

基于真实数据集,从零开始结合Python工具与机器学习算法完成整个案例实战。

4. 持续更新,一劳永逸

Python数据分析与机器学习课程会支持更新下去,逐步加入更多算法与案例。

官方课程链接:http://study.163.com/course/introduction.htm?courseId=1003590004

课程目录:


章节1:人工智能入门指南

课时1课程介绍(主题与大纲)

课时2AI时代首选Python

课时3Python我该怎么学

课时4人工智能的核心-机器学习

课时5机器学习怎么学?

课时6算法推导与案例


章节2:Python科学计算库-Numpy

课时7使用Anaconda安装python环境(Python新手先看这个)

课时8课程数据,代码,PPT(在参考资料界面)

课时9科学计算库Numpy

课时10Numpy基础结构

课时11Numpy矩阵基础

课时12Numpy常用函数

课时13矩阵常用操作

课时14不同复制操作对比


章节3:python数据分析处理库-Pandas

课时15Pandas数据读取

课时16Pandas索引与计算

课时17Pandas数据预处理实例

课时18Pandas常用预处理方法

课时19Pandas自定义函数

课时20Series结构


章节4:Python数据可视化库-Matplotlib

课时21折线图绘制

课时22子图操作

课时23条形图与散点图

课时24柱形图与盒图

课时25细节设置


章节5:Python可视化库Seaborn

课时26Seaborn简介

课时27整体布局风格设置

课时28风格细节设置

课时29调色板

课时30调色板颜色设置

课时31单变量分析绘图

课时32回归分析绘图

课时33多变量分析绘图

课时34分类属性绘图

课时35Facetgrid使用方法

课时36Facetgrid绘制多变量

课时37热度图绘制


章节6:线性回归算法原理推导

课时38线性回归算法概述

课时39误差项分析

课时40似然函数求解

课时41目标函数推导

课时42线性回归求解


章节7:梯度下降策略

课时43梯度下降原理

课时44梯度下降方法对比

课时45学习率对结果的影响


章节8:逻辑回归算法

课时46逻辑回归算法原理推导

课时47逻辑回归求解


章节9:案例实战:Python实现逻辑回归与梯度下降策略

课时48Python实现逻辑回归任务概述

课时49完成梯度下降模块

课时50停止策略与梯度下降案例

课时51实验对比效果


章节10:项目实战-交易数据异常检测

课时52案例背景和目标

课时53样本不均衡解决方案

课时54下采样策略

课时55交叉验证

课时56模型评估方法

课时57正则化惩罚

课时58逻辑回归模型

课时59混淆矩阵

课时60逻辑回归阈值对结果的影响

课时61SMOTE样本生成策略


章节11:决策树算法

课时62决策树原理概述

课时63衡量标准-熵

课时64决策树构造实例

课时65信息增益率

课时66决策树剪枝策略


章节12:案例实战:使用sklearn构造决策树模型

课时67决策树复习

课时68决策树涉及参数

课时69树可视化与sklearn库简介

课时70sklearn参数选择


章节13:集成算法与随机森林

课时71集成算法-随机森林

课时72特征重要性衡量

课时73提升模型

课时74堆叠模型


章节14:案例实战:泰坦尼克获救预测

课时75船员数据分析

课时76数据预处理

课时77使用回归算法进行预测

课时78使用随机森林改进模型

课时79随机森林特征重要性分析


章节15:贝叶斯算法

课时80贝叶斯算法概述

课时81贝叶斯推导实例

课时82贝叶斯拼写纠错实例

课时83垃圾邮件过滤实例

课时84贝叶斯实现拼写检查器


章节16:Python文本数据分析:新闻分类任务

课时85文本分析与关键词提取

课时86相似度计算

课时87新闻数据与任务简介

课时88TF-IDF关键词提取

课时89LDA建模

课时90基于贝叶斯算法进行新闻分类


章节17:支持向量机

课时91支持向量机要解决的问题

课时92距离与数据的定义

课时93目标函数

课时94目标函数求解

课时95SVM求解实例

课时96支持向量的作用

课时97软间隔问题

课时98SVM核变换


章节18:案例:SVM调参实例

课时99sklearn求解支持向量机

课时100SVM参数选择


章节19:聚类算法-Kmeans

课时101KMEANS算法概述

课时102KMEANS工作流程

课时103KMEANS迭代可视化展示

课时104使用Kmeans进行图像压缩


章节20:聚类算法-DBSCAN

课时105DBSCAN聚类算法

课时106DBSCAN工作流程

课时107DBSCAN可视化展示


章节21:案例实战:聚类实践

课时108多种聚类算法概述

课时109聚类案例实战


章节22:降维算法-PCA主成分分析

课时110PCA降维概述

课时111PCA要优化的目标

课时112PCA求解

课时113PCA实例


章节23:神经网络

课时114初识神经网络

课时115计算机视觉所面临的挑战

课时116K近邻尝试图像分类

课时117超参数的作用

课时118线性分类原理

课时119神经网络-损失函数

课时120神经网络-正则化惩罚项

课时121神经网络-softmax分类器

课时122神经网络-最优化形象解读

课时123神经网络-梯度下降细节问题

课时124神经网络-反向传播

课时125神经网络架构

课时126神经网络实例演示

课时127神经网络过拟合解决方案

课时128感受神经网络的强大


章节24:Xgboost集成算法

课时129集成算法思想

课时130xgboost基本原理

课时131xgboost目标函数推导

课时132xgboost求解实例

课时133xgboost安装

课时134xgboost实战演示

课时135Adaboost算法概述


章节25:自然语言处理词向量模型-Word2Vec

课时136自然语言处理与

深度学习

课时137语言模型

课时138-N-gram模型

课时139词向量

课时140神经网络模型

课时141Hierarchical Softmax

课时142CBOW模型实例

课时143CBOW求解目标

课时144梯度上升求解

课时145负采样模型


章节26:使用Gensim库构造中文维基百度数据词向量模型

课时146使用Gensim库构造词向量

课时147维基百科中文数据处理

课时148Gensim构造word2vec模型

课时149测试模型相似度结果


章节27:scikit-learn模型建立与评估

课时150使用python库分析汽车油耗效率

课时151使用scikit-learn库建立回归模型

课时152使用逻辑回归改进模型效果

课时153 模型效果衡量标准

课时154ROC指标与测试集的价值

课时155交叉验证

课时156多类别问题


章节28:Python库分析科比生涯数据

课时157Kobe Bryan生涯数据读取与简介

课时158特征数据可视化展示

课时159数据预处理

课时160使用Scikit-learn建立模型

章节29:Python时间序列分析

课时161章节简介

课时162Pandas生成时间序列

课时163Pandas数据重采样

课时164Pandas滑动窗口

课时165数据平稳性与差分法

课时166ARIMA模型

课时167相关函数评估方法

课时168建立ARIMA模型

课时169参数选择

课时170股票预测案例

课时171使用tsfresh库进行分类任务

课时172维基百科词条EDA


章节30:机器学习项目实战-贷款申请最大化利润

课时173数据清洗过滤无用特征

课时174数据预处理

课时175获得最大利润的条件与做法

课时176预测结果并解决样本不均衡问题


章节31:机器学习项目实战-用户流失预警

课时177数据背景介绍

课时178数据预处理

课时179尝试多种分类器效果

课时180结果衡量指标的意义

课时181应用阈值得出结果


章节32:探索性数据分析-足球赛事数据集

课时182内容简介

课时183数据背景介绍

课时184数据读取与预处理

课时185数据切分模块

课时186缺失值可视化分析

课时187特征可视化展示

课时188多特征之间关系分析

课时189报表可视化分析

课时190红牌和肤色的关系


章节33:探索性数据分析-农粮组织数据集

课时191数据背景简介

课时192数据切片分析

课时193单变量分析

课时194峰度与偏度

课时195数据对数变换

课时196数据分析维度

课时197变量关系可视化展示


章节34:机器学习项目实战-HTTP日志聚类分析

课时198建立特征工程

课时199特征数据预处理

课时200应用聚类算法得出异常IP

课程截图:


唐宇迪:python数据分析与机器学习实战


唐宇迪:python数据分析与机器学习实战


唐宇迪:python数据分析与机器学习实战


唐宇迪:python数据分析与机器学习实战


唐宇迪:python数据分析与机器学习实战


唐宇迪:python数据分析与机器学习实战


唐宇迪:python数据分析与机器学习实战

下载地址

抱歉,此资源仅限VIP下载,请先