模型算法:线性回归
missingo画图查看缺失值、特征相关性分析(相关性高的特征去掉)及画图、
模型算法:LogisticRegression
类别个数柱形图、下采样、混淆矩阵、
软件版本过旧,运行出错。
模型算法:随机森林
处理时间数据、graphviz 画决策树、特征重要性、
seaborn pairplot、特征重要性累加、
随机搜索 RandomizedSearchCV、网格搜索 GridSearchCV、
模型算法:朴素贝叶斯
jieba 分词、停用词、wordcloud、TF-IDF 提取关键词、词袋模型、
模型算法:支持向量机
SVM 画图、核函数、调参数松弛因子 C 和高斯核函数参数 σ、seaborn heatmap 画混淆矩阵、
模型算法:xgboost
pandas 处理数据、画图查看数据、
xgboost 参数含义、xgboost 调参、
模型算法:这个项目的目的主要是演示怎么处理数据
pandas 处理数据、画图、
模型算法:LogisticRegression、随机森林
有一段算混淆矩阵的代码、
离散值处理、LabelEncoder、One-hot Encoding、get_dummies、binning、分位数切分、对数变换、Timestap、时间相关特征
nltk 停词、词袋模型、N-Grams 模型、TF-IDF、LDA、word2vec、
模型算法:GBDT、Xgboost、LightGBM
三个算法的简单原理、算法参数、效果性能对比、
模型算法:LightGBM
完全是 pandas 应用教学,从这个例子学会了 groupby、apply、inplace、shift、merge、log 变换、
模型算法:KNN、Logistic Regression、Random Forest、Naive Bayes、Decision Tree、Gradient Boosting Trees
这个项目用了 6 个算法,最后通过比较 AUC 来选取最好的模型。
特征清洗和特征工程流程和常用方法、特征选择、特征相关性、特征重要性、单变量分析、双变量分析、ROC、AUC、
模型算法:LDA
这个项目是用代码实现了 LDA 的算法公式,演示了整个算法
模型算法:PCA、KMeans、GMM
模型算法:HMM
hmmlearn 工具包用法、维特比算法求解、
模型算法:词袋模型、word2vec、深度学习 CNN 和 RNN
正则表达式过滤特殊字符、画词频图并截断频数少的、
模型算法:LogisticRegression、词袋模型、word2vec
word2vec 参数、语言数据处理流程:去除 HTML 标签、去除标点、分词、去除停用词、重新组合句子、
模型算法:Linear Regression、Support Vector Machine Regression、Random Forest Regression、Gradient Boosting Regression、K-Nearest Neighbors Regression
可以设置图像统一尺寸、缺失值处理(自己定义的函数)、EDA、去除离群点、kdeplot、相关性分析、
imputer 缺失值填充、交叉验证、
按重要性进行特征选择、lime 展示特征影响、
交叉验证、precision、recall、ROC、AUC、
模型算法:线性回归
线性回归模型、梯度下降学习率的影响、标准化、梯度下降、随机梯度下降、mini-batch 梯度下降、三种效果对比、多项式回归、样本数量对结果的影响、正则化
模型算法:LogisticRegression
debug 一遍、多分类就是多个二分类、训练模块、定义优化目标、计算梯度、迭代参数、鸢尾花数据集实验、
模型算法:LogisticRegression
回归变分类、鸢尾花数据集、有一个画图,是视频里一点一点修改完善的、绘制决策边界、softmax 实现多分类、
模型算法:Kmeans 算法
随机定义三个中心点、计算每个点到中心的距离、找到最近中心点,并归到这一类、算同一类别新的中心点、画图展示
模型算法:Kmeans、DBSCAN、半监督学习
Kmeans 完整实现流程、绘图展示、展示训练过程中心点的变化、效果评估方法、找 K 值得方法,都试试找拐点、轮廓系数、图像分割例子、半监督学习、DBSCAN
模型算法:决策树
对照例题,完整 debug 代码、决策树的核心是特征选择,特征选择的核心是熵值的计算
模型算法:决策树
graphviz 树模型展示、决策边界展示、正则化、决策树用于回归任务、
模型算法:Bagging、随机森林、Boosting、Adaboost、Gradient Boosting、Stacking
硬投票与软投票、决策边界对比传统算法、Out Of Bag、特征重要性、early stopping、
模型算法:支持向量机 SVM
效果展示、数据标准化的影响、软间隔、非线性支持向量机、核技巧、高斯核函数、
模型算法:深度学习神经网络 初始化参数、反向传播模块、定义损失函数、逐层计算、迭代参数、手写字体识别、
模型算法:朴素贝叶斯
数据预处理、统计词频、邮件数据集实验、
关联规则、支持度、
模型算法:word2vec
CBOW、Skip-gram、负采样、训练过程、
模型算法:word2vec
数据清洗、batch 数据制作、网络训练、可视化展示、
数据处理、构建推荐系统、基于歌曲相似度推荐、基于 SVD 推荐、
模型算法:随机森林、LightGBM
日期与价格、提取时间中需要的指标、房源信息、特征与处理、建模、
模型算法:TF-IDF
文本处理、相似度计算、
模型算法:xgboost
特征工程、统计指标生成、特征信息提取、标签变换
模型算法:随机森林
剔除开挂数据、类别变量处理、绘图统计分析、热度图展示、特征重要性
模型算法:LinearRegression
连续值离散化、特征相关性、特征构建、缺失值处理、字符特征处理、pipeline、
模型算法:LinearRegression、随机森林、LightGBM、
缺失值处理、EDA 数据分析、特征展示、KDEPLOT、多项式特征、自定义特征、
模型算法:DBSCAN
读取数据、图像特征编码、聚类效果展示、
构建用户特征序列、序列特征提取、标签制作、预测结果
模型算法:xgboost
数据异常检查、时间特征提取、各种供需特征构建、准备训练数据、训练模型
模型算法:回归模型
数据清洗与标签转换、通行时间序列生成、序列确实补全、基于回归和差值完成序列特征、序列补全、特征汇总、建立回归模型、模型预测
模型算法:xgboost
部分依赖图解释、双变量分析、ShapValues 指标分析、疾病引起原因分析、竞赛项目、特征对比分析方法、结果对比分析
模型算法:BiLSTM
数据标签语料处理、输入样本填充补齐、训练网络、糖尿病医疗数据集识别
图模型信息提取、节点权重特征提取(PageRank)、deepwalk 构建图顶点特征、各项统计特征、app 安装特征、图中联系人特征、
模型算法:TF-IDF、Doc2Vec、
数据清洗与预处理、基本特征抽取、文本与词向量分析、权重划分、候选词统计特征、textrank 特征抽取、候选词相似度特征、特征工程汇总、
特征工程分析与特征提取、离散数据处理、统计与文本特征、构建低敏感度用户模型、高敏感度模型概述、
处理流程简介、数据处理、单变量绘图分析、离群点剔除、多变量展示、特征工程、
Keras 建模
tf.data 的常用函数、fashion mnist训练、画图显示结果(条形图显示结果概率)、
加载训练保存的模型、
数据增强、迁移学习、callback、
旋转、平移、缩放、channel_shift、翻转、rescale、填充、
TFRecords、
word2vec原理、CBOW、Skip-gram、负采样、
embedding、加载 glove 模型、BiLSTM、
TextCNN、
两层 LSTM、单点预测、区间预测、
代码实现算法
点预测、区间预测、保存网络结构图片、
词袋模型、LogisticRegression 基础模型、全连接网络、Embedding、word2vec、LSTM、CNN、RandomizedSearchCV、
核心是 library 文件夹下的 seq2seq.py 文件,要动手 debug 一遍、
PyTorch 是重点
分类任务 MNIST 回归任务气温预测
数据增强、花分类、
和上一个项目是在一起的,是一个项目分了两大节内容、加载 ResNet 预训练模型、
LSTM、TextCNN、再看一遍,看老师 debug 的变量内容,比自己 debug 好
GAN 的核心是看损失函数
跑不动,看视频就行了
看
学这么课的关键是看 cv2.后面的函数
读图像、读视频、截部分内容、提取颜色通道、边界填充、数值计算、图像融合、
灰度图、HSV、图像阈值、图像平滑、
腐蚀操作、膨胀操作、开运算与闭运算、梯度运算、礼帽与黑帽、
Sobel 算子、Scharr 算子、laplacian 算子、
Canny 边缘检测、高斯滤波器、梯度和方向、非极大值抑制、双阈值检测、
高斯金字塔、拉普拉斯金字塔、绘制轮廓、轮廓特征、轮廓近似、模板匹配、匹配多个对象、
直方图均衡化、自适应直方图均衡化、滤波、
harris 角点检测、
图像尺度空间、多分辨率金字塔、高斯差分金字塔、关键点的精确定位、特征点的主方向、生成特征描述、
特征匹配、单应性矩阵、
帧差法、混合高斯模型去噪、
Lucas-Kanade 算法、
1、《图像操作》
图像基本操作
图像处理
AlexNet、VGG、GoogLeNet、ResNet
R-CNN、Fast R-CNN、Faster R-CNN、Mask R-CNN
YOLO、YOLOv2、YOLOv3、YOLOv4
SSD
Attention、Transformer、Bert
Batch Normalzation
《物体检测实战》
6、Mask R-CNN 源码
24、人体姿态识别 demo
《物体检测 YOLO 系列》
8、YOLO 整体**和网络架构
13、YOLOv2 改进细节详解
28、YOLOv3 源码解读
《bert》
13、源码
55、医学糖尿病数据集
《自然语言处理实战》
8、NLTK 工具包
12、spacy 工具包
16、结巴分词器
37、商品信息可视化
134、LSTM 情感分析
139、NLP 相似度模型(读)
146、seq2seq 网络架构
148、seq2seq 基本模型
150、对话机器人
173、LSTM 时间序列分析
《语音识别技术》
1、seq2seq 序列网络模型
8、LSA 语音识别模型实战
17、stargancv2 变声器论文原理
24、stargancv2 变声器源码实战
35、语音分离 ConvTasnet 模型
41、ConvTasnet 语音分离实战
49、语音合成技术概述 和后面 tacotron
《对抗生成网络 GAN》
4、损失函数解释说明
8、CycleGAN
18、StarGAN
54、图形分辨率重构实战
63、基于 GAN 的图像补全实战
《模型部署与剪枝优化》
1、PyTorch 框架部署实战
7、YOLOv3 物体检测部署实例
11、docker 实例演示
18、TensorFlow serving 实战
23、模型剪枝 Network Slimming 算法
34、MobileNet 网络模型架构
《行人重识别实战》
1、行人重识别原理及其应用
13、基于 Attention 的行人重识别实战
22、特征融合精讲
28、基于行人局部特征融合的再识别实战
40、旷视研究院最新图模型算法解读
47、基于拓扑图的行人重识别项目实战
《知识图谱实战系列》
1、知识图谱的应用领域介绍
14、Neo4j 数据库实战
23、基于知识图谱的医药问答实战
33、文本关系抽取实战
机器学习
李航《统计学习方法》
周志华《机器学习》
吴恩达《机器学习》
李宏毅《机器学习》
林轩田《机器学习基石》《机器学习技法》
B 站机器学习白板推导
七月在线邹博《机器学习》
深度学习
邱锡鹏《神经网络与深度学习》
李沐《动手学深度学习》(MXNet)代码敲了 8 遍
《Hands-on Machine Learning With TensorFlow & Keras》
Ian GoodFellow 《Deep Learning》 花书
François Chollet《Python 深度学习》(Keras)
斋藤康毅《深度学习入门》
斋藤康毅《深度学习进阶:自然语言处理》
吴恩达《深度学习》
李宏毅《深度学习》
李沐《动手学深度学习》书本的配套视频,看了 3 遍
李飞飞 CS231n《计算机视觉》
Christopher Manning CS224n《自然语言处理》
David Silver 《强化学习》