mengzhongjack / ML-and-DL

self-learning

ML-and-DL

self-learning

Author

wangzhong

目录

basic-model
- 机器学习手写算法和实战，如线性回归，LR,SVM,KMEANS等
- 异常检测实战和推荐算法实战等
- 吴恩达机器学习作业
dlmodel
- 深度学习主要模型复现，主要是CNN方向
- 深度之眼论文精读代码复现
math
- 算法数学原理推导
papers
- 阅读过的经典论文
- 深度学习巨头Lecun论文主页
python-dask
- dask分布式计算框架教程和使用
pytorch
- basic-operate: pytorch简单基础操作和操作导图
- regression-practice：简单的linear神经网络搭建
- CNN: 卷积神经网络实战
- RNN: 循环神经网络实战
- GAN: 对抗生成网络实战
- tensor-board: pytorch可视化工具
- videoprocess: c3d网络模型实战
- template：数据load + 网络模型 + 模型训练的模板

注意！

数学公式推导的md文件用typora写的，如果无法正常显示，请用typora打开查看

更新日志

2021.01.24更新

pytorch-alexnet代码复现实战
1. 数据集为kaggle猫狗大战，数据不上传，自行到官网下载，地址在代码文件里
2. 采用官方预训练模型，模型自行下载，地址在代码文件
3. 项目分层为 data/results/src/tools

2021.01.21更新

增加数据读取，模型创建，模型训练的一体化模板，只需更改json文件，输入配置化参数即可
1. 入口为train.py
2. parse_config.py读取参数，并且会写入当前运行的文件夹下，提供函数自行创建类
3. base文件夹下是loader和trainer的基类，拥有基础的一些变量和函数
4. loader文件夹下是实际的loader类，直接进行data的读取
5. logger文件夹是日志相关和可视化工具
6. model文件夹下是实际的网络模型
7. trainer文件夹下继承了trainer的基类，主要是实现每个epoch的训练过程，字典形式返回loss，acc，topKacc的average
8. saved文件夹保存网络模型和可视化数据还有打印的日志
9. 注意，模板不支持cpu和gpu跨读取模型数据，需要自行处理map_location参数

2021.01.18更新

新增阅读论文c3d网络模型进行视频动作分类
c3d-UCF-101项目实战（论文代码复现）
1. 视频动作101个分类，训练时间非常久，GPU也需要训练2-3天
2. 数据集UCF-101压缩包有6个多G，请进入下面的网址自行下载
3. UCF-101
4. 重点是理解三维卷积网络

2021.01.16更新

CycleGAN图像转换模型开源项目代码学习（阅读为主）
1. 原项目github
2. 主要是看生成器和判别器的搭建，和loss函数的学习

2021.01.15更新

GAN对抗生成网络简单实战
1. BCE-loss理解
2. 简单GAN网络MNIST数据实战

2021.01.14更新

增加新的大模块：dl-model
1. 该模块主要是运用成熟框架进行主流模型的搭建
2. 目前计划使用框架为pytorch
3. 模型主要偏CNN和CV方向

2021.01.12更新

pytorch可视化工具tensorboardX学习
1. tensorboardX gitHub主页
2. pip install tensorboardX进行安装
3. 注意该三方库依赖tensorflow，需要安装tensorflow
4. 运行代码后，需要在命令行进行tensorboard启动，具体语句在其github主页

2021.01.11更新

pytorch文本分类项目代码
1. open-source文件下为开源项目，非本人所写代码
2. 旨在了解pytorch是如何去搭建RNN网络模型的

2021.01.08更新

resnet迁移学习实战
1. model为resnet152
2. 102图片分类
3. 切记使用GPU进行训练，CPU非常非常慢
4. 先进行FC的参数训练，再进行全参数训练

2021.01.07更新

transform数据扩充实战，ImageFolder和DataLoader
1. 通过transform变换数据后，通过loader还原为图像类型并打印
迁移学习数据处理部分
1. 迁移学习未完成，只是做了数据的transform和batch（一个函数）
2. 计划迁移resnet进行部分训练

2021.01.06更新

更新了pytorch上的首个卷积神经网络搭建和mnist分类实战
1. 两层卷积 + RELU + max polling + 一层全连接
2. batch size为64
3. 损失函数为交叉熵损失函数
4. 最外层迭代次数为3，内部每训练100个batch size进行一次测试集测试和准确率打印

2021.01.04更新

更新了torch的网络模型回归实战
1. 手写梯度下降进行模型训练
2. 使用nn模块进行模型训练，优化器为adam，会自动调整学习率

2020.12.22更新

更新了torch的基础tensor练习
1. tensor不同维度的创建，以及dim和shape或者size的查看
2. 二维矩阵的矩阵乘法和对应位置乘法
增加已读经典论文AlexNet

2020.12.13更新

增加线性回归基于pytorch的demo练习
1. 可以让模型和数据在GPU上进行训练
2. 通过torch.optim生成迭代器进行权重优化

2020.12.09更新

增加pytorch自动求导机制练习

2020.12.04更新

增加pytorch使用模块
1. pytorch简单基础操作
2. pytorch基础操作导图
3. windows配置cuda+cudnn+pytorch查看GPU版是否安装成功

2020.11.28更新

增加论文模块 1.增加了CNN中最经典的lenet-5论文

2020.11.26更新

手写推荐算法
1. 应用场景为用户推荐电影
2. 对一个新用户，随机给部分电影打分，初始化权重
3. 训练之后预测新用户给所有电影的打分，从而推荐电影

2020.11.24更新

异常检测手写算法
1. 多元正态密度函数
2. 选取最佳阈值epsilon

2020.11.21更新

math增加PCA算法步骤和原理
增加PCA算法
1. 手写PCA，并计算降维后剩余方差，进行简单实战
2. sklearn库的PCA实战
3. 使用PCA对照片进行降维显示

2020.11.19更新

线性回归茅台股价预测
1. 基于天数单特征预测，效果极差
2. 根据股票多特征预测，准确率97%
3. 数据集来自tushare三方库

2020.11.18更新（2）

部分代码增加注释，方便查看是哪个项目的代码
优化kmeans代码
线性回归boston房价预测实战
1. 数据和标准化来自sklearn库
2. train集和test集切分来自sklearn库
3. 模型也是直接调用sklearn库

2020.11.18更新

优化项目模块结构
dask分布式计算框架教程和实战

2020.11.17更新

更新疫情预测实战
1. 使用sklearn的linear model进行简单预测
2. 使用sklearn多项式函数进行预测（随着degree增加会过拟合）

2020.11.08更新

更新无监督模型kmeans手写代码
1. 手写kmeans算法
2. 讨论随机初始点选取的影响
3. 用kmeans对图片进行压缩
4. 用sklearn的Kmeans进行模型训练

2020.11.01更新

更新SVM算法的代码，非手写，使用sklearn，主要是熟悉工具的使用
1. 线性SVM
2. 非线性SVM，RBF核函数，了解gamma超参数的意义
3. 确认C和gamma的最优参数
4. 用SVM进行垃圾邮件分类

2020.10.27更新

更新方差和偏差代码
1. 随着样本的增加更新训练集和验证集误差，高偏差
2. 随着多项式数目增加，出现高方差
3. 加入正则化，选取最佳正则化
4. 用最佳lambda和测试集查看泛化能力

2020.10.24更新

增加线性回归相关公式推导，md和pdf两个格式

2020.10.23更新

back propagation为手写反向传播识别手写数字

2020.10.22更新

neural network为体验神经网络的推算流程，已给定weights，使用forward propagation得到最后的决策曲线。

2020.10.19更新

linear regression为手写线性回归并画出决策曲线
logistic regression为手写逻辑回归并画出决策曲线，用scipy进行迭代得到theta，另外用logistic手写一对多分类，识别1到10的数字。

About

self-learning

Languages

Language:Python 77.6%Language:HTML 16.8%Language:Jupyter Notebook 3.5%Language:Shell 1.0%Language:MATLAB 0.5%Language:TeX 0.4%Language:Dockerfile 0.1%