jm199504 / Other-Notes

广泛的个人笔记

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

广泛的个人笔记

1.Distance:距离计算

1.1 欧氏距离

1.2 曼哈顿距离

1.3 切比雪夫距离

1.4 闵可夫斯基距离

1.5 标准化欧氏距离

1.6 马氏距离

1.7 夹角余弦

1.8 汉明距离

1.9 杰卡德距离&杰卡德相似系数

1.10 相关系数& 相关距离

2.File-IO:文件操作流

2.1 os

2.2 shutil

2.3 json

2.4 sys

3.绘制ROC曲线

基于scikitplot库

4.Activation-Function:激活函数

4.1 Sigmoid

4.2 Tanh

4.3 Relu

4.4 LeakyReLu

4.5 LReLU 与 PReLU

4.6 ELU

5.参数优化

5.1 RandomizedSearchCV | 随机搜索

5.2 GridSearchCV | 网格搜索

5.3 BayesianOptimization | 贝叶斯超参优化

5.4 Pipeline | 个人常用方法

6.特征选择

6.1 过滤低方差特征

6.2 单变量特征选择

6.3 递归特征淘汰(结合预测模型)

6.4 模型特征选择

7.缺失值处理

7.1 直接删除

7.2 使用一个全局常量填充缺失值(均值、中位数、众数、前一个非空值、后一个非空值)

7.3 前后插值法

7.4 KNN填充法

7.5 随机森林填充

8.数据归一化

8.1 最大最小归一化

8.2 均值归一化

8.3 z-score标准化

9.评估函数

9.1 分类问题

9.1.1 Accuracy

9.1.2 Precision

9.1.3 Recall

9.1.4 F-score

9.1.5 ROC/AUC

9.1.6 Log Loss

9.1.7 Contrastive Loss

9.2 回归问题

9.2.1 MAE (Mean absolute error)

9.2.2 MSE (Mean Squared Error)

9.2.3 RMSE(Root means squared error)

9.2.4 MAPE (Mean absolute % error)

9.2.5 SMAPE (Symmetric Mean Absolute Percentage Error)

9.2.6 R Squared

10.损失函数

10.1 均方误差/平方损失/L2损失(MSE)

10.2 平均绝对误差/L1 损失

10.3 平均偏差误差(mean bias error)

10.4 Hinge Loss/多分类 SVM 损失

10.5 交叉熵损失/负对数似然

Cheat Sheet 个人小抄

About

广泛的个人笔记


Languages

Language:Jupyter Notebook 99.7%Language:Python 0.3%