SSYYGAM / MLDemo

This repo is all the machine learning related project codes and their corresponding blog posts at the graduate level.

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

HEXO个人博客地址:小简铺子

机器学习练手代码

描述:主要包括机器学习的基础算法的实现、相关竞赛代码,论文和项目复现代码。

1ML

1.1决策树相关算法

决策树相关算法——ID3、C4.5的详细说明及实现 —— 代码地址

本篇博客记录的是使用python实现两个决策树相关的算法模型—— ID3、C4.5。其中训练模型使用的数据集是Adult。

决策树相关算法——Bagging之基于CART的随机森林详细说明与实现

本篇博客主要记录的是基于CART决策树实现的随机森林算法,主要是从以下四个方面介绍: CART决策树的构建**;集成学习中的Bagging**;基于CART决策树的随机森林代码实现;随机森林不易过拟合的分析。(其中不易过拟合并不是说随机森林不会过拟合)

决策树相关算法——Boosting之Adaboost&GBDT详细分析与实现

本篇博客主要记录的是集成学习中的Boosting提升算法的相关实现,主要分为以下四个部分,Boosting的提出,Boosting经典算法Adaboost的分析与实现,Adaboost算法的特例提升树的分析,梯度提升算法GBDT的提出原因及分析。

决策树相关算法——XGBoost原理分析及实例实现(一)

决策树相关算法——XGBoost原理分析及实例实现(二)

决策树相关算法——XGBoost原理分析及实例实现(三) —— 代码地址

上述3篇博客主要记录的是XGBoost的代价函数的优化过程,XGBoost在构建决策树结构时,知道如何评定划分点的好坏的情况下,如何遍历查找出该树结构的切分点。最后,使用XGBoost对kaggle中的初级赛题Titanic: Machine Learning from Disaster进行预测的实例。

1.2神经网络

TensorFlow实现多层感知机及可视化训练过程中的数据记录 —— 代码地址

本篇博客主要有2个目的,第一,记录学习使用TensorFlow的操作流程;第二,将TensorFlow训练数据模型过程中的参数数据进行可视化记录。

1.3感知机及支持向量机

机器学习算法——感知机&支持向量机 —— 代码地址

本篇博客主要详细介绍两种具有一定相似性的机器学习算法——感知机Perceptron和支持向量机SVM,该两种算法都是在特征空间中寻找划分平面从而对数据集进行划分的**,但寻找划分平面的算法不同。划分平面的定义也有差距。本篇博客主要叙述思路为算法模型,代价函数,学习算法,最后的算法模型使用实例介绍。

1.4逻辑斯谛回归模型&最大熵模型

机器学习算法——逻辑斯谛回归模型&最大熵模型 —— 代码地址

本篇博客主要记录两个分类模型(逻辑斯谛回归模型和最大熵模型)原理及模型的代码实现,将这两个模型放一块的原因是这两个模型都是对数线性模型,都是由条件概率分布表示P(Y|X).

2NLP

卷积神经网络(TextCNN)在句子分类上的实现 —— 代码地址

本篇博客记录的是论文Convolutional Neural Networks for Sentence Classification中的实验实现过程,一篇介绍使用CNN对句子进行分类的论文。尽管网上有些代码已经实现了使用CNN进行句子分类(TextCNN),但是是基于Theano来实现的,本文将介绍使用TensorFlow来实现整个论文的实验过程,一方面熟悉使用TensorFlow API,另一方面加深自己对CNN在NLP上的应用的理解.

蚂蚁金融NLP竞赛——文本语义相似度赛题总结 —— 代码地址

中文文本关键词提取实例——项目说明及代码

码代码不易,欢迎star~ ,谢谢~

About

This repo is all the machine learning related project codes and their corresponding blog posts at the graduate level.


Languages

Language:Python 97.3%Language:Jupyter Notebook 2.7%