Yvette-Wang's starred repositories
git-for-win
Git for Windows. 国内直接从官网下载比较困难,需要翻墙。这里提供一个国内的下载站,方便网友下载
awesome-product-thought
关于创业,关于如何做好产品的一些优秀文章个人收集
ECommerceCrawlers
实战🐍多种网站、电商数据爬虫🕷。包含🕸:淘宝商品、微信公众号、大众点评、企查查、招聘网站、闲鱼、阿里任务、博客园、微博、百度贴吧、豆瓣电影、包图网、全景网、豆瓣音乐、某省药监局、搜狐新闻、机器学习文本采集、fofa资产采集、汽车之家、国家统计局、百度关键词收录数、蜘蛛泛目录、今日头条、豆瓣影评、携程、小米应用商店、安居客、途家民宿❤️❤️❤️。微信爬虫展示项目:
Product-Notes
:books: 产品迷思,不仅仅是产品经理,对于产品设计、交互体验、项目管理、行业视点等多方面的思考。
Road2StrategyPM
产品策划开发修炼手记 👩🏻💻
KnowledgeGraphData
史上最大规模1.4亿中文知识图谱开源下载
GPT2-Chinese
Chinese version of GPT2 training code, using BERT tokenizer.
pycorrector
pycorrector is a toolkit for text error correction. 文本纠错,实现了Kenlm,T5,MacBERT,ChatGLM3,LLaMA等模型应用在纠错场景,开箱即用。
smoothnlp_api
公共数据API服务
debtDefaultResearch
对截止至2017年7月17日的债券违约事件进行梳理归因,并寻找宏观流动性影响因素,组成数据集。运用Lasso回归进行特征提取后,输入带L2惩罚项LR、SVM、NN、GBDT、RF等机器学习模型进行违约预测,得出GBDT预测效果最好以及特征工程对线性模型预测效果具有重要性的结论。
NLP-Projects
word2vec, sentence2vec, machine reading comprehension, dialog system, text classification, pretrained language model (i.e., XLNet, BERT, ELMo, GPT), sequence labeling, information retrieval, information extraction (i.e., entity, relation and event extraction), knowledge graph, text generation, network embedding
SOHU-baseline
:blush:搜狐算法大赛(实体+情感)简单baseline(比较容易理解)(使用lgb模型做二分类)
REKCARC-TSC-UHT
清华大学计算机系课程攻略 Guidance for courses in Department of Computer Science and Technology, Tsinghua University
THU-CST-Cracker
清华大学计算机系课程攻略 Guidance for courses in Department of Computer Science and Technology, Tsinghua University
USTC-Course
:heart:**科学技术大学课程资源
machinelearning
My blogs and code for machine learning. http://cnblogs.com/pinard