Mcxvxv's starred repositories
SummaRuNNer
The PyTorch Implementation of SummaRuNNer
roberta_zh
RoBERTa中文预训练模型: RoBERTa for Chinese
TextRank4ZH
:deciduous_tree:从中文文本中自动提取关键词和摘要
dianping_spider
大众点评爬虫(全站可爬,解决动态字体加密,非OCR)。持续更新
competition_baselines
开源的各大比赛baseline
longformer-chinese
chinese version of longformer
longformer
Longformer: The Long-Document Transformer
Chinese-BERT-wwm
Pre-Training with Whole Word Masking for Chinese BERT(中文BERT-wwm系列模型)
weiboSpider
新浪微博爬虫,用python爬取新浪微博数据
Toutiao_Spider
今日头条新闻详情页面爬取,逆向 Cookies 中 __ac_signature 生成过程
Python3-Spider
Python爬虫实战 - 模拟登陆各大网站 包含但不限于:滑块验证、拼多多、美团、百度、bilibili、大众点评、淘宝,如果喜欢请start ❤️
ECommerceCrawlers
实战🐍多种网站、电商数据爬虫🕷。包含🕸:淘宝商品、微信公众号、大众点评、企查查、招聘网站、闲鱼、阿里任务、博客园、微博、百度贴吧、豆瓣电影、包图网、全景网、豆瓣音乐、某省药监局、搜狐新闻、机器学习文本采集、fofa资产采集、汽车之家、国家统计局、百度关键词收录数、蜘蛛泛目录、今日头条、豆瓣影评、携程、小米应用商店、安居客、途家民宿❤️❤️❤️。微信爬虫展示项目:
douyin_uid_converter
抖音昵称/号转为抖音uid
douyin_search_result
Xposed+Sekiro简单实现抖音搜索结果获取
douyin_device_register
douyin device register
douyin_search
Frida_rpc + Flask简单实现抖音搜索接口