wanghuafeng's repositories
e-business
电商爬虫系统:京东,当当,一号店,国美爬虫(代理使用);论坛、新闻、豆瓣爬虫
zhihu_spider
知乎爬虫---知乎点赞数超过1000的问题及回答,知乎神回复
baidu_spider
百度爬虫:热词,词频,音乐,poi信息
ngram_engineArighmetic
输入法引擎算法(26键、9键),自然语言处理,切词算法,标音算法,N元模型的生成
family_name_handle
解析维基,姓氏大全网站,统计姓氏信息,包含切词方法以及音调到拼音数字的转换
sina_spider
新浪爬虫(新浪微博爬虫,新浪微博评论,新浪每日持续更新新闻,新浪新闻爬虫)
router_login_restart
小米路由、tp_link路由--远程自动登陆以及重启
blizzard-hash-slicer
暴雪哈希表作为存储的切词算法
common_utils
封装一些通用工具方法
blizzard_hash_for_android
降低暴雪哈希的内存消耗(理论上牺牲碰撞率),千万量级别以内的数据,碰撞率和内存消耗都优与bloom filter
sentence_filtered
NLP 数据清洗,通过fabric进行远程控制
vertical_search
垂直领域搜索==>app,movie,music,book
architecture.of.internet-product
互联网公司技术架构,微信/淘宝/微博/腾讯/阿里/美团点评/百度/Google/Facebook/Amazon/eBay的架构,欢迎PR补充
crawler-master-v3
first commit
CS-Notes
:books: 技术面试必备基础知识、Leetcode、计算机操作系统、计算机网络、系统设计、Java、Python、C++
fucking-algorithm
手把手撕LeetCode题目,扒各种算法套路的裤子。English version supported! Crack LeetCode, not only how, but also why.
Review_Reverse
:wave:2019年末总结下今年做过的逆向,整理代码,复习思路。:pray:拼夕夕Web端anti_content参数逆向分析:japanese_goblin: WEB淘宝sign逆向分析;:smiley_cat:努比亚Cookie生成逆向分析;:raised_hands:百度指数data加密逆向分析 :footprints:今日头条WEB端_signature、as、cp参数逆向分析:notes:知乎登录formdata加密逆向分析 :clown_face:KNN猫眼字体反爬:tongue:Boss直聘Cookie加密字段__zp_stoken__逆向分析
shootback
building socket tunnel
weixin_crawler
高效微信公众号历史文章和阅读数据爬虫powered by scrapy
ZenTracer
an android method tracer gui tool base-on frida