ZHOU 's repositories
500lines
500 Lines or Less
Easy-Search-Engine
基于<今日哈工大>新闻的简易搜索引擎
fuck-login
模拟登录一些知名的网站,为了方便爬取需要登录的网站
utils4s
scala、spark使用过程中,各种测试用例以及相关资料整理
growth-in-action-django
Growth In Action Django Version
Nutch-NewsClassify
基于nutch的新闻分类系统
gxgk-wechat-server
莞香广科微信公众号后端,使用 Python、Flask、Redis、MySQL、Celery
spark-examples
Spark examples to go with me presentation on 10/25/2014
python-goose
Html Content / Article Extractor, web scrapping lib in Python
vnpy
基于python的开源交易平台开发框架good
python-heritrix
simple python wrapper around heritrix v3.x api
CustomInterceptor
Example of a custom Flume interceptor that simply changes an event's body to "world"
HouseRentSearch
水木/豆瓣租房搜索 good
netlib
Replacement for pyRouterLib - A library for easily accessing routers and switches via ssh, telnet, and snmp
QuestionAnsweringSystem
QuestionAnsweringSystem是一个Java实现的人机问答系统,能够自动分析问题并给出候选答案。
DSC
Distributed SDN Controller
Heritrix-based-web-crawler-for-JD
京东商品的网络爬虫/web crawler for Jingdong products good
ML
机器学习实战
SharedFiles
一些平时分享的演示文件
recommend
基于网络爬虫及用户的协同过滤推荐算法的电影推荐系统
Zhaoxinwo
找新窝iOS客户端,原网站zhaoxinwo.com
news_search_engine
新闻搜索引擎good
Plan-for-combating
Talk is cheap,show me the code.
zhihuWebSpider
知乎爬虫,基于webmagic框架 .A java web spider base on webmagic.
Django-Design-Patterns-and-Best-Practices
《Django设计模式与最佳实践》2015年03月-基于Django 1.7
goodnews_postgresql
postgresql #goodzm#
wooyun_public
good 乌云公开漏洞、知识库爬虫和搜索 crawl and search for wooyun.org public bug(vulnerability) and drops
feature_select
在sklearn下,几种常用的特征选择方法