kezhenxu94 / house-renting

Possibly the best practice of Scrapy 🕷 and renting a house 🏡

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

Google搜索引擎的搜索技巧足够寻找住房信息

g10guang opened this issue · comments

使用 site、""、* 模糊搜索等足以寻找足够的住房信息。

或者说我想知道该仓库实现了哪些不能通过 Google 寻找的租房信息,我认为这个问题很关键,也就是你仓库存在的价值所在。

@g10guang 确实,只要真的是迫切找房子的人,总能够找到合适自己的寻找租房信息的方法,这只是当时首先进入我脑海的方法,除了这种方法当然会有很多其他的方法,你说的就是其中一种。

考虑到有人说扒取到的信息是垃圾,而有些人觉得这个项目对 Scrapy, Docker 的应用很不错,因此本仓库的定位后来有所改变,不再是将“租房”作为唯一目的,而是作为爬虫技术的学习和交流的一个项目,作者在努力将其优化成(不敢说最优秀)比较优秀的实践,从项目最近的更新也可以看出来,所以该项目应该还是有点存在的意义的,另一点作者觉得有意义的原因,是该仓库的 star 也有一些来自外国的,但很明显该项目并没有外国租房的信息。你觉得呢. @g10guang

附上 Reddit 的两位用户评论:https://www.reddit.com/r/scrapy/comments/8mxj87/ive_created_a_scrapy_project_to_crawl/
这些用户是从技术的方面对该项目进行评论的

image

该项目还有一些其他的功能有待开发,作者之所以引入 ES 和 Kibana,除了方便信息展示之外,还有一个原因是考虑到一些数据分析的朋友可能会想要使用这个仓库来做一些数据分析的学习(如 Kibana 的一些可视化分析)。

我不会关闭这个 Issue,如果有其他朋友使用这个仓库做了一些除找房子之外的作用,如分析各地区租房价格分布等,欢迎来这里讨论分享。

@kezhenxu94 之后我思考过,你这个项目最应该有的功能应该是:

  • 可视化
  • 过滤垃圾信息

我认为这是 google 等搜索引擎无法做到的。

对于垃圾消息,我看到 58 和自如等平台深圳租房的价格差异太大,不知道如何辨别真假信息很迷

我对 scrapy 和 elasticsearch 数据做可视化方面没太多了解,所以也不能给出有建设性的意见。

最后,我希望本仓库的核心目的应该是帮助有需要的人找到合适的房子,而 docker、scrapy、elasticsearch 的技术介绍等我觉得都是次要的。BTW,你是 master,最终仓库的走向完全取决于你。