jevy146 / GeJing-Cup

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

“隔镜杯”数据爬虫开发大赛


一、赛事主题

赛事名称:隔镜杯数据爬虫开发大赛

主办方:上海隔镜信息科技有限公司

二、大赛简介

“隔镜杯”数据爬虫开发大赛,是隔镜科技举办的创意开发大赛,旨在为开发者和数据爬虫爱好者提供一个有趣的框架平台,尽情表达关于数据的灵感。 本次开发者大赛的主题为“让数据回家”,主办方希望通过本次比赛,激发参赛者关于个人数据主权的创意,我们鼓励参赛者通过爬虫技术,将自己的个人数据从互联网拿回自己手中,并基于这些数据开发各类有趣的应用,做数据的主人。

三、赛事日程

报名启动: 6 月 22 日
报名 & 作品提交截止日期: 7 月 22 日
评比公布: 8 月 7 日

四、如何参赛

1. 报名方式

  • 关注公众号 我的数据百宝箱(微信号:mydatabox),回复“报名”,获取报名链接
  • 或通过社区论坛置顶贴报名

2. 加入大赛技术协作交流群

  • 添加大赛客服微信:mydatahome,回复“开发者+姓名”,加入大赛技术协作群

3. 准备作品

  • 首先想到一个关于个人数据采集的好点子
  • 我们准备了一个简单的框架和一些爬虫样例,我们鼓励您fork我们的爬虫代码库,并基于此进行创作。您也可以选择其他语言和框架进行开发。
  • 完成的作品应当具备完整可运行的代码、测试用例、使用文档、项目介绍材料(可以包括文档、PPT、视频等)。

4. 提交作品

  • 确认已经完成了报名流程(提交了团队信息,并且同意了参赛协议)
  • 确认比赛作品已经完成,并且可以通过阅读项目README文档获取所有资料。如果是私有库,请确认已经给官方账号(id: MyDataHomes)添加了阅读权限。
  • fork本仓库,拷贝作品提交模板来创建一份副本,仔细阅读模板并填充团队和项目信息,注意不要遗漏必填项,也不要修改其他任何文件
  • 重命名为 团队名称.md。
  • 发起一次pull request完成作品提交申请。

五、参赛规则

1. 组队要求

  • 个人或自由组队参赛,每支队伍不超过3人,每人只能参加一支队伍,以队伍参赛须确定一名队长,便于后续赛事联系和通知
  • 参赛选手报名须提供真实联系信息

2. 参赛作品

作品内容:爬虫工具(含源代码、使用文档、测试用例等),作品介绍材料

作品要求

  • 进行爬虫工具的开发。爬虫工具能够帮助用户抓去自己的个人数据,抓取的数据源类型不限(如淘宝、京东等);
  • 参赛者可基于爬虫工具获取的数据,自主进行数据应用的设计,本要求为可选项;
  • 参赛者可以基于指定的爬虫项目进行开发,也可以自行开发;
  • 参赛作品的开发语言不限;
  • 作品介绍文档需涵盖爬虫算法思路、实现方法、爬虫运行与测试方法、数据应用介绍(如有)等,介绍文档格式不限。

3. 评审标准

本次比赛将由隔镜科技与上海交通大学软件学院的专家评判打分,评分标准如下:

爬虫评分(100分)

  • 爬虫性能(40%):包括爬取数据的完整度、性能,爬虫鲁棒性等指标。
  • 代码质量(30%):包括代码撰写是否规范、接口定义是否清晰、注释是否完整等。
  • 创新性(30%):包括在数据获取方式、爬虫算法设计等方面的创新等。

附加分(20分)

  • 用户界面(10%):良好的用户界面设计,操作方式、风格等方面具有创意和美感。
  • 数据应用(10%):数据应用的实用价值、创新性等。

六、获奖制度

  1. 奖金预设

一等奖(1支队伍):10000元 + 证书

二等奖(3支队伍):5000元 + 证书

三等奖(6支队伍):2000元 + 证书

优秀奖(若干):将根据实际参赛队伍数量确定优秀奖名额,将获得由隔镜提供的神秘礼品

  1. 开源爬虫奖 对于基于指定爬虫代码库开发的爬虫工具,主办方将挑选优秀的作品提交至Github项目中,被选作品将获得“开源爬虫奖”,并获得神秘礼品。(本奖项与前述不冲突,可同时获取)

About