JustForFunnnn / webspider

A website of IT position data & analysis, helps you to get a better understanding of the requirements and trends of the IT job market

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

将拉勾中爬下来的所有数据都存入数据库。

arjenzhou opened this issue · comments

想要将拉勾中爬下来的所有数据都存入数据库应该使用哪条命令?

# 启动定时任务分发器
env/bin/celery_beat

是定期启动所有爬虫吗?

commented

提个新需求:提取某一种职业要求

对某一个行业职位要求的标签提取,能计算出每年对某一种职位的的标签的变迁

  1. 长期霸版的为基础技能标签
  2. 近2年新增的标签

Title的类型的分布,比如同样的产品经理,又分了前端、后端、B端、C端、商业、增长等,输出一个title的分布

  1. 分析出产品经理的通用职能需求
  2. 每一种产品经理的偏向性技术要求标签