starplatinum3 / work_recommendation_system

职业推荐系统---指标分析

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

1. spider_code

  • 主要是一些爬虫代码, 指标分析需要相当的数据量, 所以需要一些测试数据,本系统数据来源是51Job。

2. 数据清洗

  • 尽量保证数据完整、一致性的条件下,做数据清洗。
  • 去掉重复的数据。
  • 将一些String字段,转换成的数字的字段,方便后期做数据分析。

2.1 数据字段

  1. job_title string 职业标题
  2. work_city string 工作城市
  3. work_experience int 工作经验
  4. education string 教育经历
  5. company_demand string 招人要求
  6. other_asks string 公司其他要求
  7. company_name string 公司名称
  8. salary float 工资
  9. position string 职能
  10. company_type string 公司类型
  11. company_size string 公司规模
  12. address string 公司地址
  13. job_message string 工作简介

About

职业推荐系统---指标分析


Languages

Language:Python 96.7%Language:HTML 1.0%Language:Thrift 0.7%Language:Tcl 0.7%Language:Java 0.4%Language:CSS 0.2%Language:JavaScript 0.2%Language:PowerShell 0.0%Language:Batchfile 0.0%