zinbers / JobboleGirls

伯乐在线面向对象女生要求分析,python,机器学习

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

Girls Interest

  1. 爬取伯乐在线面向对象的列表信息http://date.jobbole.com/
  2. 爬取女孩的详细信息保存csv
  3. 分析计算女孩要求生成字典
  4. 利用flas+echart生成字符云

  • 4.0.0.1使用apriori算法进行分类

分类后云图效果

  • 3.0.0.1尝试使用机器学习算法Apriori进行语义聚合处理

  • 2.0.0.2原理和简单,就是比较两个字符串假如相同内容达到50以上则表示表达的意思相同;加入同一group;

  • 2.0.0.1词条聚合算法测试

  • 1.0.0.1分词后

  • 分词效果仍然不够理想自己又单独写了一个算法进行需求聚合

  • 1.0.0.1未进行分词

About

伯乐在线面向对象女生要求分析,python,机器学习


Languages

Language:Python 95.6%Language:HTML 4.4%