Girls Interest 爬取伯乐在线面向对象的列表信息http://date.jobbole.com/ 爬取女孩的详细信息保存csv 分析计算女孩要求生成字典 利用flas+echart生成字符云 4.0.0.1使用apriori算法进行分类 分类后云图效果 3.0.0.1尝试使用机器学习算法Apriori进行语义聚合处理 2.0.0.2原理和简单,就是比较两个字符串假如相同内容达到50以上则表示表达的意思相同;加入同一group; 2.0.0.1词条聚合算法测试 1.0.0.1分词后 分词效果仍然不够理想自己又单独写了一个算法进行需求聚合 1.0.0.1未进行分词