这是一个基于tkinter开发的文本处理与挖掘GUI工具
我希望不想使用代码来进行文本挖掘的小伙伴们,可以无障碍的尽情享受文本挖掘所带来的成就感与快乐
目前版本正在不断迭代中,基础功能已经上线,接下来会每隔一周进行一次更新
鉴于字段名称匹配测试文件尚未完成脱敏,所以暂不上传,未来脱敏完毕会考虑上传
基础功能:
(1)词频统计&医患文本分割
(2)相似字段匹配
(3)常见四格表卡方计算器
(4)词云生成
(5)基于CountVector的常见机器学习分类器
(6)基于CountVector的LDA文本主题模型发现
2019.09.11更新:朴素贝叶斯调参更新,细节优化,详见更新日志