There are 3 repositories under jieba topic.
jieba analysis plugin for elasticsearch 7.0.0, 6.4.0, 6.0.0, 5.4.0,5.3.0, 5.2.2, 5.2.1, 5.2, 5.1.2, 5.1.1
Python文本挖掘系统 Research of Text Mining System
turn natural language into structured data(支持中文,自定义了N种模型,支持不同的场景和任务)
Chinese-Text-Classification,Tensorflow CNN(卷积神经网络)实现的中文文本分类。QQ群:522785813,微信群二维码:http://www.tensorflownews.com/
微信机器人,基于Python itchat接口功能实例展示:01-itchat获取微信好友或者微信群分享文章、02-itchat获取微信公众号文章、03-itchat监听微信公众号发送的文章、04 itchat监听微信群或好友撤回的消息、05 itchat获得微信好友信息以及表图对比、06 python打印出微信被删除好友、07 itchat自动回复好友、08 itchat微信好友个性签名词云图、09 itchat微信好友性别比例、10 微信群或微信好友撤回消息拦截、11 itchat微信群或好友之间转发消息
bilibili弹幕分析,包含爬虫、词云分析、词频分析、情感分析、构建衍生指标,可视化
专注于解决自然语言处理领域的几个核心问题:词法分析,句法分析,语义分析,语种检测,信息抽取,文本聚类和文本分类. 为相关领域的研发人员提供完整的通用设计与参考实现. 涵盖了多种自然语言处理算法,适配了多个自然语言处理框架. 兼容Lucene/Solr/ElasticSearch插件.
新闻分类系统&谣言处理系统
*UNSUPPORTED* Use igcloud to generate Instagram Word Cloud ! 🛫 🛫 ✈ 🔝
訓練中文詞向量 Word2vec, Word2vec was created by a team of researchers led by Tomas Mikolov at Google.
Fast Jieba Chinese text segmentation on browser without backend/NPM | 结巴分词网页版, 基于 WebAssembly 的纯前端实现; 亦可用于 Deno
基于机器学习的 iOS 中文垃圾短信过滤 App
根据jieba的tf-idf算法,及自定义的关键词,对.txt文件批量生成anki填空符。
使用python,从知网上爬取相关的数据,并进行数据分析,涉及到pycharm和jupyter notebook
The Jieba Chinese Word Segmentation Implemented in PHP