huatWL's repositories
SparkTextClassifier
使用Spark NaiveBayes 实现中文文本分类 use spark NaiveBayes for text classification
advanced-java
😮 互联网 Java 工程师进阶知识完全扫盲
Apriori
Apriori algorithm implement
awesome-public-datasets
A topic-centric list of high-quality open datasets in public domains. By everyone, for everyone!
Bayes
用java实现的贝叶斯分类算法。用于大数据的分类。
ChineseTextClassifier
实现中文文本分类,支持文件、文本分类,基于多项式分布的朴素贝叶斯分类器。由于工作实际应用是二分类,加之考虑到每个分类属性都建立map存储词语向量可能引起的内存问题,所以目前只支持二分类。当然,直接复用这个结构扩展到多分类也是很容易。之所以自己写,主要原因是没有仔细研读mahout、weka等代码,不能灵活地进行中文分词、停用词过滤、词频统计、TF-IDF等,也就是向量化和特征提取没有自己手写相对灵活。
Classification
软件工程大作业,文本自动分类
Classification-1
分类算法
classify
文本分类
CS-Notes
:books: 技术面试必备基础知识、Leetcode、计算机操作系统、计算机网络、系统设计、Java、Python、C++
cws_evaluation
Java开源项目cws_evaluation:中文分词器分词效果评估对比
EmotionAnalysis
针对手机评论数据的情感挖掘与分析项目,基于依存句法分析和情感词库提取特征词,并对特征词做情感极性预测标注。
FPtree
FPtree algorithm to mining frequent pattern
hello-world
Hello World guide
JCSprout
👨🎓 Java Core Sprout : basic, concurrent, algorithm
knn-classify
KNN分类算法的分布式实现。
MachineLearning
Machine Learning in Action(机器学习实战)
Sentiment-1
基于情感词典和朴素贝叶斯算法实现中文文本情感分类
ShortTextClassify
短文本分类代码
SSO
单点跨域登录系统,同时搭配权限拦截器
TaobaoCluster
淘宝商品评价聚类分析项目
TextClassifier-SVM
基于SVM的短文本分类研究
TextRecommended
机器学习TF-IDF SVM文本分类器实现
tomcat
Apache Tomcat
Tomcat-Research
Tomcat源代码学习研究(包括代码注释、文档、用于代码分析的测试用例)
weibo-spider
新浪微博爬虫,采用Java语言开发,基于HTTPClient 4.0,采用MySQL存储爬取数据,支持多进程并发执行。功能包括:爬取微博、评论、转发、关注列表(层次)。根据数据需求,持续更新...