yang1's repositories

bert-as-service

Mapping a variable-length sentence to a fixed-length vector using BERT model

Language:PythonLicense:MITStargazers:0Issues:0Issues:0

BERT-AttributeExtraction

USING BERT FOR Attribute Extraction in KnowledgeGraph. fine-tuning and feature extraction. 使用基于bert的微调和特征提取方法来进行知识图谱百度百科人物词条属性抽取。

Language:PythonStargazers:0Issues:0Issues:0

BERT-BILSTM-GCN-CRF-for-NER

在原本BERT-BILSTM-CRF上融合GCN和词性标签等做NER任务

Language:PythonStargazers:0Issues:0Issues:0

cfda_spider

爬取cfda 数据

Language:PythonStargazers:0Issues:0Issues:0

chinese-poetry

The most comprehensive database of Chinese poetry 🧶最全中华古诗词数据库, 唐宋两朝近一万四千古诗人, 接近5.5万首唐诗加26万宋诗. 两宋时期1564位词人,21050首词。 🤪 😜 阿里招p6/p7 Python Golang | gaojunqi@outlook.com | 上海张江

Language:JavaScriptLicense:MITStargazers:0Issues:0Issues:0

ChineseSemanticKB

ChineseSemanticKB,chinese semantic knowledge base, 面向中文处理的12类、百万规模的语义常用词典,包括34万抽象语义库、34万反义语义库、43万同义语义库等,可支持句子扩展、转写、事件抽象与泛化等多种应用场景。

Stargazers:0Issues:0Issues:0

cocoNLP

A Chinese information extraction tool.

Language:PythonStargazers:0Issues:1Issues:0

comment_data_mining

对商品的评论进行数据挖掘得到评论标签(商品属性+评论观点),以及用户的分组信息

Stargazers:0Issues:0Issues:0
Stargazers:0Issues:1Issues:0

Deep_Learning_Keras

Keras深度学习代码,一切大事必做于细!

Language:PythonStargazers:0Issues:0Issues:0

detect-lstm-model

检测恶意 URL and Request (Bi-LSTM、Bi-LSTM + CNN、CNN + Bi-LSTM、CNN + Bi-LSTM + CNN)

Language:Jupyter NotebookStargazers:0Issues:0Issues:0

doctor360

医疗医药相关爬虫

Language:PythonStargazers:0Issues:0Issues:0

funNLP

中英文敏感词、语言检测、中外手机/电话归属地/运营商查询、名字推断性别、手机号抽取、身份证抽取、邮箱抽取、中日文人名库、中文缩写库、拆字词典、词汇情感值、停用词、反动词表、暴恐词表、繁简体转换、英文模拟中文发音、汪峰歌词生成器、职业名称词库、同义词库、反义词库、否定词库、汽车品牌词库、汽车零件词库、连续英文切割、各种中文词向量、公司名字大全、古诗词库、IT词库、财经词库、成语词库、地名词库、历史名人词库、诗词词库、医学词库、饮食词库、法律词库、汽车词库、动物词库、中文聊天语料、中文谣言数据、百度中文问答数据集、句子相似度匹配算法集合、bert资源、文本生成&摘要相关工具、cocoNLP信息抽取工具、国内电话号码正则匹配、清华大学XLORE:中英文跨语言百科知识图谱、清华大学人工智能技术系列报告、自然语言生成、NLU太难了系列、自动对联数据及机器人、用户名黑名单列表、罪名法务名词及分类模型、微信公众号语料、cs224n深度学习自然语言处理课程、中文手写汉字识别、中文自然语言处理 语料/数据集、变量命名神器、分词语料库+代码、任务型对话英文数据集、ASR 语音数据集 + 基于深度学习的中文语音识别系统、笑声检测器、Microsoft多语言数字/单位/如日期时间识别包、中华新华字典数据库及api(包括常用歇后语、成语、词语和汉字)、文档图谱自动生成、SpaCy 中文模型、Common Voice语音识别数据集新版、神经网络关系抽取、基于bert的命名实体识别、关键词(Keyphrase)抽取包pke、基于医疗领域知识图谱的问答系统、基于依存句法与语义角色标注的事件三元组抽取、依存句法分析4万句高质量标注数据、cnocr:用来做中文OCR的Python3包、中文人物关系知识图谱项目、中文nlp竞赛项目及代码汇总、中文字符数据、speech-aligner: 从“人声语音”及其“语言文本”产生音素级别时间对齐标注的工具、AmpliGraph: 知识图谱表示学习(Python)库:知识图谱概念链接预测、Scattertext 文本可视化(python)、语言/知识表示工具:BERT & ERNIE、中文对比英文自然语言处理NLP的区别综述、Synonyms中文近义词工具包、HarvestText领域自适应文本挖掘工具(新词发现-情感分析-实体链接等)、word2word:(Python)方便易用的多语言词-词对集:62种语言/3,564个多语言对、语音识别语料生成工具:从具有音频/字幕的在线视频创建自动语音识别(ASR)语料库。

Language:PythonStargazers:0Issues:1Issues:0

HarvestText

文本挖掘和预处理工具(文本清洗、新词发现、情感分析、实体识别链接、关键词抽取、知识抽取、句法分析等),无监督或弱监督方法

License:MITStargazers:0Issues:0Issues:0

Jiagu

Jiagu深度学习自然语言处理工具 中文分词 词性标注 命名实体识别 情感分析 知识图谱关系抽取 新词发现 关键词 文本摘要

Language:PythonLicense:MITStargazers:0Issues:1Issues:0

keras

Deep Learning for humans

Language:PythonLicense:NOASSERTIONStargazers:0Issues:0Issues:0

Keras-TextClassification

中文长文本分类、短句子分类、多标签分类、两句子相似度(Chinese Text Classification of Keras NLP, multi-label classify, or sentence classify, long or short),字词句向量嵌入层(embeddings)和网络层(graph)构建基类,FastText,TextCNN,CharCNN,TextRNN, RCNN, DCNN, DPCNN, VDCNN, CRNN, Bert, Xlnet, Albert, Attention, DeepMoji, HAN, 胶囊网络-CapsuleNet, Transformer-encode, Seq2seq, SWEM

License:MITStargazers:0Issues:0Issues:0

LearnTensorFlow

最初从才云科技Caicloud《TensorFlow实战Google深度学习框架》和网上资源学习TensorFlow框架,过了一年多学的杂乱无章。此次温故而知新沉下心系统专研学习一番。在理解相关深度学习概念以及复原代码理解的基础上,不断提升自己学习热情。此项目希望对自己学习深度学习、TensorFlow框架以及其高级keras API有很多的提升与帮助。

Language:PythonStargazers:0Issues:0Issues:0

machine_learning_derivation

notes of machine learning algorithm derivation

Stargazers:0Issues:0Issues:0

meituan_tags_abstract

NLP提取美团美食评论的标签

Stargazers:0Issues:0Issues:0

models

Models and examples built with TensorFlow

Language:PythonLicense:Apache-2.0Stargazers:0Issues:0Issues:0

multi-label-classification-4-event-type

multi-label-classification-4-event-type

Stargazers:0Issues:0Issues:0

Python

All Algorithms implemented in Python

Language:PythonLicense:MITStargazers:0Issues:1Issues:0

PyTorch_Practice

这是我学习 PyTorch 的笔记对应的代码,点击查看 PyTorch 笔记在线电子书

License:GPL-3.0Stargazers:0Issues:0Issues:0

QASystemOnMedicalGraph

该项目是基于医疗领域知识图谱的问答系统。实现比较简单。

Language:PythonStargazers:0Issues:0Issues:0

qq_group_recommend_classifier

针对qq群标签所构造的分类器。其中训练集为4000个标签,预测集为20462

Stargazers:0Issues:0Issues:0

sohu2021-baseline

2021搜狐校园文本匹配算法大赛baseline

Stargazers:0Issues:0Issues:0

text_classification

all kinds of text classification models and more with deep learning

Language:PythonLicense:MITStargazers:0Issues:0Issues:0

two_sentences_classifier

Bert分类,语义相似度,获取句向量。

Stargazers:0Issues:0Issues:0

UnsupervisedTextClassification

基于关键词的无监督文本分类;Implementation for paper "Text Classification by Bootstrapping with Keywords, EM and Shrinkage" http://www.cs.cmu.edu/~knigam/papers/keywordcat-aclws99.pdf

License:MITStargazers:0Issues:0Issues:0