NanAN's repositories
funNLP
中英文敏感词、语言检测、中外手机/电话归属地/运营商查询、名字推断性别、手机号抽取、身份证抽取、邮箱抽取、中日文人名库、中文缩写库、拆字词典、词汇情感值、停用词、反动词表、暴恐词表、繁简体转换、英文模拟中文发音、汪峰歌词生成器、职业名称词库、同义词库、反义词库、否定词库、汽车品牌词库、汽车零件词库、连续英文切割、各种中文词向量、公司名字大全、古诗词库、IT词库、财经词库、成语词库、地名词库、历史名人词库、诗词词库、医学词库、饮食词库、法律词库、汽车词库、动物词库、中文聊天语料、中文谣言数据、百度中文问答数据集、句子相似度匹配算法集合、bert资源、文本生成&摘要相关工具、cocoNLP信息抽取工具、国内电话号码正则匹配、清华大学XLORE:中英文跨语言百科知识图谱、清华大学人工智能技术系列报告、自然语言生成、NLP太难了系列、自动对联数据及机器人、用户名黑名单列表、罪名法务名词及分类模型、微信公众号语料、cs224n深度学习自然语言处理课程、中文手写汉字识别、中文自然语言处理 语料/数据集、变量命名神器
authelia
The Single Sign-On Multi-Factor portal for web apps
CapitalSpider
基于selenium,从(http://api.map.baidu.com/lbsapi/getpoint/index.html)百度地图坐标拾取系统, 爬取131个国家、131个国家的首都、**34个行政区省会和**351个城市的经纬度坐标 (部分坐标已知,未知部分在线爬取)
Company-Names-Corpus
公司名语料库。机构名语料库。公司简称,缩写,品牌词,企业名。
Efficient-GlobalPointer
pytorch Efficient GlobalPointer
Encrypt-python-code-License-control
python代码加密以及python代码的License控制
Enterprise-Registration-Data-of-Chinese-Mainland
**大陆 31 个省份1978 年至 2019 年一千多万工商企业注册信息,包含企业名称、注册地址、统一社会信用代码、地区、注册日期、经营范围、法人代表、注册资金、企业类型等详细资料。This repository is an dataset of over 10,000,000 enterprise registration data of 31 provinces in Chinese mainland from 1978 to 2019.【工商大数据】、【企业信息】、【enterprise registration data】。
GPLinker_pytorch
GPLinker_pytorch
label-studio-converter
Tools for converting Label Studio annotations into common dataset formats
LLaMA-Efficient-Tuning
Easy-to-use LLM fine-tuning framework (LLaMA-2, BLOOM, Falcon, Baichuan, Qwen, ChatGLM2)
magnitude
A fast, efficient universal vector embedding utility package.
modelscope-agent
ModelScope-Agent: An agent framework connecting models in ModelScope with the world
notion-comment
notion个人站的评论数据搜集
NotionNext
使用 NextJS + Notion API 实现的,支持多种部署方案的静态博客,无需服务器、零门槛搭建网站,为Notion和所有创作者设计。 (A static blog built with NextJS and Notion API, supporting multiple deployment options. No server required, zero threshold to set up a website. Designed for Notion and all creators.)
porn_fiction_classify
一个色情小说检测项目
pytorch-pretrained-BERT
📖The Big-&-Extending-Repository-of-Transformers: Pretrained PyTorch models for Google's BERT, OpenAI GPT & GPT-2, Google/CMU Transformer-XL.
t5-pegasus-chinese
基于GOOGLE T5中文生成式模型的摘要生成/指代消解,支持batch批量生成,多进程
UIE
Unified Structure Generation for Universal Information Extraction
wechat-spider
微信公众号爬虫
wechat_spider
微信文章爬虫,获取阅读量、点赞量、评论等