hugh's repositories
watermark-tracer
一个基于可视水印检测识别的数字媒体溯源应用系统,是我的大作业项目,包含这个系统以及一个开源的大规模常见水印图像数据集(Large-scale Common Watermark Dataset, LCWD)。 输入一个带有可视水印的图片或视频,系统会检测定位到水印所在的区域,然后将其提取出来,然后借助百度AI开放平台的OCR和logo识别以及Bing搜索引擎,溯源到这个图片或视频的源头。
adetailer
Auto detecting, masking and inpainting with detection model.
Awesome-Chinese-LLM
整理开源的中文大语言模型,以规模较小、可私有化部署、训练成本较低的模型为主,包括底座模型,垂直领域微调及应用,数据集与教程等。
BARS
Towards open benchmarking for recommender systems https://openbenchmark.github.io/BARS
CenseoQoE
image and video quality assessment
Chinese-Names-Corpus
中文人名语料库。人名生成器。中文姓名,姓氏,名字,称呼,日本人名,翻译人名,英文人名。可用于中文分词、人名实体识别。
dirty-cnwords
收录常见业务安全场景中文脏词,如广告引流、辱骂、暴恐、黄赌毒政类。
DVQA
Deep learning-based Video Quality Assessment
Fay
Fay是一个完整的开源项目,包含Fay控制器及数字人模型,可灵活组合出不同的应用场景:虚拟主播、现场推销货、商品导购、语音助理、远程语音助理、数字人互动、数字人面试官及心理测评、贾维斯、Her。 开源项目,非产品试用!!!
HanLP
中文分词 词性标注 命名实体识别 依存句法分析 成分句法分析 语义依存分析 语义角色标注 指代消解 风格转换 语义相似度 新词发现 关键词短语提取 自动摘要 文本分类聚类 拼音简繁转换 自然语言处理
Image-Similarity-Search-Milvus
Image Similarity search build on Milvus
insight-face-paddle
End-to-end face detection and recognition system using PaddlePaddle.
JioNLP
中文 NLP 预处理、解析工具包,准确、高效、易用 A Chinese NLP Preprocessing & Parsing Package www.jionlp.com
KDAT
一个专为视觉方向目标检测全流程的标注工具集,全称:Kill Object Detection Annotation Tools。
OFA
Official repository of OFA (ICML 2022). Paper: OFA: Unifying Architectures, Tasks, and Modalities Through a Simple Sequence-to-Sequence Learning Framework
openvino_notebooks
📚 A collection of Jupyter notebooks for learning and experimenting with OpenVINO 👓
paddleOCR
recongnize social app homepage personal information
RapidOCR
A cross platform OCR Library based on PaddleOCR & OnnxRuntime & OpenVINO.
Smart_container
🍰🍎ColugoMum--Intelligent Retail Settlement Platform can accurately locate and identify each commodity, and can return a complete shopping list and the actual total price of commodities that customers should pay.
text2vec
text2vec, text to vector. 文本向量表征工具,把文本转化为向量矩阵,实现了Word2Vec、RankBM25、Sentence-BERT、CoSENT等文本表征、文本相似度计算模型,开箱即用。
textgen
TextGen: Implementation of Text Generation models, include LLaMA, BLOOM, GPT2, BART, T5, SongNet and so on. 文本生成模型,实现了包括LLaMA,ChatGLM,BLOOM,GPT2,Seq2Seq,BART,T5,UDA等模型的训练和预测,开箱即用。
transformers
🤗 Transformers: State-of-the-art Machine Learning for Pytorch, TensorFlow, and JAX.
video-image-detection-service
图像视频检测完整后端服务(websevise + 实现逻辑)
vllm
A high-throughput and memory-efficient inference and serving engine for LLMs
vmaf
Perceptual video quality assessment based on multi-method fusion.
yolov5
YOLOv5 🚀 in PyTorch > ONNX > CoreML > TFLite