Jclian's repositories
people_relation_extract
结合BERT+GRU+ATT模型,对自己收集的人物关系数据进行模型训练,用于人物关系抽取。
spo_extract_platform
本项目是利用深度学习技术来构建知识图谱方向上的一次尝试,作为开放领域的关系抽取,算是笔者的一次创新,目前在这方面的文章和项目都很少。
embedding_rerank_retrieval
本项目是针对RAG中的Retrieve阶段的召回技术及算法效果所做评估实验。使用主体框架为LlamaIndex.
ccks_triple_extract
限定领域的三元组抽取的一次尝试,本文将会介绍笔者在2019语言与智能技术竞赛的三元组抽取比赛方面的一次尝试。
multi-label-classification-4-event-type
multi-label-classification-4-event-type
llm_math_solver
本项目用于大模型数学解题能力方面的数据集合成,模型训练及评测,相关文章记录。
UniLM_Chinese_DEMO
本项目使用云问科技训练的中文版UniLM模型对微博数据集进行自动标题生成。
PyTorch_Learning
learning pytorch step by step
R-BERT_for_people_relation_extraction
使用R-BERT模型对人物关系模型进行分类,效果有显著提升。
embedding_model_exp
本项目用于Embedding模型的相关实验,包括Embedding模型评估、Embedding模型微调、Embedding模型量化等。
llm_4_doc_qa
本项目用于文档问答,使用向量嵌入 + ES 做召回,使用Rerank模型作为精排,再使用LLM做文档问答,Web框架使用Flask。
llm_open_triplet_extraction
本项目使用大语言模型(LLM)进行开放领域三元组抽取。
llm_evaluation_4_mmlu
Using LLM to evaluate MMLU dataset.
multi-modal-image-search
本项目使用LLaVA 1.6多模态模型实现以文搜图和以图搜图功能。
yi_vl_experiment
本项目是关于Yi的多模态系列模型,如Yi-VL-6B/34B等的实验与应用。
llama-2-multiple-choice-mrc
本项目采用Firefly模型训练框架,使用LLAMA-2模型对多项选择阅读理解任务(Multiple Choice MRC)进行微调,取得了显著的进步。
pdf-llm_series
The project is for PDF Python learning with Large Language Model.
ES_Learning
Example codes for Elasticsearch learning with Python.
text_corrector_corpus_auto_generation
该项目致力于从中文文字版PDF文档中,自动化构建出高质量的中文文本纠错语料。
dynamic_quantization_on_bert
本项目使用动态量化(Dynamic Quantization)技术对BERT模型进行量化,并实验量化后的模型在推理性能和效果上的表现。
vllm_learning
本项目用于大模型部署工具vLLM的研究与学习。
Chinese_Captcha_Recognizition
本项目会自己训练OCR模型,来模型汉字验证码,包含1-n个汉字的验证码。
clip_learning
The project is for openai clip learning.
llm_relation_classification
使用LLM对人物关系进行分类,记录模型训练、部署及评估结果。
percent4.github.io
my personal blog with github + hexo
Python_docker
封装带有SSH服务的Docker的Python开发环境。
package_python_project
本项目用于Python自定义第三方模块的打包。
git_test
Git学习测试项目
TimeTeller_in_Android
TimeTeller, the Android App, code in Python.