percent4

Jclian's repositories

people_relation_extract

结合BERT+GRU+ATT模型，对自己收集的人物关系数据进行模型训练，用于人物关系抽取。

Language:Python319 7 16

spo_extract_platform

本项目是利用深度学习技术来构建知识图谱方向上的一次尝试，作为开放领域的关系抽取，算是笔者的一次创新，目前在这方面的文章和项目都很少。

Language:Python305 10 9

embedding_rerank_retrieval

本项目是针对RAG中的Retrieve阶段的召回技术及算法效果所做评估实验。使用主体框架为LlamaIndex.

Language:Jupyter Notebook176 2 10

ccks_triple_extract

限定领域的三元组抽取的一次尝试，本文将会介绍笔者在2019语言与智能技术竞赛的三元组抽取比赛方面的一次尝试。

Language:Python133 5 5

multi-label-classification-4-event-type

Language:Python130 2 6

llm_math_solver

本项目用于大模型数学解题能力方面的数据集合成，模型训练及评测，相关文章记录。

Language:Python52 3 3

UniLM_Chinese_DEMO

本项目使用云问科技训练的中文版UniLM模型对微博数据集进行自动标题生成。

Language:Python35 3 2

PyTorch_Learning

learning pytorch step by step

Language:Jupyter Notebook28 20

R-BERT_for_people_relation_extraction

使用R-BERT模型对人物关系模型进行分类，效果有显著提升。

Language:Python24 3 2

embedding_model_exp

本项目用于Embedding模型的相关实验，包括Embedding模型评估、Embedding模型微调、Embedding模型量化等。

Language:Python22 1 4

llm_4_doc_qa

本项目用于文档问答，使用向量嵌入 + ES 做召回，使用Rerank模型作为精排，再使用LLM做文档问答，Web框架使用Flask。

Language:Python22 10

llm_open_triplet_extraction

本项目使用大语言模型（LLM）进行开放领域三元组抽取。

Language:Python22 1 3

llm_evaluation_4_mmlu

Using LLM to evaluate MMLU dataset.

Language:Python19 10

multi-modal-image-search

本项目使用LLaVA 1.6多模态模型实现以文搜图和以图搜图功能。

Language:Python16 1 2

yi_vl_experiment

本项目是关于Yi的多模态系列模型，如Yi-VL-6B/34B等的实验与应用。

Language:Python12 10

llama-2-multiple-choice-mrc

本项目采用Firefly模型训练框架，使用LLAMA-2模型对多项选择阅读理解任务（Multiple Choice MRC）进行微调，取得了显著的进步。

Language:Python9 10

pdf-llm_series

The project is for PDF Python learning with Large Language Model.

Language:Python8 2 2

ES_Learning

Example codes for Elasticsearch learning with Python.

Language:Python6 1 1

text_corrector_corpus_auto_generation

该项目致力于从中文文字版PDF文档中，自动化构建出高质量的中文文本纠错语料。

Language:Python6 10

dynamic_quantization_on_bert

本项目使用动态量化（Dynamic Quantization）技术对BERT模型进行量化，并实验量化后的模型在推理性能和效果上的表现。

Language:Jupyter Notebook5 1 1

vllm_learning

本项目用于大模型部署工具vLLM的研究与学习。

Language:Python4 10

Chinese_Captcha_Recognizition

本项目会自己训练OCR模型，来模型汉字验证码，包含1-n个汉字的验证码。

Language:Python200

clip_learning

The project is for openai clip learning.

Language:Jupyter Notebook2 20

llm_relation_classification

使用LLM对人物关系进行分类，记录模型训练、部署及评估结果。

Language:Python2 10

percent4.github.io

my personal blog with github + hexo

Language:HTML2 10

Python_docker

封装带有SSH服务的Docker的Python开发环境。

Language:Shell2 20

package_python_project

本项目用于Python自定义第三方模块的打包。

Language:Python100

git_test

Git学习测试项目

Language:Python000

percent4

个人首页

010

TimeTeller_in_Android

TimeTeller, the Android App, code in Python.

Language:PythonBSD-3-Clause000