JackieWu's repositories
baby-llama2-chinese_kaggle
参考https://github.com/DLLXW/baby-llama2-chinese ,从头预训练+SFT一个小参数量的中文LLaMa2的仓库;24G单卡即可运行得到一个具备简单中文问答能力的chat-llama2.
BERT-NER-Pytorch
Chinese NER(Named Entity Recognition) using BERT(Softmax, CRF, Span)
ChatGLM-6B
ChatGLM-6B: An Open Bilingual Dialogue Language Model | 开源双语对话语言模型
chatGLM-6B-QLoRA
使用peft库,对chatGLM-6B/chatGLM2-6B实现4bit的QLoRA高效微调,并做lora model和base model的merge及4bit的量化(quantize)。
FinEntity
Code and resource of "FinEntity: Entity-level Sentiment Classification for Financial Texts" EMNLP 2023
Firefly
Firefly(流萤): 中文对话式大语言模型(全量微调+QLoRA),支持微调Llma2、Llama、Baichuan、InternLM、Ziya、Bloom等大模型
LLM-Tuning
Tuning LLMs with no tears💦, sharing LLM-tools with love❤️.
pytorch_uie_ner
基于pytorch的百度UIE命名实体识别。
Qwen
The official repo of Qwen (通义千问) chat & pretrained large language model proposed by Alibaba Cloud.
seq_task_learn
nlpcc 2024 测试
Tevatron-T2ranking
使用tevatron,在中文检索数据集T2ranking上训练、评估Dual Encoder