pre-trained-language-models

There are 8 repositories under pre-trained-language-models topic.

Chinese-LLaMA-Alpaca
ymcui / Chinese-LLaMA-Alpaca
中文LLaMA&Alpaca大语言模型+本地CPU/GPU训练部署 (Chinese LLaMA & Alpaca LLMs)
llm plm pre-trained-language-models alpaca llama nlp quantization large-language-models lora alpaca-2 llama-2
Language:Python 17552
RUCAIBox / LLMSurvey
The official GitHub page for the survey paper "A Survey of Large Language Models".
chain-of-thought chatgpt in-context-learning instruction-tuning large-language-models llm llms natural-language-processing pre-trained-language-models pre-training rlhf
Language:Python 9010
thunlp / OpenPrompt
An Open-Source Framework for Prompt-Learning.
nlp pre-trained-language-models ai nlp-machine-learning natural-language-processing natural-language-understanding deep-learning pre-trained-model nlp-library pytorch transformer prompt prompt-toolkit prompts prompt-based-tuning prompt-learning
Language:Python 4177
thunlp / PromptPapers
Must-read papers on prompt-based tuning for pre-trained language models.
nlp pre-trained-language-models ai machine-learning bert prompt-toolkit prompt prompt-learning prompt-based
3941
ddangelov / Top2Vec
Top2Vec learns jointly embedded topic, document and word vectors.
topic-modeling word-embeddings document-embedding topic-vector topic-search text-search text-semantic-similarity topic-modelling semantic-search bert top2vec sentence-transformers sentence-encoder pre-trained-language-models
Language:Python 2847
brightmart / roberta_zh
RoBERTa中文预训练模型: RoBERTa for Chinese
roberta chinese bert pre-trained-language-models pre-trained gpt2
Language:Python 2537
cedrickchee / awesome-transformer-nlp
A curated list of NLP resources focused on Transformer networks, attention mechanism, GPT, BERT, ChatGPT, LLMs, and transfer learning.
nlp natural-language-processing bert transformer language-model transfer-learning attention-mechanism awesome-list gpt-2 xlnet neural-networks pre-trained-language-models gpt-3 awesome chatgpt gpt-4 llama
1038
zjunlp / KnowLM
An Open-sourced Knowledgable Large Language Model Framework.
llama large-language-models pre-trained-language-models language-model instruction-following deep-learning chinese english instructions models reasoning gpt-3 deepspeed instruction-tuning lora pre-training bilingual pre-trained-model knowlm instructie
Language:Python 1034
THUDM / P-tuning
A novel method to tune language models. Codes and datasets for paper ``GPT understands, too''.
natural-language-processing pre-trained-language-models prompt-tuning p-tuning parameter-efficient-learning few-shot-learning
Language:Python 896
zjunlp / KnowledgeEditingPapers
Must-read Papers on Knowledge Editing for Large Language Models.
paper-list pre-trained-language-models pre-trained-model knowledge-editing model-editing large-language-models awsome-list foundation-models natural-language-processing review survey rome easyedit knowlm paper
614
txsun1997 / LMaaS-Papers
Awesome papers on Language-Model-as-a-Service (LMaaS)
ai gpt-3 machine-learning natural-language-processing nlp paper-list pre-trained-language-models prompt-learning prompt-tuning
519
sunyilgdx / SIFRank_zh
Keyphrase or Keyword Extraction 基于预训练模型的中文关键词抽取方法（论文SIFRank: A New Baseline for Unsupervised Keyphrase Extraction Based on Pre-trained Language Model 的中文版代码）
sifrank keyphrase-extraction keyword-extraction elmo pre-trained-language-models sif word-embeddings sentence-embeddings python36
Language:Python 416
airaria / TextPruner
A PyTorch-based model pruning toolkit for pre-trained language models
pruning pre-trained-language-models model-pruning transformer
Language:Python 354
yuzhimanhua / Awesome-Scientific-Language-Models
A Curated List of Language Models in Scientific Domains
ai4science large-language-models pre-trained-language-models
272
wjn1996 / HugNLP
HugNLP is a unified and comprehensive NLP library based on HuggingFace Transformer. Please hugging for NLP now!😊 HugNLP will released to @HugAILab
deep-learning few-shot-learning knowledge-enhancement natural-language-processing pre-trained-language-models prompt-based-learning pytorch semi-supervised-learning supervised-learning transformers code-understanding
Language:Python 248
zjunlp / DART
[ICLR 2022] Differentiable Prompt Makes Pre-trained Language Models Better Few-shot Learners
prompt-tuning pre-trained-language-models few-shot-learning prompt dart prompt-learning iclr iclr2022 pytorch language-models
Language:Python 125
sunyilgdx / SIFRank
The code of our paper "SIFRank: A New Baseline for Unsupervised Keyphrase Extraction Based on Pre-trained Language Model"
keywords-extraction keyphrase-extraction python3 elmo sif pre-trained-language-models word-embeddings stanfordcorenlp
Language:Python 120
zjunlp / MolGen
[ICLR 2024] Domain-Agnostic Molecular Generation with Chemical Feedback
language-model molecular-generation pre-trained-language-models pre-trained-model molgen molecule molecular-optimization selfies targeted-molecular-generation pre-training generation multitask huggingface pytorch iclr2024
Language:Python 106
TobiasLee / Awesome-Efficient-PLM
Must-read papers on improving efficiency for pre-trained language models.
model-compression paper-list pre-trained-language-models
100
Hanlard / Electra_CRF_NER
We start a company-name recognition task with a small scale and low quality training data, then using skills to enhanced model training speed and predicting performance with least artificial participation. The methods we use involve lite pre-training models such as Albert-small or Electra-small with financial corpus, knowledge of distillation and multi-stage learning. The result is that we improve the recall rate of company names recognition task from 0.73 to 0.92 and get 4 times as fast as BERT-Bilstm-CRF model.
ner bert financial distilling-the-knowledge pre-trained-language-models mutistage-learning
Language:Python 79
zjunlp / MKG_Analogy
[ICLR 2023] Multimodal Analogical Reasoning over Knowledge Graphs
analogy kg analogical-reasoning dataset knowledge-graph multimodal computer-vision natural-language-processing mars markg iclr2023 iclr reasoning language-model pre-trained-language-models prompt
Language:Python 79
Victorwz / VaLM
VaLM: Visually-augmented Language Modeling. ICLR 2023.
deep-learning pre-trained-language-models vision-language visually-grounded-language-learning
Language:Python 54
pat-jj / TagReal
[ACL'23] Open KG Completion with PLM (Bridging Text Mining and Prompt Engineering)
deep-learning knowledge-graph nlp pre-trained-language-models
Language:Python 51
WangRongsheng / Chinese-LLaMA-Alpaca-Usage
📔 对Chinese-LLaMA-Alpaca进行使用说明和核心代码注解
alpaca fine-tuning large-language-models llama llm llms lora pre-trained-language-models webui
Language:Jupyter Notebook 43
lancopku / DynamicKD
Code for EMNLP 2021 main conference paper "Dynamic Knowledge Distillation for Pre-trained Language Models"
nlp pre-trained-language-models knowledge-distillation
Language:Python 39
zjunlp / ChatCell
ChatCell: Facilitating Single-Cell Analysis with Natural Language
ai4science artificial-intelligence bioinformatics biology cell chatcell interdisciplinary large-language-models natural-language-processing pre-trained-language-models single-cell single-cell-analysis llm4bio
Language:Python 34
lanwuwei / GigaBERT
Zero-shot Transfer Learning from English to Arabic
pre-trained-language-models arabic-nlp bert-model named-entity-recognition part-of-speech-tagging relation-extraction
Language:Python 27
lyy1994 / awesome-data-contamination
The Paper List on Data Contamination for Large Language Models Evaluation.
awesome-list data-contamination evaluation foundation-models large-language-models llm paper-list pre-trained-language-models pre-trained-model
27
ai2-ner-project / pytorch-ko-ner
PLM 기반 한국어 개체명 인식 (NER)
huggingface korean korean-nlp named-entity-recognition pre-trained-language-models pytorch
Language:Python 26
xuanyuan14 / ARES
SIGIR'22 paper: Axiomatically Regularized Pre-training for Ad hoc Search
bert information-retrieval natural-language-processing pre-trained-language-models pretrained-models sigir2022 transformer
Language:Python 24
anas-zafar / LLM-Survey
The official GitHub page for the survey paper "A Survey on Large Language Models: Applications, Challenges, Limitations, and Practical Usage".
chatgpt generative-ai large-language-models llms natural-language-processing pre-trained-language-models rhlf vision-language-model
21
XingLuxi / Cal-FLOPs-for-PLM
Calculating FLOPs of Pre-trained Models in NLP
natural-language-processing pre-trained-language-models pytorch transformers flops parameters
Language:Python 18
cliang1453 / super-structured-lottery-tickets
Super Tickets in Pre-Trained Language Models: From Model Compression to Improving Generalization (ACL 2021)
lottery-ticket-hypothesis lottery-tickets multi-task-learning model-compression pre-trained-language-models model-pruning bert-fine-tuning natural-language-understanding acl2021 generalization
Language:Python 16
zjunlp / knowledge-rumination
[EMNLP 2023] Knowledge Rumination for Pre-trained Language Models
commonsense-reasoning gpt-3 large-language-models natural-language-processing pre-trained-language-models prompt-engineering pytorch question-answering knowledge-rumination
Language:Python 16
yuzhimanhua / SeeTopic
Seed-Guided Topic Discovery with Out-of-Vocabulary Seeds (NAACL'22)
pre-trained-language-models topic-discovery topic-modeling
Language:C 15
NKCSICLab / linglong
LingLong (玲珑): a small-scale Chinese pretrained language model
chinese-language-model gpt-3 pre-trained-language-models
Language:Python 13