reward-model

There are 1 repository under reward-model topic.

Westlake-AI / SemiReward
[ICLR 2024] SemiReward: A General Reward Model for Semi-supervised Learning
audio-classification computer-vision machine-learning natural-language-processing regression reward-model semi-supervised-learning transformer cifar-100 esc-50 label-noise yahoo-answers vision-transformer weakly-supervised-learning
Language:Python 71
rochitasundar / Generative-AI-with-Large-Language-Models
This repository contains the lab work for Coursera course on "Generative AI with Large Language Models".
flan-t5 instruction-finetuning kl-divergence large-language-models llm-evaluation low-rank-adaptation parameter-efficient-fine-tuning prompt-engineering proximal-policy-optimization reinforcement-learning reward-model transformer
Language:Jupyter Notebook 14
hlp-ai / miniChatGPT
Mini ChatGPT
chatgpt instructgpt ppo pytorch sft reward-model gpt2
Language:Python 6
taishan1994 / Reward-Model-Finetuning
专门用于训练奖励模型的仓库。
qwen2 reward-model
Language:Python 3
techandy42 / LLM_Reward_Model
Developing a LLM response ranking reward model using HFRL except it's GPT-3.5 instead of human.
hfrl language-model reward-model
Language:Jupyter Notebook 2
RuvenGuna94 / Dialogue-Summary-remove-toxic-text-PPO
Fine-tuning FLAN-T5 with PPO and PEFT to generate less toxic text summaries. This notebook leverages Meta AI's hate speech reward model and utilizes RLHF techniques for improved safety.
detoxification dialogue-summarization generative-ai hate-speech-detection nlp ppo-pytorch reward-model toxic-comment-classification toxicity-analysis
Language:Jupyter Notebook 0
jddunn / rlhf-nlp
POC library built on TextRL for easy training and usage of fine-tuned models using RLHF, a rewards model, and PPO
ppo reward-model rlhf textrl
Language:Python
thisisHJLee / RLHF
language-model nlp ppo reinforcement-learning reward-model rlhf supervised-finetuning