thwu1

Tianhao Wu's repositories

Language:PythonApache-2.0300

A repo for distributed training of language models with Reinforcement Learning via Human Feedback (RLHF)

Language:PythonMIT200

An open platform for training, serving, and evaluating large language models. Release repo for Vicuna and Chatbot Arena.

Language:PythonApache-2.0100

Language:Python100

000

Language:PythonMIT000

Train transformer language models with reinforcement learning.

Language:PythonApache-2.0000