Beast code in Giters

hyy's repositories

Finetuning LLaMA with RLHF (Reinforcement Learning with Human Feedback) based on DeepSpeed Chat

Language:PythonMIT000

An elegant PyTorch deep reinforcement learning library.

MIT000

A simple but complete full-attention transformer with a set of promising experimental features from various papers

Language:PythonMIT000

differential ilp implemented by pytorch

Language:Python100

Language:Python000

Language:Jupyter Notebook100

Pytorch Lightning code guideline for conferences

Apache-2.0000