zmsn-2077

Jiaming Ji's repositories

CUP-safe-rl

NeurIPS2022: Constrained Update Projection Approach to Safe Policy Optimization

Language:Python11 1 1

Dev-Setup-Jiaming

Automation scripts for setting up a basic development environment.

Language:ShellMIT100

omnisafe_zmsn

OmniSafe is a comprehensive and reliable benchmark for safe reinforcement learning.

Language:PythonApache-2.0100

RLHFTest

1 10

Safe-Policy-Optimization

This is a benchmark repository for safe reinforcement learning algorithms

Language:Python100

baichuan-7B

A large-scale 7B pretraining language model developed by Baichuan

Language:PythonApache-2.0000

draggable-example

vue.draggable example

Language:Vue000

functorch

functorch is JAX-like composable function transforms for PyTorch.

Language:Jupyter NotebookBSD-3-Clause000

Gymnasium

A standard API for single-agent reinforcement learning environments, with popular reference environments and related utilities (formerly Gym)

Language:PythonMIT000

RRHF

RRHF & Wombat

Language:Python000

safe-rlhf-zmsn

Safe-RLHF: Constrained Value Alignment via Safe Reinforcement Learning from Human Feedback

Language:PythonApache-2.0000

safety-gymnasium-zmsn

Safety-Gymnaisum is a highly scalable and customizable safe reinforcement learning environment library.

Language:PythonApache-2.0000

stable-baselines3

PyTorch version of Stable Baselines, reliable implementations of reinforcement learning algorithms.

Language:PythonMIT000

starter-hugo-research-group

Language:TeXMIT020

tianshou

An elegant PyTorch deep reinforcement learning library.

MIT000

tldr

📚 Collaborative cheatsheets for console commands

NOASSERTION000

torchopt

TorchOpt is an efficient library for differentiable optimization built upon PyTorch.

Apache-2.0000

zmsn-2077.github.io

Language:HTMLMIT000