YanSong97

Yan Song's repositories

Master-thesis

Policy gradient planning in MBRL using probabilistic models.

Language:Jupyter Notebook5 20

MAgent-demo

Language:Python400

NLP-project

Abstractive Summarisation

Language:Jupyter Notebook400

Gibbs-sampler

coursework

Language:Jupyter Notebook1 10

malib

A parallel framework for population-based multi-agent reinforcement learning.

Language:PythonMIT100

Network-analysis

toy software

Language:Java100

subcellular-location-prediction

bioinformatics

Language:Jupyter Notebook1 10

ai_lib

Language:JavaScriptMIT000

Attentive-state-space-models

Language:Jupyter Notebook010

BeerGame_demo

Language:PythonMIT000

Competition_Olympics-Running

Language:PythonMIT000

envpool

C++-based high-performance parallel environment execution engine (vectorized env) for general RL environments.

Language:C++Apache-2.0000

gym

A toolkit for developing and comparing reinforcement learning algorithms.

Language:PythonNOASSERTION000

LLM_Tree_Search

The official implementation of paper: Alphazero-like Tree-Search can guide large language model decoding and training

000

ma-gym

A collection of multi agent environments based on OpenAI gym.

Language:PythonApache-2.0000

MAAI-olympics

Language:PythonMIT000

minigrid-rl

RL experiments using mini grid gym environment

Language:Python000

olympics_engine

Language:PythonMIT000

overcooked_ai

A benchmark environment for fully cooperative human-AI performance.

MIT000

readthedocs

Language:Python010

safe-rlhf

Safe-RLHF: Constrained Value Alignment via Safe Reinforcement Learning from Human Feedback

Apache-2.0000

YanSong97

000