Beast code in Giters

chandar-lab's repositories

RLHive

Language:PythonMIT100 9 96

Recall2Imagine

Recall to Imagine, a model-based RL algorithm with superhuman memory. Oral (1.2%) @ ICLR 2024

Language:PythonMIT44 7 10

PatchUp

Language:PythonMIT38 6 2

IIRC

IIRC: Incremental Implicitly Refined Classification

Language:PythonMIT31 3 1

Lifelong-Hanabi

A Continual Multi-agent RL testbed based on Hanabi

Language:Jupyter NotebookNOASSERTION30 4 2

LoCA

Language:PythonMIT6 4 3

CGOptimizer

Language:PythonMIT5 5 1

CMOptimizer

Language:PythonMIT5 40

CriticalGradientOptimization

Critical Gradient Optimization.

Language:Jupyter NotebookMIT400

EpiK-Eval

Benchmark to evaluate the capability of language models to consolidate and recall information from multiple training documents.

Language:PythonMIT4 30

LoCA2

Language:PythonMIT3 20

COE

Language:PythonApache-2.0200

healthy-data-diet

Reduce gender bias in machine learning models.

Language:PythonMIT200

RL-Tuner-CP

Language:Java2 10

tgi-for-mila

A toolkit for running text-generation-inference on Mila and Compute Canada

Language:ShellMIT2 1 3

adaptive-hanabi

Language:Jupyter NotebookMIT100

crystal-design

Reinforcement Learning for Crystal Structure Design

Language:Python100

FASP

We study the effect of attention head pruning on fairness in large language models

Language:Jupyter NotebookMIT100

INF8245e-assignments-public

Language:Jupyter Notebook100

INF8250ae-assignments-2023

Language:Python100

INF8250e-assignments-public

Language:Jupyter Notebook100

SubGoal_Distillation_LLM

Code for the paper Sub-goal Distillation: A Method to Improve Small Language Agents

100

INF8245e-assignments-2023

Language:Jupyter Notebook000

Lookbehind-SAM

Implementation of Lookbehind-SAM: k steps back, 1 step forward (ICML 2024)

Language:PythonApache-2.0000

r2i.github.io

Language:JavaScript000

RISC

Language:PythonMIT000