SHITIANYU-hue

followers

following

stars

University of Toronto

Toronto, Canada

https://shitianyu-hue.github.io/

SHITIANYU's repositories

AI-follow

梳理每周最新多模态，LLMs,embodied AI相关论文

3 10

dgn_ring_torch

Language:Jupyter Notebook3 20

SUMO-changing-lane-agent

Implementation of a reinforcement learning agent able to do autonomous changing lane using Sumo

Language:Python3 10

agebias

process for age bias dataset

Language:Python2 1 1

DRL-robot-navigation

Deep Reinforcement Learning for mobile robot navigation in ROS Gazebo simulator. Using Twin Delayed Deep Deterministic Policy Gradient (TD3) neural network, a robot learns to navigate to a random goal point in a simulated environment while avoiding obstacles.

Language:PythonMIT200

sumosim

A sumo based simulator that can support both micro and macro level control

Language:Jupyter Notebook200

SHITIANYU-hue.github.io

Github Pages template for academic personal websites, forked from mmistakes/minimal-mistakes

Language:JavaScriptMIT1 10

SIIM-ISIC-Melanoma-Classification-1st-Place-Solution

Language:Jupyter NotebookMIT1 10

Traffic-Speed-Control-System

Language:Python1 30

ageism-research

[ICML 2022] RankSim: Ranking Similarity Regularization for Deep Imbalanced Regression

Language:PythonNOASSERTION000

AgentTuning

AgentTuning: Enabling Generalized Agent Abilities for LLMs

000

ASL-Recognition

Language:Python000

chatbot_rlhf

020

ChatGLM-6B

ChatGLM-6B: An Open Bilingual Dialogue Language Model | 开源双语对话语言模型

Language:PythonApache-2.0000

CityLearn

Official reinforcement learning environment for demand response and load shaping

Language:PythonMIT000

fairllm

010

FairLLM-1

000

flow-1

Language:PythonMIT010

glm

Language:Python000

interview-assistant

Load a PDF file and ask questions via llama_index and GPT

Language:Python000

la-mbda

LAMBDA is a model-based reinforcement learning agent that uses Bayesian world models for safe policy optimization

Language:PythonMIT010

llmky

Language:Python010

nerfies.github.io

Language:JavaScript000

optimization

Language:Jupyter Notebook000

proximal-exploration

PyTorch implementation for our paper "Proximal Exploration for Model-guided Protein Sequence Design"

Language:PythonApache-2.0010

RL-for-MSRs

An implementation of using rl to control magnetic soft robots.

MIT000

RLCFModel

Fine tune a pre-trained LLM using compiler generated RL feedback

000

SECRM2D-demo

010

SUMO-DVSL

A SUMO environment for differential varaible speed limits control

Language:Python000

TradingGovernor

Language:Python010