open-r1

There are 0 repository under open-r1 topic.

modelscope / ms-swift
Use PEFT or Full-parameter to CPT/SFT/DPO/GRPO 500+ LLMs (Qwen3, Qwen3-MoE, Llama4, GLM4.5, InternLM3, DeepSeek-R1, ...) and 200+ MLLMs (Qwen3-VL, Qwen3-Omni, InternVL3.5, Ovis2.5, Llava, GLM4v, Phi4, ...) (AAAI 2025).
deepseek-r1 embedding grpo internvl liger llama llama4 llm lora megatron moe multimodal open-r1 peft qwen3 qwen3-next qwen3-omni qwen3-vl reranker sft
Language:Python 10939
IAAR-Shanghai / xVerify
xVerify: Efficient Answer Verifier for Reasoning Model Evaluations
judge-model llm-as-a-judge xverify benchmark evaluation regex reliability reliability-tools math-verify deepseek-math open-compass cc-by-nc-nd-4 chatgpt llm open-r1 reasoning-models
Language:Python 137
Exgc / R1V-Free
R1V, trained with AI feedback, answers open-ended visual questions.
open-r1 r1v video-r1 vision-r1 vlm
Language:Python 14
Abhisang3 / xVerify
xVerify: Efficient Answer Verifier for Large Language Model Evaluations
benchmark chatgpt deepseek-math evaluation judge-model llm math-verify open-compass open-r1 reasoning-models reliability reliability-tools xverify
Language:Python
HappyXY / deepscaler
Democratizing Reinforcement Learning for LLMs
open-r1
Language:Python

modelscope / ms-swift