GetUpEarlier / minit

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

Project MiniT

一个轻量的推理框架

Examples

目前验证过Mistral-7B,Qwen-1.5及llama3-70B等类llama模型,examples里有完整代码

Features

  • Tensor定义及相关接口
  • 基础CUDA算子
  • GPTQ推理支持
  • 基于nccl的分布式支持
  • function trace及graph pattern match功能
  • DTensor接口

Dev Plan

持续开发中

计划支持大部分常见特性,包括分布式,量化,LoDTensor,trace等

随缘更新

About


Languages

Language:Python 100.0%