ziwang-com / AGM

AGM阿格姆:AI基因图谱模型,从token-weight权重微粒角度,探索AI模型,GPT\LLM大模型的内在运作机制。

Home Page:http://www.m-f.vip

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

minimal-llama最小llm

ziwang-com opened this issue · comments

https://github.com/zphang/minimal-llama
最小法学硕士
此存储库包含用于运行和微调 LLaMA 的随机代码。许多部分仍在进行中。应该有比这里介绍的更有效的调优方法(DeepSpeed / ZeRO,NeoX),但人们可能会发现这已经很有用了。

标记化数据集
使用 8 位进行 PEFT 微调
使用朴素管道并行进行微调
(新)使用 8 位和流水线并行进行 PEFT 微调
杂项说明
这段代码很快就被拼凑在一起,可能包含很多很多错误。欢迎反馈!