megatron-lm

There are 0 repository under megatron-lm topic.

alibaba / Megatron-LLaMA
Best practice for training LLaMA models in Megatron-LM
deepspeed distributed-training llama llm megatron-lm pretraining pytorch
Language:Python 610
shreyansh26 / Annotated-ML-Papers
Annotations of the interesting ML papers I read
deep-learning machine-learning research-paper annotated-paper bert nlp gpt transformers xlnet gpt-2 megatron-lm papers-annotations
201
openpsi-project / ReaLHF
Super-Efficient RLHF Training of LLMs with Parameter Reallocation
deepspeed distributed-computing distributed-systems large-language-models large-scale-machine-learning llm llm-framework llm-training megatron-lm reinforcement-learning reinforcement-learning-from-human-feedback transformers
Language:Python 86
xrsrke / pipegoose
Large scale 4D parallelism pre-training for 🤗 transformers in Mixture of Experts *(still work in progress)*
3d-parallelism data-parallelism distributed-optimizers huggingface-transformers large-scale-language-modeling megatron megatron-lm mixture-of-experts model-parallelism moe pipeline-parallelism sequence-parallelism tensor-parallelism transformers zero-1
Language:Python 77
feifeibear / Odysseus-Transformer
Odysseus: Playground of LLM Sequence Parallelism
llm megatron-lm pytorch
Language:Python 50
MoFHeka / LLaMA-Megatron
A LLaMA1/LLaMA12 Megatron implement.
llama llama2 llm llm-training megatron megatron-lm pytorch
Language:Python 26
GoogleCloudPlatform / nvidia-nemo-on-gke
Training NVIDIA NeMo Megatron Large Language Model (LLM) using NeMo Framework on Google Kubernetes Engine
gke megatron-lm nvidia nvidia-gpu nvidia-nemo
Language:HCL 9
Beomi / megatronlm_dataset_autotokenizer
Megatron-LM/GPT-NeoX compatible Text Encoder with 🤗Transformers AutoTokenizer.
megatron-lm gpt-neox tokenizers transformers
Language:Python 6
SulRash / minLLMTrain
Minimal yet high performant code for pretraining llms. Attempts to implement some SOTA features. Implements training through: Deepspeed, Megatron-LM, and FSDP. WIP
deepspeed fsdp huggingface llm megatron-lm pretraining
Language:Python 5
GJ98 / Megatron-LM
Megatron-LM implemented by PyTorch
megatron-lm pytorch nlp
Language:Python 1