zayedrais / LLM_1B_7B-experiment_inference

ry out various LLM models in experiments. Finally, we'll perform real-time inference on Colab GPU using Text-Generation-Inference.