triton-server

There are 1 repository under triton-server topic.

Bobo-y / flexible-yolov5
More readable and flexible yolov5 with more backbone(gcn, resnet, shufflenet, moblienet, efficientnet, hrnet, swin-transformer, etc) and (cbam，dcn and so on), and tensorrt
yolov5 resnet moblienet backbone neck cbam pytorch shufflenet hrnet dcnv2 tensorrt object-detection swin-transformer gcn yolov3 triton-server ptq qat sparsity
Language:Python 679
notAI-tech / fastDeploy
Deploy DL/ ML inference pipelines with minimal extra code.
deep-learning tensorflow-serving tf-serving pytorch serving falcon gevent docker model-deployment model-serving http-server gunicorn torchserve triton-inference-server python triton triton-server inference-server streaming-audio websocket
Language:Python 99
levipereira / triton-server-yolo
This repository serves as an example of deploying the YOLO models on Triton Server for performance and testing purposes
deepstream onnx triton-server yolov7 yolov9
Language:Shell 66
chiehpower / Setup-deeplearning-tools
Set up CI in DL/ cuda/ cudnn/ TensorRT/ onnx2trt/ onnxruntime/ onnxsim/ Pytorch/ Triton-Inference-Server/ Bazel/ Tesseract/ PaddleOCR/ NVIDIA-docker/ minIO/ Supervisord on AGX or PC from scratch.
tensorrt cuda cudnn installation onnxruntime onnx2trt onnx-simplifier agx pytorch tesseract-ocr triton-inference-server tensorrt-inference-server nvidia deep-learning ci docker triton-server paddleocr supervisord minio
Language:Python 43
omarabid59 / yolov8-triton
Provides an ensemble model to deploy a YoloV8 ONNX model to Triton
deployment triton-inference-server triton-server ultralytics yolov8
Language:Python 35
kozistr / triton-grpc-proxy-rs
Proxy server for triton gRPC server that inferences embedding model in Rust
embedding-vectors grpc proxy rust triton-server triton-client embeddings ntex restful-api docker docker-compose onnx onnxruntime pytorch
Language:Rust 21
levipereira / triton-client-yolo
This repository utilizes the Triton Inference Server Client, which streamlines the complexity of model deployment.
triton-client triton-server yolov7 yolov9
Language:Python 17
levipereira / deepstream-yolo-triton-server-rtsp-out
The Purpose of this repository is to create a DeepStream/Triton-Server sample application that utilizes yolov7, yolov7-qat, yolov9 models to perform inference on video files or RTSP streams.
deepstream deepstream-python deepstream-python-apps deepstreamsdk triton-inference-server triton-server yolov7 yolov9
Language:Python 10
Bobo-y / django_ai_server_template
A template for delpoy AI server use django with tf_serving or triton_inference_serving
djanog docker classification detection-api triton-server uwsgi object-detection server
Language:Python 6
levipereira / Docker-Yolov7-Nvidia-Kit
This repository provides an out-of-the-box deployment solution for creating an end-to-end procedure to train, deploy, and use Yolov7 models on Nvidia GPUs using Triton Server and Deepstream.
deepstream deepstreamsdk triton-server yolov7
Language:Shell 4
levipereira / nvdsinfer_yolov7_efficient_nms
NvDsInferYolov7EfficientNMS for Gst-nvinferserver
deepstream triton-server yolov7 efficientnms
Language:C++ 2
Bobo-y / triton-inference-server-backend-demo
This is a cutom triton-inference-server backend demo for process image (resize + norm)
triton-backend triton-server
Language:C++ 1
tamanna18 / Triton-Inference-Server-Deployment-with-ONNX-Models
Triton Inference Server Deployment with ONNX Models
onnx onnx-models onnxruntime triton triton-inference-server triton-server
1
Achiwilms / NVIDIA-Triton-Deployment-Quickstart
QuickStart for Deploying a Basic Model on the Triton Inference Server
artificial-intelligence inference machine-learning quickstart server triton triton-inference-server triton-server tritonclient tutorial
Language:Python 0
msclock / transformersplus
Add Some plus extra features to transformers
nlp transformers triton triton-server
Language:Python 0
RostigerDagmer / hermann-reesearch
Pipeline to insert text embeddings generated from self hosted embedding model into qdrant vector database using grpc in rust
qdrant rust semantic-scholar triton-server vectordatabase
Language:Rust 0
xdilshod / yolov8-triton
Yolov8 onnx inference running on triton server
object-detection onnx python triton-server yolov8 onnxruntime-gpu
Language:Python 0
cnwangjie / triton-client-js
A Node.js client for the Triton Inference Server.
triton triton-client triton-inference-server triton-server tritonclient typescript
Language:JavaScript

triton-server

Bobo-y / flexible-yolov5

notAI-tech / fastDeploy

levipereira / triton-server-yolo

chiehpower / Setup-deeplearning-tools

omarabid59 / yolov8-triton

kozistr / triton-grpc-proxy-rs

levipereira / triton-client-yolo

levipereira / deepstream-yolo-triton-server-rtsp-out

Bobo-y / django_ai_server_template

levipereira / Docker-Yolov7-Nvidia-Kit

levipereira / nvdsinfer_yolov7_efficient_nms

Bobo-y / triton-inference-server-backend-demo

tamanna18 / Triton-Inference-Server-Deployment-with-ONNX-Models

Achiwilms / NVIDIA-Triton-Deployment-Quickstart

msclock / transformersplus

RostigerDagmer / hermann-reesearch

xdilshod / yolov8-triton

cnwangjie / triton-client-js