YukeWang96

YUKE WANG's repositories

GNNAdvisor_OSDI21

Artifact for OSDI'21 GNNAdvisor: An Adaptive and Efficient Runtime System for GNN Acceleration on GPUs.

Language:Cuda61 2 7

TC-GNN_ATC23

Artifact for USENIX ATC'23: TC-GNN: Bridging Sparse GNN Computation and Dense Tensor Cores on GPUs.

Language:Python42 2 6

MGG_OSDI23

Artifact for OSDI'23: MGG: Accelerating Graph Neural Networks with Fine-grained intra-kernel Communication-Computation Pipelining on Multi-GPU Platforms.

Language:Cuda32 2 5

QGTC_PPoPP22

Artifact for PPoPP22 QGTC: Accelerating Quantized GNN via GPU Tensor Core.

Language:Python27 2 2

DSXplore_IPDPS21

Artifact for IPDPS'21: DSXplore: Optimizing Convolutional Neural Networks via Sliding-Channel Convolutions.

Language:PythonMIT13 3 2

SGQuant

SGQuant: Squeezing the Last Bit on Graph Neural Networks with Specialized Quantization

Language:PythonMIT8 30

CNN-TensorRT

Benchmarking TensorRT on CNN models

Language:Jupyter Notebook2 20

AlCOP_MLSys23

Artifact for MLSys'23: ALCOP: Automatic Load-Compute Pipelining in Deep Learning Compiler for AI-GPUs.

Language:PythonApache-2.0100

APNN-TC_SC21

Artifact for SC21: APNN-TC: Accelerating Arbitrary Precision Neural Networks on Ampere GPU Tensor Cores.

Language:Cuda100

APNN-TC-kernel

Language:Cuda020

cuda-samples

Samples for CUDA Developers which demonstrates features in CUDA Toolkit

Language:CNOASSERTION010

CUDALibrarySamples

CUDA Library Samples

Language:CudaNOASSERTION010

cutlass

CUDA Templates for Linear Algebra Subroutines

Language:C++BSD-3-Clause010

dgl_pydirect_internal

dgl_pydirect for multi-GPU full-graph computation

Language:Python010

docker-pytorch

A Docker image for PyTorch

Language:DockerfileMIT010

EL-Rec_SC22

Artifact for SC'22: EL-Rec: Efficient Large-scale Recommendation Model Training via Tensor-Train Embedding Table.

Language:Cuda000

Faith_ATC22

Artifact for Faith: An Efficient Framework for Transformer Verification on GPUs.

Language:Jupyter NotebookMIT000

fast-dpsgd

Code for fast dpsgd implementations in JAX/TF

MIT000

github_page

020

llvm-build

Docker file for build LLVM LibTooling

Language:Dockerfile020

openshmem-examples

Some miscellaneous OpenSHMEM examples

Language:C010

personal_page

Language:JavaScriptMIT010

rosette

The Rosette solver-aided host language, sample solver-aided DSLs, and demos

Language:RacketNOASSERTION010

sc21_AD

Language:ShellBSD-3-Clause020

TCGNN-bSpmm

Language:Python010

TCGNN-trition

Language:C++MIT000

TCGNN-tsparse

Language:CudaApache-2.0010

tutorials

PyTorch tutorials.

Language:PythonBSD-3-Clause010

tutorials-1

Training material for IPU users: tutorials, feature examples, simple applications

Language:Jupyter NotebookMIT010

YukeWang96.github.io

A beautiful, simple, clean, and responsive Jekyll theme for academics

Language:JavaScriptMIT010