Beast code in Giters

Minxing Luo's starred repositories

brush-your-text

Language:Python7500

ShiArthur03

Language:MATLABGPL-3.01030900

EAST

EAST: An Efficient and Accurate Scene Text Detector.

Language:C++MIT1400

AnyText

Official implementation code of the paper <AnyText: Multilingual Visual Text Generation And Editing>

Language:PythonApache-2.0408800

MIGC

[CVPR 2024 Highlight] "MIGC: Multi-Instance Generation Controller for Text-to-Image Synthesis" (Official Implementation)

Language:PythonNOASSERTION49800

PCIG

400

diffusion_reward

[ECCV 2024] 💐Official implementation of the paper "Diffusion Reward: Learning Rewards via Conditional Video Diffusion"

Language:PythonMIT6200

interactdiffusion

[CVPR 2024] Official repo for "InteractDiffusion: Interaction-Control for Text-to-Image Diffusion Model".

Language:Python8400

Q-DiT

PyTorch code for Q-DiT: Accurate Post-Training Quantization for Diffusion Transformers

Language:Python1900

Six-CD

Six-CD: Benchmarking Concept Removals for Benign Text-to-image Diffusion Models

Language:PythonMIT300

bioclip

This is the repository for the BioCLIP model and the TreeOfLife-10M dataset [CVPR'24 Oral, Best Student Paper].

Language:PythonNOASSERTION12900

geneval

GenEval: An object-focused framework for evaluating text-to-image alignment

Language:HTMLMIT7100

mmdit

Implementation of a single layer of the MMDiT, proposed in Stable Diffusion 3, in Pytorch

Language:PythonMIT20500

SimpleTuner

A general fine-tuning kit geared toward Stable Diffusion 2.1, Stable Diffusion 3, DeepFloyd, and SDXL.

Language:PythonAGPL-3.045700

cutlass

CUDA Templates for Linear Algebra Subroutines

Language:C++NOASSERTION503400

make-it-count

Official implemention of "Make It Count: Text-to-Image Generation with an Accurate Number of Objects"

Language:Python4700

VideoTetris

VideoTetris: Towards Compositional Text-To-Video Generation

Language:Python18800

llama

Inference code for Llama models

Language:PythonNOASSERTION5485400

JARVIS

JARVIS, a system to connect LLMs with ML community. Paper: https://arxiv.org/pdf/2303.17580.pdf

Language:PythonMIT2343900

Omost

Your image is almost there!

Language:PythonApache-2.0702400

PatchScaler

PatchScaler: An Efficient Patch-independent Diffusion Model for Super-Resolution

Apache-2.02900

LOVA3

The official repo of "Learning to Visual Question Answering, Asking and Assessment"

Language:Python900

MoRA

MoRA: High-Rank Updating for Parameter-Efﬁcient Fine-Tuning

Language:Python30900

DMD2

Language:PythonNOASSERTION36900

EditWorld

EditWorld: Simulating World Dynamics for Instruction-Following Image Editing

Language:Python10100

Diff-BGM

official code for CVPR'24 paper Diff-BGM

Language:Python3400

ViViD

ViViD: Video Virtual Try-on using Diffusion Models

Language:PythonApache-2.040000

fast-kan

FastKAN: Very Fast Implementation of Kolmogorov-Arnold Networks (KAN)

Language:Jupyter NotebookApache-2.030000

Efficient-Vision-Language-Pre-training-by-Cluster-Masking

[CVPR 2024] Improving language-visual pretraining efficiency by perform cluster-based masking on images.

Language:Python2000

ContextDiff

[ICLR 2024] Contextualized Diffusion Models for Text-Guided Image and Video Generation

Language:Python5300