image-text-matching

There are 6 repositories under image-text-matching topic.

NVlabs / GroupViT
Official PyTorch implementation of GroupViT: Semantic Segmentation Emerges from Text Supervision, CVPR 2022.
image-text-matching transformers zero-shot-learning semantic-segmentation
Language:Python 699
Paranioar / Awesome_Matching_Pretraining_Transfering
The Paper List of Large Multi-Modality Model, Parameter-Efficient Finetuning, Vision-Language Pretraining, Conventional Image-Text Matching for Preliminary Insight.
cross-modal-retrieval tutorial awesome-list image-text-matching image-text-retrieval large-language-models large-vision-language-models large-vision-models memory-efficient-tuning multimodal-pretraining parameter-efficient-fine-tuning video-text-recognition video-text-retrieval vision-and-language visual-semantic-embedding
357
Paranioar / SGRAF
[AAAI2021] The code of “Similarity Reasoning and Filtration for Image-Text Matching”
cross-modal-retrieval image-text-matching image-retrieval image-text-retrieval text-matching aaai similarity-metric
Language:Python 200
woodfrog / vse_infty
Code for "Learning the Best Pooling Strategy for Visual Semantic Embedding", CVPR 2021
vse image-text-matching cross-modal-retrieval vision-language visual-semantic pytorch
Language:Python 149
slavabarkov / tidy
Offline semantic Text-to-Image and Image-to-Image search on Android powered by quantized state-of-the-art vision-language pretrained CLIP model and ONNX Runtime inference engine
android clip computer-vision deep-learning image-retrieval kotlin nlp onnx quantization image-text-retrieval cross-modal-retrieval image-text-matching image-search semantic-search
Language:Kotlin 124
kywen1119 / DSRAN
Code for journal paper "Learning Dual Semantic Relations with Graph Attention for Image-Text Matching", TCSVT, 2020.
pytorch image-text-matching tcsvt cross-modal computer-vision
Language:Python 68
naver-ai / eccv-caption
Extended COCO Validation (ECCV) Caption dataset (ECCV 2022)
cross-modal-retrieval dataset deep-learning eccv2022 evaluation image-text-matching machine-learning vision-and-language vl-benchmark
Language:Python 51
weiyx16 / CLIP-pytorch
A non-JIT version implementation / replication of CLIP of OpenAI in pytorch
clip image-text-matching pytorch
Language:Python 34
eric-ai-lab / ComCLIP
Official implementation and dataset for the NAACL 2024 paper "ComCLIP: Training-Free Compositional Image and Text Matching"
blip2 causality clip compositionality flickr30k flickr8k-dataset image-text-matching image-text-retrieval slip svo vision-and-language winoground
Language:Python 25
Paranioar / RCAR
[TIP2023] The code of “Plug-and-Play Regulators for Image-Text Matching”
cross-modal-retrieval image-text-matching image-retrieval image-text-retrieval text-matching tip regulator
Language:Python 25
MartinYuanNJU / SEMScene
Code implementation of paper "SEMScene: Semantic-Consistency Enhanced Multi-Level Scene Graph Matching for Image-Text Retrieval" (ACM TOMM 2024).
image-text-matching scene-graph-models cross-modal-retrieval
Language:Python 17
nhtlongcs / AIC2022-VER
Text Query based Traffic Video Event Retrieval with Global-Local Fusion Embedding
image-text-matching retrieval aicitychallenge pytorch pytorch-lightning
Language:Python 11
cuiaiyu / Text-to-Image-ReIdentification
Unofficial code of paper "Improving description-based person re-identification by multi-granularity image-text alignment." by Niu et al. (partially implemented)
pytorch re-identification image-text-matching
Language:Jupyter Notebook 8
kaylode / tern
Cross-modal Retrieval using Transformer Encoder Reasoning Networks (TERN). With use of Metric Learning and FAISS for fast similarity search on GPU
cross-modal-retrieval image-text-retrieval transformer image-text-matching
Language:Jupyter Notebook 7
marialymperaiou / knowledge-enhanced-multimodal-learning
A list of research papers on knowledge-enhanced multimodal learning
conditional-image-generation image-text-matching image-text-retrieval knowledge-graph multimodal-deep-learning multimodal-retrieval story-visualization vision-and-language vision-and-language-navigation vision-and-language-pre-training vision-language-transformer visual-commonsense-reasoning visual-dialog visual-grounding visual-question-answering visual-reasoning visual-storytelling multi-task-learning knowledge-enhanced-multimodal-learning knowledge-enhanced-vision-language
7
zabir-nabil / bangla-image-search
A dead-simple image search and image-text matching system for Bangla using CLIP
clip deep-learning image-search image-search-engine search search-engine bangla-clip-search clip-image-search-engine contrastive-language-image-pre-training deep-learning-image-search image-retrieval image-text-matching openai-clip
Language:Python 6
Paranioar / DBL
[TIP2024] The code of “Deep Boosting Learning: A Brand-new Cooperative Approach for Image-Text Matching”
cross-modal-retrieval image-retrieval image-text-matching image-text-retrieval text-matching tip boosting-learning metric-research
5
KerimKochekov / Image-Text-Matching
BSs Graduation Project implementation [Image-Text Matching]
encoder-decoder image-text-matching
Language:Jupyter Notebook 3
zabir-nabil / bangla-CLIP
CLIP (Contrastive Language–Image Pre-training) for Bangla.
clip clip-image-search-engine contrastive-language-image-pre-training image-retrieval image-text-matching openai-clip bangla-image-retrieval bangla-image-search
Language:Python 3
basic-go-ahead / wikipedia-image-caption-matching
The 3rd place solution code for the Wikipedia - Image/Caption Matching Competition on Kaggle
natural-language-processing nlp search-relevance image-text-matching kaggle kaggle-competition matcher
Language:Jupyter Notebook 1
hthoai / image-text-matching
Image-Text Matching Model Zoo
image-text-matching cross-modal-retrieval stacked-cross-attention image-captioning visual-semantic
Language:Python 1
Paranioar / Awesome_Image_Text_Retrieval_Benchmark
The Unified Code of Image-Text Retrieval for Further Exploration.
cross-modal-retrieval image-text-matching benchmark image-text-retrieval
Language:Python 1
gaurav104 / Image-Text-Matching
image-matching image-text-matching person-identification text-matching
Language:Python 0
Cbhihe / NLP_clip-bleu-meteor
Python Implementation of lexical vector embedding similarity scoring, zero-shot classification of images and n-gram based scoring to compare textual summaries
bimodal deep-learning image-text-matching meteor n-grams python scoring-algorithm vector-embeddings bleu clip nlp-machine-learning nltk rouge
Language:Jupyter Notebook