textvqa

There are 0 repository under textvqa topic.

facebookresearch / mmf
A modular framework for vision & language multimodal research from Facebook AI Research (FAIR)
captioning deep-learning dialog hateful-memes multi-tasking multimodal pretrained-models pytorch textvqa vqa
Language:Python 5598
yashkant / sam-textvqa
Official code for paper "Spatially Aware Multimodal Transformers for TextVQA" published at ECCV, 2020.
eccv textvqa vision language
Language:Python 64
phiyodr / vqaloader
PyTorch DataLoader for many VQA datasets
dataloader gqa pytorch textvqa vqa vqav2
Language:Python 13
soonchangAI / LFPR
[PRL 2024] This is the code repo for our label-free pruning and retraining technique for autoregressive Text-VQA Transformers (TAP, TAP†).
pruning-algorithms textvqa transformer
Language:Python 2

facebookresearch / mmf