Georgia Tech Visual Intelligence Lab

Georgia Tech Visual Intelligence Lab's repositories

VQA_LSTM_CNN

Train a deeper LSTM and normalized CNN Visual Question Answering model. This current code can get 58.16 on OpenEnded and 63.09 on Multiple-Choice on test-standard.

Language:Lua376 25 27

VQA

Language:PythonNOASSERTION359 21 11

abstract_scenes_v002

The second version of the interface for Abstract Scenes research project.

Language:JavaScript21 2 3

GuessWhich

Evaluating Visual Conversational Agents via Cooperative Human-AI Games

Language:Lua21 11 1

vision_language_in_the_wild

Language:Python5 110

VQA-Website

Visual Question Answering Website

Language:HTML4 120

vqa_browser

The VQA dataset browser back-end code, using nginx, Django, an PostgreSQL (running in Docker containers).

Language:Python4 70

torch-utilities

Utility functions for neural network implementations in Torch

Language:Lua200

abstract_binary_VQA

Language:MATLAB1 90