visual-audio

There are 0 repository under visual-audio topic.

geminate / mwave
A Music Player that can show audio waveform
electron-vue player visual-audio
Language:JavaScript 67
MinglangQiao / MVVA-Database
Database of "Learning to Predict Salient Faces: A Novel Visual-Audio Saliency Model", ECCV 2020
visual-audio visual-audio-saliency multi-modal talking-face multi-modal-database
Language:Python 10
MuSAELab / Multimodal-dataset-catalog
This repository lists publicly available datasets for visual-audio, speech and audio, and biomedical signal related tasks.
healthcare biomedical-signal dataset deepfake speech visual-audio
4
gusanmaz / echosight
EchoSight is a tool that helps visually impaired individuals by audibly describing images taken with a Raspberry Pi Camera or inputted via image path or URL across different operating systems.
cogvl coqui-tts llm llms raspberry-pi replicate replicate-api seamlessm4t visual-audio visual-audio-navigation vllm
Language:Python 2
MinglangQiao / visual_audio_saliency
Code for "Learning to Predict Salient Faces: A Novel Visual-Audio Saliency Model", ECCV 2020
multi-modal saliency-detection saliency-prediction visual-audio visual-audio-saliency
Language:Python 2
mx-mark / SPMNet
Source code for "Visually aligned sound generation via sound-producing motion parsing" (Published at Neurocomputing)
audio-generation cross-modality synchronization visual-audio visual-to-sound audioset vas video-understanding
1

geminate / mwave