visual-speech-recognition

There are 6 repositories under visual-speech-recognition topic.

mpc001 / Visual_Speech_Recognition_for_Multiple_Languages
Visual Speech Recognition for Multiple Languages
lipreading visual-speech-recognition
Language:Python 446
mpc001 / auto_avsr
Auto-AVSR: Lip-Reading Sentences Project
lipreading visual-speech-recognition
Language:Python 384
smeetrs / deep_avsr
A PyTorch implementation of the Deep Audio-Visual Speech Recognition paper.
audio-visual-speech-recognition speech-recognition lip-reading automatic-speech-recognition speech-to-text visual-speech-recognition
Language:Python 237
sailordiary / LipNet-PyTorch
"LipNet: End-to-End Sentence-level Lipreading" in PyTorch
cnn-architecture deep-learning lipreading pytorch-implementation visual-speech-recognition
Language:Python 69
georgesterpu / pyVSR
Python toolkit for Visual Speech Recognition
aam dct hidden-markov-models visual-speech-recognition tcdtimit python hmm
Language:Python 38
umbertocappellazzo / Llama-AVSR
[ICASSP 2025] Official Pytorch implementation of "Large Language Models are Strong Audio-Visual Speech Recognition Learners".
audio-visual-speech-recognition large-language-models visual-speech-recognition
Language:Python 35
VIPL-Audio-Visual-Speech-Understanding / deep-face-speechreading
Visual speech recognition with face inputs: code and models for F&G 2020 paper "Can We Read Speech Beyond the Lips? Rethinking RoI Selection for Deep Visual Speech Recognition"
lip-reading visual-speech-recognition speech-reading computer-vision pytorch
Language:Python 19
YasserdahouML / VSR_test_set
WildVSR
visual-speech-recognition
Language:Python 17
Megamind22 / lstArab100words
Deep Visual Speech Recognition in arabic words
computer-vision lip-reading pytorch visual-speech-recognition arabic
Language:Jupyter Notebook 16
david-gimeno / tailored-avsr
Official source code for the paper "Tailored Design of Audio-Visual Speech Recognition Models using Branchformers"
audio-visual-speech-recognition interpretability lipreading parameter-efficient robust-asr visual-speech-recognition
Language:Python 13
Saeed-Biabani / LipReading
Visual Speech Recognition using deep learing methods
lipreading lipreading-pytorch python pytorch visual-speech-recognition lipnet
Language:Python 8
YasserdahouML / Lip2Vec
Lip2Vec
visual-speech-recognition
Language:Python 8
manideep2510 / Lipreading-Keras
Implementation of "Combining Residual Networks with LSTMs for Lipreading" in Keras and Tensorflow2.0
deep-learning keras lipreading lipreading-keras lstm resnet tensorflow2 visual-speech-recognition
Language:Python 5
SMIL-SPCRAS / EMOLIPS
EMOLIPS: TWO-LEVEL APPROACH FOR LIP-READING EMOTIONAL SPEECH
automatic-speech-recognition emotional-speech lip-reading visual-speech-recognition
Language:Python 5
Pooventhiran / VSR
Speaker-Independent Speech Recognition using Visual Features
lip-reading vsr speech-recognition speech-to-text visual-speech-recognition visual-speech lipreading
Language:Python 4
david-gimeno / evaluating-end2end-spanish-lipreading
Visual Speech Recognition for Spanish
benchmark evaluation lipreading spanish visual-speech-recognition
Language:Jupyter Notebook 3
BenedettoSimone / Lipnet-ITA
LipReadingITA: Keras implementation of the method described in the paper 'LipNet: End-to-End Sentence-level Lipreading'. Research project for University of Salerno.
deep-learning lipnet visual-speech-recognition
2
elnaske / LipNet
A single-speaker reimplementation of the LipNet architecture for lip reading.
computer-vision lipnet pytorch visual-speech-recognition
Language:Python 2
luomingshuang / lipreading_with_icefall
In this repository, I try to use k2, icefall and Lhotse for lip reading. I will modify it for the lip reading task. Many different lip-reading datasets should be added. -_-
lip-reading k2 icefall visual-speech-recognition audio-visual-speech-recognition
Language:Python 2
mohamed-gasser / Word-Level-LipReading-in-Arabic
Deep Visual Speech Recognition in arabic words
arabic computer-vision deep-learning lip-reading machine-learning python pytorch visual-speech-recognition
2
BenedettoSimone / OnlineKD-LipNetITA
Online Knowledge Distillation using LipNet and an Italian dataset. Master's Thesis Project.
knowledge-distillation lipnet visual-speech-recognition
Language:Python 1
sajR / V-SAD
neural-network machine-learning speech-activity-detection visual-speech-recognition
Language:Python 1
mitran27 / Multi-Factor-Authentication
Strong Gateway using Speech Processing ,3D Vision and Language processing . Deployed using Django
speech-recognition speaker-verification visual-speech-recognition metric-learning django
Language:Jupyter Notebook 0

visual-speech-recognition

mpc001 / Visual_Speech_Recognition_for_Multiple_Languages

mpc001 / auto_avsr

smeetrs / deep_avsr

sailordiary / LipNet-PyTorch

georgesterpu / pyVSR

umbertocappellazzo / Llama-AVSR

VIPL-Audio-Visual-Speech-Understanding / deep-face-speechreading

YasserdahouML / VSR_test_set

Megamind22 / lstArab100words

david-gimeno / tailored-avsr

Saeed-Biabani / LipReading

YasserdahouML / Lip2Vec

manideep2510 / Lipreading-Keras

SMIL-SPCRAS / EMOLIPS

Pooventhiran / VSR

david-gimeno / evaluating-end2end-spanish-lipreading

BenedettoSimone / Lipnet-ITA

elnaske / LipNet

luomingshuang / lipreading_with_icefall

mohamed-gasser / Word-Level-LipReading-in-Arabic

BenedettoSimone / OnlineKD-LipNetITA

sajR / V-SAD

mitran27 / Multi-Factor-Authentication