kaldi

There are 16 repositories under kaldi topic.

kaldi-asr / kaldi
kaldi-asr/kaldi is the official location of the Kaldi project.
kaldi c-plus-plus cuda shell speech-recognition speech-to-text speaker-verification speaker-id speech
Language:Shell 13796
espnet / espnet
End-to-End Speech Processing Toolkit
chainer deep-learning end-to-end kaldi machine-translation pytorch singing-voice-synthesis speaker-diarization speech-enhancement speech-recognition speech-separation speech-synthesis speech-translation spoken-language-understanding voice-conversion
Language:Python 7941
alphacep / vosk-api
Offline speech recognition API for Android, iOS, Raspberry Pi and servers with Python, Java, C# and Node
speech-recognition asr voice-recognition speech-to-text android ios raspberry-pi deep-learning deep-neural-networks speech-to-text-android speaker-identification speaker-verification python offline privacy kaldi deepspeech google-speech-to-text vosk stt
Language:Jupyter Notebook 7143
pytorch-kaldi
mravanelli / pytorch-kaldi
pytorch-kaldi is a project for developing state-of-the-art DNN/RNN hybrid speech recognition systems. The DNN part is managed by pytorch, while feature extraction, label computation, and decoding are performed with the kaldi toolkit.
speech-recognition gru dnn kaldi rnn-model pytorch timit deep-learning deep-neural-networks recurrent-neural-networks multilayer-perceptron-network lstm lstm-neural-networks speech asr rnn dnn-hmm
Language:Python 2352
Dragonfire
DragonComputer / Dragonfire
the open-source virtual assistant for Ubuntu based Linux distributions
linux ubuntu spacy chatbot kaldi speech-recognition speech-to-text text-to-speech nlp machine-learning artificial-intelligence virtual-assistant personal-assistant
Language:Python 1382
MontrealCorpusTools / Montreal-Forced-Aligner
Command line utility for forced alignment using Kaldi
kaldi forced-alignment grapheme-to-phone pronunciation-dictionary acoustic-model python
Language:Python 1218
pykaldi / pykaldi
A Python wrapper for Kaldi
python wrapper kaldi openfst asr speech-recognition speech language-model feature-extraction clif numpy
Language:Python 979
espresso
freewym / espresso
Espresso: A Fast End-to-End Neural Speech Recognition Toolkit
python pytorch fairseq kaldi end-to-end speech-recognition asr
Language:Python 941
lhotse-speech / lhotse
Tools for handling speech data in machine learning projects.
ai audio data deep-learning kaldi machine-learning python pytorch speech speech-recognition
Language:Python 870
alphacep / vosk-server
WebSocket, gRPC and WebRTC speech recognition server based on Vosk and Kaldi libraries
websocket speech-recognition kaldi python asr grpc saas webrtc vosk
Language:Python 849
srvk / eesen
The official repository of the Eesen project
tensorflow ctc-loss asr ctc kaldi speech-recognition speech-to-text
Language:C++ 824
alphacep / vosk-android-demo
Offline speech recognition for Android with Vosk library.
android kaldi offline speech-recognition asr vosk
Language:Java 685
zw76859420 / ASR_Theory
语音识别理论，论文和PPT
asr kaldi tensorflow keras papers ppt deeplearning
566
bbc / react-transcript-editor
A React component to make correcting automated transcriptions of audio and video easier and faster. By BBC News Labs. - Work in progress
bbc-news-labs news-labs transcript transcription transcript-editor stt kaldi react textav
Language:JavaScript 536
YoavRamon / awesome-kaldi
This is a list of features, scripts, blogs and resources for better using Kaldi ( http://kaldi-asr.org/ )
kaldi-asr kaldi automatic-speech-recognition awesome-list speech-to-text speech speech-recognition
532
gooofy / zamia-speech
Open tools and data for cloudless automatic speech recognition
kaldi speech-corpora voxforge sequitur lexicon cmu-sphinx language-model asr speech-recognition
Language:Python 442
funcwj / setk
Tools for Speech Enhancement integrated with Kaldi
beamforming kaldi rir-generator speech speech-enhancement speech-separation time-frequency-masking
Language:Python 390
open-speech / speech-aligner
speech-aligner，是一个从“人声语音”及其“语言文本”，产生音素级别时间对齐标注的工具。speech-aligner, is a tool that generate phoneme-level alignment between human speech and its transcription
speech kaldi cpp
Language:C++ 386
hitachi-speech / EEND
End-to-End Neural Diarization
speaker-diarization end-to-end eend machine-learning chainer kaldi deep-learning
Language:Python 352
goodatlas / zeroth
Kaldi-based Korean ASR (한국어 음성인식) open-source project
kaldi zeroth korean asr language-model speech-recognition audio-data lexicon open-source fastcampus data-augmentation tdnn
Language:Shell 345
ccoreilly / vosk-browser
A speech recognition library running in the browser thanks to a WebAssembly build of Vosk
asr kaldi speech-recognition speech-to-text stt typescript vosk wasm webassembly
Language:JavaScript 334
daanzu / kaldi-active-grammar
Python Kaldi speech recognition with grammars that can be set active/inactive dynamically at decode-time
kaldi-asr speech-recognition grammars python speech-to-text kaldi kaldi-grammar dictation voice coding voice-coding voice-commands voice-control command-and-control
Language:Python 329
SergeyShk / Speech-to-Text-Russian
Проект для распознавания речи на русском языке на основе pykaldi.
asr kaldi pykaldi speech-to-text speech-recognition russian-specific
Language:Python 309
jcsilva / docker-kaldi-gstreamer-server
Dockerfile for kaldi-gstreamer-server.
kaldi kaldi-gstreamer-server asr docker worker-server
Language:Dockerfile 287
nttcslab-sp / kaldiio
A pure python module for reading and writing kaldi ark files
python kaldi speech-recognition fileio file-formats pure-python python2 python3
Language:Python 243
XiaoMi / kaldi-onnx
Kaldi model converter to ONNX
kaldi onnx mace android ios speech-recognition
Language:Python 233
Diamondfan / CTC_pytorch
CTC end -to-end ASR for timit and 863 corpus.
ctc decoder kaldi pytorch timit
Language:Python 217
jzlianglu / pykaldi2
Yet another speech toolkit based on Kaldi and PyTorch
kaldi speech-toolkit horovod pykaldi pytorch
Language:Python 173
csukuangfj / kaldifeat
Kaldi-compatible online & offline feature extraction with PyTorch, supporting CUDA, batch processing, chunk processing, and autograd - Provide C++ & Python API
kaldi features-extraction mfcc plp fbank python online-feature-extractor streaming-feature-extractor pytorch cpp
Language:C++ 170
gooofy / py-kaldi-asr
Some simple wrappers around kaldi-asr intended to make using kaldi's (online) decoders as convenient as possible.
kaldi-asr wrapper kaldi asr speech-recognition python python-2
Language:C++ 170
elpis
CoEDL / elpis
🙊 software for creating speech recognition models.
kaldi transcription computational-linguistics linguistics automatic-speech-recognition python docker
Language:Python 150
cvqluu / Factorized-TDNN
PyTorch implementation of the Factorized TDNN (TDNN-F) from "Semi-Orthogonal Low-Rank Matrix Factorization for Deep Neural Networks" and Kaldi
kaldi tdnn tdnn-f pytorch speech-recognition speaker-recognition acoustic-model neural-network neural-networks speaker-diarization speaker-verification x-vector embedding factorized-tdnn acoustic-models
Language:Python 143
jinserk / pytorch-asr
ASR with PyTorch
speech pytorch ctc pyro kaldi speech-recognition lvcsr python resnet lattice decoder transcription dictation pytorch-binding kaldi-decoder asr deepspeech densenet capsule-network ss-vae
Language:Python 139
Garvys / rustfst
Rust re-implementation of OpenFST - library for constructing, combining, optimizing, and searching weighted finite-state transducers (FSTs). A Python binding is also available.
fst wfst rust rust-lang rust-crate transducers finite-state-transducers finite-state-acceptors automata openfst speech-recognition fsts asr tokenizer transducer graph shortest-path composition kaldi kaldi-asr
Language:Rust 138
jimbozhang / kaldi-gop
Computes the GMM-based Goodness of Pronunciation (GOP). Bases on Kaldi.
speech-recognition kaldi
Language:C++ 137
jefflai108 / pytorch-kaldi-neural-speaker-embeddings
A light weight neural speaker embeddings extraction based on Kaldi and PyTorch.
speaker-verification speaker-recognition speech-processing speaker-identification pytorch kaldi learnable-dictionary-encoding
Language:Perl 134