melgan

There are 0 repository under melgan topic.

coqui-ai / TTS
🐸💬 - a deep learning toolkit for Text-to-Speech, battle-tested in research and production
deep-learning glow-tts hifigan melgan multi-speaker-tts python pytorch speaker-encoder speaker-encodings speech speech-synthesis tacotron text-to-speech tts tts-model vocoder voice-cloning voice-conversion voice-synthesis
Language:Python 32152
mozilla / TTS
:robot: :speech_balloon: Deep learning for Text to Speech (Discussion forum: https://discourse.mozilla.org/c/tts)
deep-learning text-to-speech python pytorch tacotron tts speaker-encoder dataset-analysis tacotron2 tensorflow2 vocoder melgan gantts multiband-melgan glow-tts speech
Language:Jupyter Notebook 9064
TensorSpeech / TensorFlowTTS
:stuck_out_tongue_closed_eyes: TensorFlowTTS: Real-Time State-of-the-art Speech Synthesis for Tensorflow 2 (supported including English, French, Korean, Chinese, German and Easy to adapt for other languages)
chinese-tts fastspeech fastspeech2 german-tts japanese-tts korea-tts melgan mobile-tts multi-speaker-tts multiband-melgan parallel-wavegan real-time speech-synthesis tacotron2 tensorflow2 text-to-speech tflite tts vocoder zh-tts
Language:Python 3764
kan-bayashi / ParallelWaveGAN
Unofficial Parallel WaveGAN (+ MelGAN & Multi-band MelGAN & HiFi-GAN & StyleMelGAN) with Pytorch
speech-synthesis neural-vocoder text-to-speech pytorch wavenet parallel-wavenet realtime tts melgan vocoder hifigan style-melgan
Language:Jupyter Notebook 1528
v-iashin / SpecVQGAN
Source code for "Taming Visually Guided Sound Generation" (Oral at the BMVC 2021)
audio audio-generation bmvc evaluation-metrics gan melgan multi-modal pytorch transformer vas vggsound video video-features video-understanding vqvae
Language:Jupyter Notebook 334
rishikksh20 / VocGAN
VocGAN: A High-Fidelity Real-time Vocoder with a Hierarchically-nested Adversarial Network
vocoder gan melgan vocgan speech-synthesis text-to-speech speech-processing
Language:Python 318
atomicoo / FCH-TTS
A fast Text-to-Speech (TTS) model. Work well for English, Mandarin/Chinese, Japanese, Korean, Russian and Tibetan (so far). 快速语音合成模型，适用于英语、普通话/中文、日语、韩语、俄语和藏语（当前已测试）。
tts english tibetan mandarin japanese russian dctts tacotron fastspeech korean chinese melgan pytorch
Language:Python 241
xcmyz / FastVocoder
Include Basis-MelGAN, MelGAN, HifiGAN and Multiband-HifiGAN, maybe NHV in the future.
hifigan melgan vocoder speech-synthesis
Language:Python 155
ga642381 / FastSpeech2
Multi-Speaker Pytorch FastSpeech2: Fast and High-Quality End-to-End Text to Speech :fist:
fastspeech2 melgan multi-speaker-tts pytorch text-to-speech tts waveglow
Language:Python 91
rishikksh20 / melgan
MelGAN implementation with Multi-Band and Full Band supports...
full-band-melgan melgan melgan-stft multi-band-melgan speech speech-synthesis text-to-speech vocoder
Language:Jupyter Notebook 60
rishikksh20 / iSTFT-Avocodo-pytorch
Ultrafast GAN based Vocoder for Text to Speech
avocodo gan hifigan melgan speech speech-synthesis text-to-speech tts vocoder
Language:Python 51
himajin2045 / voice-conversion
Voice Conversion pipeline consisting of GE2E speaker encoder, AutoVC conversion model and MelGAN vocoder.
ge2e autovc melgan voice-conversion
Language:Python 23
zeroone-universe / RealTimeBWE
Unofficial Pytorch Lightning Implementation of "Real-time Speech Frequency Bandwidth Extension"
bandwidth-extension melgan pytorch-implementation pytorch-lightning
Language:Python 23
diver-j / melgan-multi
MelGAN Multi GPU Implementation.
melgan multi-gpu distributed vocoder tts speech-synthesis audio
Language:Python 8
elephantmipt / MelGAN
MelGAN with catalyst framework
gan catalyst audio-processing vocoder melgan
Language:Python 3
erogol / ddc-samples
🐸💬 Coqui TTS Double Decoder Consistency samples
tts mozilla-tts mozilla double-decoder-consistency melgan tacotron
Language:HTML 2
mehdihosseinimoghadam / Catalan-Text-to-Speech
Catalan Text to Speech
catalan catalan-language speech speech-processing speech-synthesis speech-to-text catalan-text-to-speech pytorch fastspeech tacotron tacotron2 tacotron2-pytorch melgan hifi-gan wavernn
Language:Python 2
che-roman / mb-melgan
Unofficial implementation of Multi-band MelGAN
melgan multiband-melgan pqmf-banks pytorch speech-synthesis text-to-speech tts vocoder
Language:Python 1
gaetano-signorelli / ScreamNet
A neural network (GAN) trained to apply metal screaming effects, turning vocals from songs, speeches or whispers into realistic screams and growls.
audio-processing generative-adversarial-network melgan metalcore music tensorflow scream
Language:Python 1
Mixergi / MelGAN
pytorch melgan
Language:Python 1
shun60s / Mel-GAN-clone
Cloned from descriptinc/melgan-neurips (pytorch).
melgan
Language:Python 1
systemcorp-ai / systemcorp-ai.github.io
SE-MelGAN - Speaker Agnostic Rapid Speech Enhancement
deep-learning generative-adversarial-networks melgan
Language:HTML 1
ZirumAndBigBro / MelGan-WavGan
MelGAN and WavGAN Vocoder
melgan vocoder wavgan
Language:Python 0

melgan

coqui-ai / TTS

mozilla / TTS

TensorSpeech / TensorFlowTTS

kan-bayashi / ParallelWaveGAN

v-iashin / SpecVQGAN

rishikksh20 / VocGAN

atomicoo / FCH-TTS

xcmyz / FastVocoder

ga642381 / FastSpeech2

rishikksh20 / melgan

rishikksh20 / iSTFT-Avocodo-pytorch

himajin2045 / voice-conversion

zeroone-universe / RealTimeBWE

diver-j / melgan-multi

elephantmipt / MelGAN

erogol / ddc-samples

mehdihosseinimoghadam / Catalan-Text-to-Speech

che-roman / mb-melgan

gaetano-signorelli / ScreamNet

Mixergi / MelGAN

shun60s / Mel-GAN-clone

systemcorp-ai / systemcorp-ai.github.io

ZirumAndBigBro / MelGan-WavGan