ZhouZhenkun

This is an open source project (formerly named Listen, Attend and Spell - PyTorch Implementation) for end-to-end ASR implemented with Pytorch, the well known deep learning toolkit.

Language:PythonMIT010

espnet

End-to-End Speech Processing Toolkit

Language:PythonApache-2.0010

fairseq

Facebook AI Research Sequence-to-Sequence Toolkit written in Python.

Language:PythonMIT010

LAS_Mandarin_PyTorch

Listen, attend and spell Model and a Chinese Mandarin Pretrained model (中文-普通话 ASR模型)

Language:PythonMIT010

Listen-Attend-Spell

A PyTorch implementation of Listen, Attend and Spell (LAS), an End-to-End ASR framework.

Language:Python010

LPS_extraction

The script is to extract log-power-spectrum features for speech enhancement and bandwidth extension.

Language:Python010

malaya-speech

Speech Toolkit for bahasa Malaysia, https://malaya-speech.readthedocs.io/

Language:Jupyter NotebookMIT010

ML2021-Spring

**Official** 李宏毅 (Hung-yi Lee) 機器學習 Machine Learning 2021 Spring

Language:Jupyter Notebook010

Mockingjay-Speech-Representation

Official Implementation of Mockingjay in Pytorch

Language:PythonMIT010

In this project, I implemented FGSM and the basic iterative method to attack a pre-trained model. Then I tried to protect my model by doing randomization to the images before I feed them into my model.

Language:Jupyter Notebook010

netron

Visualizer for deep learning and machine learning models

Language:JavaScriptMIT020

s3prl

Self-Supervised Speech Pre-training and Representation Learning Toolkit.

Language:PythonMIT010

self-supervised-speech-recognition

speech to text with self-supervised learning based on wav2vec 2.0 framework

Language:Python010

softer-NMS

Softer-NMS: Rethinking Bounding Box Regression for Accurate Object Detection

Language:PythonApache-2.0020

speech_feature_extractor

Some useful features of speech process, such as MFCC, gammatone filterbank, GFCC, spectrum(power spectrum and log-power spectrum), Amplitude Modulation Spectrum(AMS) and so on.

Language:PythonMIT010

ZhouZhenkun

KUN's repositories

sednn

CTPN

IRM-based-Speech-Enhancement-using-LSTM

rnnoise

segan

SEGAN-1

segan-pytorch

segan_pytorch

text-detection-ctpn

AudioMultiBand

AudioVerification

Autoregressive-Predictive-Coding

deepspeech.pytorch

DNS-Challenge

End-to-end-ASR-Pytorch

espnet

fairseq

GAN_Understanding_Practicing

LAS_Mandarin_PyTorch

Listen-Attend-Spell

LPS_extraction

malaya-speech

ML2021-Spring

Mockingjay-Speech-Representation

Model-Attacking-Defending

netron

s3prl

self-supervised-speech-recognition

softer-NMS

speech_feature_extractor