mel-spectrogram

There are 1 repository under mel-spectrogram topic.

Sharad24 / Neural-Voice-Cloning-with-Few-Samples
Implementation of Neural Voice Cloning with Few Samples Research Paper by Baidu
voice-cloning speech-synthesis speech-processing speaker-encodings encodings speech speaker-embeddings mel-spectrogram
Language:Python 254
BShakhovsky / PolyphonicPianoTranscription
Recurrent Neural Network for generating piano MIDI-files from audio (MP3, WAV, etc.)
piano-transcription audio-to-midi convolutional-neural-network recurrent-neural-network cnn-keras rnn-keras keras keras-tensorflow constant-q constant-q-transform cqt-spectrogram mel-spectrogram tensorflow-magenta
Language:Jupyter Notebook 253
tiberiu44 / TTS-Cube
End-2-end speech synthesis with recurrent neural networks
speech synthesis text-to-speech end-2-end neural lstm character phoneme neural-network long-short-term-memory mel-spectrogram autoregressive
Language:Python 224
Data-Science-kosta / Speech-Emotion-Classification-with-PyTorch
This repository contains PyTorch implementation of 4 different models for classification of emotions of the speech.
speech-emotion-recognition ravdess-dataset transformer attention-lstm cnn pytorch stacked parallel spectrogram mel-spectrogram data-augmentation awgn
Language:Jupyter Notebook 208
spotify / realbook
Easier audio-based machine learning with TensorFlow.
audio cqt librosa machine-learning mel-spectrogram spectrograms stft tensorflow
Language:Python 120
CVxTz / audio_classification
CNN 1D vs 2D audio classification
audio-classification audio convolutional-neural-networks keras tensorflow mel-spectrogram
Language:Jupyter Notebook 104
MycroftAI / sonopy
A simple audio feature extraction library
audio-processing mfcc spectrogram sound mel-spectrogram library
Language:Python 80
echocatzh / torch-mfcc
A librosa STFT/Fbank/mfcc feature extration written up in PyTorch using 1D Convolutions.
short-time-fourier-transform signal-processing filter-bank mel-spectrogram
Language:Python 74
zzw922cn / LPC_for_TTS
Linear Prediction Coefficients estimation from mel-spectrogram implemented in Python based on Levinson-Durbin algorithm.
lpc tts vocoder audiocompression lpcnet wavernn mel-spectrogram
Language:Python 71
rednafi / urban-sound-classification
Urban sound source tagging from an aggregation of four second noisy audio clips via 1D and 2D CNN (Xception)
machine-learning classification audio-processing audio-tagging sound-classification sound-classification-spectrograms urban-sound-classification urban-sound-8k mel-spectrogram sound-processing sound-synthesis
Language:Jupyter Notebook 60
zafarrafii / Zaf-Python
Zafar's Audio Functions in Python for audio signal analysis: STFT, inverse STFT, mel filterbank, mel spectrogram, MFCC, CQT kernel, CQT spectrogram, CQT chromagram, DCT, DST, MDCT, inverse MDCT.
python stft dct dst mdct inverse-stft cqt-kernel cqt-spectrogram chromagram inverse-mdct mfcc mel-filterbank short-time-fourier-transform mel-frequency-cepstral-coefficients discrete-cosine-transform discrete-sine-transform mel-spectrogram constant-q-transform modified-discrete-cosine-transform audio-signal-processing
Language:Jupyter Notebook 57
zafarrafii / Zaf-Matlab
Zafar's Audio Functions in Matlab for audio signal analysis: STFT, inverse STFT, mel filterbank, mel spectrogram, MFCC, CQT kernel, CQT spectrogram, CQT chromagram, DCT, DST, MDCT, inverse MDCT.
stft istft chromagram mfcc dct dst mdct imdct matlab cqt-kernel cqt-spectrogram mel-filterbank mel-spectrogram short-time-fourier-transform mel-frequency-cepstral-coefficients discrete-cosine-transform discrete-sine-transform modified-discrete-cosine-transform constant-q-transform audio-signal-processing
Language:Jupyter Notebook 49
skanderhamdi / attention_cnn_lstm_covid_mel_spectrogram
Attention-based Hybrid CNN-LSTM and Spectral Data Augmentation for COVID-19 Diagnosis from Cough Sound
attention-mechanism convolutional-neural-networks long-short-term-memory deep-learning covid-19 mel-spectrogram audio-processing covid-19-dataset covid-19-disease-diagnosis data-augmentation spec-augmentation
Language:Python 32
Friedrich-M / Audio-signal-classification-and-identification
基于梅尔频谱的信号分类和识别
machine-learning mel-spectrogram recognition signal-processing
Language:Python 21
adasegroup / OSM-one-shot-multispeaker
Framework for one-shot multispeaker system based on Deep Learning
voice-cloning speaker-encoders os-ms-tts speech mel-spectrogram tacotron wavernn speech-synthesis tts text-to-speech
Language:Python 19
ddman1101 / EDM-subgenre-classifier
Code for "Deep Learning Based EDM Subgenre Classification using Mel-Spectrogram and Tempogram Features" arXiv:2110.08862, 2021.
pytorch edm genres-classification beatport cnn-pytorch python tempogram mel-spectrogram music-information-retrieval deep-learning
Language:Python 19
yoyolicoris / wavenet-like-vocoder
Basic wavenet and fftnet vocoder model.
wavenet pytorch vocoder mel-spectrogram fftnet
Language:Python 19
VisionBrain / Neural_Voice_Cloning
Open Source Implementation of Neural Voice Cloning with Few Audio Samples (Baidu Research)
deep-learning voice-recognition speech-synthesis speech-processing voice-synthesis aryan05 speaker-recognition speaker-adaptation pytorch artificial-intelligence speaker-encodings mel-spectrogram audio-processing
Language:Python 17
Keerthiraj-Nagaraj / cough-detection-with-transfer-learning
Cough detection with Log Mel Spectrogram, Wavelet Transform, Deep learning and Transfer learning techniques
deep-neural-networks transfer-learning vgg16-model cough-detection machine-learning wavelet-transform mel-spectrogram
Language:Python 16
monetjoe / pianos
This study converts piano recordings to mel spectrogram and classifies them by SOTA pre-trained neural network backbones in CV. Comparative experiments show that SqueezeNet achieves a best classification accuracy of 92.37%.|该项目将钢琴录音转为为mel频谱图，使用微调后的前沿计算机视觉领域预训练深度学习骨干网络对其进行分类，对比实验可知SqueezeNet作为最优网络正确率可达92.37%
cnn-classification deep-learning mel-spectrogram piano
Language:Python 16
renesemela / masters-thesis-music-autotagging
Master's Thesis: Automatic Tagging of Musical Compositions Using Machine Learning Methods
auto-tagging automatic-tagging autotagging classification content-analysis convolutional-neural-network lastfm-dataset-2020 machine-learning magnatagatune-dataset mel-spectrogram melgram music music-information-retrieval neural-network recurrent-neural-network music-auto-tagging
Language:Python 16
goepfert / audio_features
Speech Recognition and Voice Activity Detection using a Convolutional Neural Network Architecture built with Tensorflow.js
speech-recognition voice-activity-detection mel-spectrogram machine-learning tensorflow speech-processing deep-learning audio tensorflowjs
Language:JavaScript 13
mariamkhmahran / gunshot-detection-system
This repository contains the Python code for a audio classification system designed to detect gunshots in urban settings.
audio-classification audio-processing cnn cnn-keras deep-learning feature-extraction librosa machine-learning mel-spectrogram python
Language:Jupyter Notebook 13
mikex86 / SonopyJava
Java Implementation of the Sonopy Audio Feature Extraction Library by MycroftAI
audio-feature-extraction mfcc-features mfcc-extractor mfcc-algorithm audio-processing mel-spectrogram powerspectrum discrete-cosine-transform dct dct2 fft fastfouriertransform rfft sonopy numpy scipy
Language:Java 13
baggepinnen / LPVSpectral.jl
Least-squares (sparse) spectral estimation and (sparse) LPV spectral decomposition.
spectrum least-squares spectrum-analyzer system-identification time-series-analysis periodogram frequencies spectrum-identification spectrogram lpv lomb-scargle-periodogram mel-spectrogram mfcc power-spectral-density
Language:Julia 12
KanikeSaiPrakash / Speech-Emotion-Recognition
Speech Emotion Recognition using Deep Learning
deep-leaning speech-emotion-recognition mel-spectrogram mel-frequency-cepstral-coefficients modified-gd-gram gd-gram
Language:Jupyter Notebook 11
ricardokleinklein / deepMultiSpeech
Deep Multi-Speech model
speech-enhancement voice-conversion mel-spectrogram wavenet vocoder pytorch speech
Language:Python 11
Rumeysakeskin / dtw-compare-audio-files
Compute the MFCCs and measure (dis)similarity between two audio files using DTW
audio-processing dtw mel-spectrogram mfcc
Language:Python 9
sh3r4zhassan / Sound-Prediction-and-Cancellation-Model
This Model analyzes and predicts the input sound and then using pretrained ANC systems cancels the input sound.
simulink active-noise-cancelling activenoisecancellation sound-classification mel-spectrogram sound-pressure-level python jupyter-notebook deep-neural-networks simulation
Language:Jupyter Notebook 9
amirragab-ds / Speech-Emotion-Recognition-in-Tensorflow-Using-CNNs
Speech Emotion Recognition (SER) in Tensorflow using CNNs and CRNNs Based on Mel Spectrograms and Mel Frequency Cepstral Coefficients (MFCCs)
crnn mel-cepstrum-coefficients mel-spectrogram mfcc speech-emotion-recognition cnn keras librosa python tensorflow
Language:Jupyter Notebook 8
RBGTOP / Music-Genre-Recognition
Music genre classification using deep learning
audio-analysis audio-classification audio-processing deep-learning genre-classification machine-learning mel-spectrogram mfcc music-analysis music-genre-recognition pattern-recognition
8
zafarrafii / Zaf-Julia
Zafar's Audio Functions in Julia for audio signal analysis: STFT, inverse STFT, CQT kernel, CQT spectrogram, CQT chromagram, MFCC, DCT, DST, MDCT, inverse MDCT.
julia stft inverse-stft mfcc cqt-kernel cqt-spectrogram dct dst mdct inverse-mdct chromagram short-time-fourier-transform mel-frequency-cepstral-coefficients discrete-cosine-transform discrete-sine-transform modified-discrete-cosine-transform constant-q-transform mel-filterbank mel-spectrogram audio-signal-processing
Language:Jupyter Notebook 8
anirudhs123 / Music-Instrument-Classification
In this project we use a Lightweight-CNN based model to classify instruments from the Freesound audio data set. We make use of Mel-Spectrogram features from the input audio data as the input to the CNN model. To add robustness to the model, we use a novel data augmentation technique based on the Cut-Mix algorithm.
class-activation-maps cnn cutmix-augmentation hyperparameter-tuning mel-spectrogram pruning
Language:Jupyter Notebook 7
cschen1205 / cs-mel-spectrogram
Convert audio file to melgram (that is, mel-spectrogram) in .NET
melgram mel-spectrograms mel-spectrogram
Language:C# 7
SimpleKidd / Fault-Diagnosis-of-a-Rotor-Bearing-System-using-ML
Analyzing Vibrational Data of the System using Machine Learning
mel-spectrogram machine-learning python
Language:Jupyter Notebook 6
awal-ahmed / AudioViT
This repository contains different CNN methods for audio classification. It starts with canceling noise from audio. Then it converts the audio into a mel-spectrogram and trains with CNN models.
cnn deep-learning mel-spectrogram noise-reduction signal-processing tensorflow2
Language:Python 5

mel-spectrogram

Sharad24 / Neural-Voice-Cloning-with-Few-Samples

BShakhovsky / PolyphonicPianoTranscription

tiberiu44 / TTS-Cube

Data-Science-kosta / Speech-Emotion-Classification-with-PyTorch

spotify / realbook

CVxTz / audio_classification

MycroftAI / sonopy

echocatzh / torch-mfcc

zzw922cn / LPC_for_TTS

rednafi / urban-sound-classification

zafarrafii / Zaf-Python

zafarrafii / Zaf-Matlab

skanderhamdi / attention_cnn_lstm_covid_mel_spectrogram

Friedrich-M / Audio-signal-classification-and-identification

adasegroup / OSM-one-shot-multispeaker

ddman1101 / EDM-subgenre-classifier

yoyolicoris / wavenet-like-vocoder

VisionBrain / Neural_Voice_Cloning

Keerthiraj-Nagaraj / cough-detection-with-transfer-learning

monetjoe / pianos

renesemela / masters-thesis-music-autotagging

goepfert / audio_features

mariamkhmahran / gunshot-detection-system

mikex86 / SonopyJava

baggepinnen / LPVSpectral.jl

KanikeSaiPrakash / Speech-Emotion-Recognition

ricardokleinklein / deepMultiSpeech

Rumeysakeskin / dtw-compare-audio-files

sh3r4zhassan / Sound-Prediction-and-Cancellation-Model

amirragab-ds / Speech-Emotion-Recognition-in-Tensorflow-Using-CNNs

RBGTOP / Music-Genre-Recognition

zafarrafii / Zaf-Julia

anirudhs123 / Music-Instrument-Classification

cschen1205 / cs-mel-spectrogram

SimpleKidd / Fault-Diagnosis-of-a-Rotor-Bearing-System-using-ML

awal-ahmed / AudioViT