librosa

There are 8 repositories under librosa topic.

librosa
librosa / librosa
Python library for audio and music analysis
audio dsp librosa music python scipy
Language:Python 7985
x4nth055 / emotion-recognition-using-speech
Building and training Speech Emotion Recognizer that predicts human emotions using Python, Sci-kit learn and Keras
deep-learning emotion-detection emotion-recognition emotion-recognizer feature-extraction gradient-boosting keras kneighborsclassifier librosa machine-learning mfcc mlp-classifier neural-networks random-forest-classifier recurrent-neural-networks sklearn speech-emotion-recognition support-vector-machine
Language:Python 654
AudioMuse-AI
NeptuneHub / AudioMuse-AI
AudioMuse-AI is an Open Source Dockerized environment that brings automatic playlist generation to Jellyfin, Navidrome, LMS and Lyrion. Using powerful tools like Librosa and ONNX, it performs sonic analysis on your audio files locally, allowing you to curate the perfect playlist for any mood or occasion without relying on external APIs.
ai docker essentia essentia-tensorflow jellyfin jellyfin-docker jellyfin-plugin k3s kubernetes librosa llm navidrome ollama onnx open-source open-source-project open-sources-code-github playlist sonic-analysis tensorflow
Language:Python 560
Demfier / multimodal-speech-emotion-recognition
Lightweight and Interpretable ML Model for Speech Emotion Recognition and Ambiguity Resolution (trained on IEMOCAP dataset)
speech-emotion-recognition pytorch scikit-learn pandas librosa multimodal-emotion-recognition python3 iemocap lstm
Language:Jupyter Notebook 430
marcogdepinto / emotion-classification-from-audio-files
Understanding emotions from audio files using neural networks and multiple datasets.
deep-learning deep-neural-networks machine-learning keras keras-neural-networks audio audio-processing python python3 tensorflow emotion-classification-ravdess speech emotion song livingstone classification-report ravdess-dataset songs librosa datascience
Language:Python 422
danyalimran93 / Music-Emotion-Recognition
A Machine Learning Approach of Emotional Model
data-science digital-signal-processing feature-extraction feature-scaling feature-selection librosa machine-learning music-information-retrieval
Language:Python 244
scherroman / mugen
A command-line music video generator based on rhythm
music-video amv montage remix moviepy librosa tesseract python rhythm mugen video audio command-line
Language:Python 239
KAIST-MACLab / PyTSMod
An open-source Python library for audio time-scale modification.
audio dsp librosa music numpy python scipy time-scale tsm
Language:Python 225
ewan-xu / LibrosaCpp
LibrosaCpp is a c++ implemention of librosa to compute short-time fourier transform coefficients,mel spectrogram or mfcc
eigen librosa mfcc
Language:C++ 222
spotify / realbook
Easier audio-based machine learning with TensorFlow.
audio cqt librosa machine-learning mel-spectrogram spectrograms stft tensorflow
Language:Python 127
SpeechEmotionRecognition_Realtime
MeidanGR / SpeechEmotionRecognition_Realtime
Speech Emotion Recognition (SER) in real-time, using Deep Neural Networks (DNN) of Long Short Memory Term (LSTM).
python pandas keras lstm librosa deep-learning algorithm
Language:Jupyter Notebook 113
tiagoft / audio_to_midi
(monophonic) audio to midi converter using Python and librosa
midi-files midi-converters librosa audio music
Language:Python 110
Super-Badmen-Viper / NineSong
NineSong aims to provide Cloud native and AI extended solutions for data sharing in various ToC businesses
emby jellyfin librosa media-server navidrome plex server subsonic xiaomi-smart-home ninesong nsmusics
Language:Go 108
qlemaire22 / speech-music-detection
Python framework for Speech and Music Detection using Keras.
convolutional-lstm keras librosa lstm tcn
Language:Python 107
ankurbhatia24 / MULTIMODAL-EMOTION-RECOGNITION
Human Emotion Understanding using multimodal dataset.
deeplearning deep-learning machine-learning keras audio-visual audio-visualization audio-visual-speech-recognition python tensorflow multimodal-emotion-recognition librosa opensmile
Language:Jupyter Notebook 104
GianlucaPaolocci / Sound-classification-on-Raspberry-Pi-with-Tensorflow
In this project is presented a simple method to train an MLP neural network for audio signals. The trained model can be exported on a Raspberry Pi (2 or superior suggested) to classify audio signal registered with USB microphone
machine-learning multilayer-perceptron-network tensorflow tensorflow-models audio-analysis librosa raspberry dataset audio-signals raspberry-pi sound-classification
Language:Python 99
yeyupiaoling / AudioClassification-PaddlePaddle
基于PaddlePaddle实现的音频分类，支持EcapaTdnn、PANNS、TDNN、Res2Net、ResNetSE等各种模型，还有多种预处理方法
paddlepaddle librosa urbansound8k audio-classification ecapa-tdnn res2net tdnn panns resnet-se
Language:Python 98
Guan-JW / Melody-Note
一个简单的小网页，录入人声哼唱，转化成钢琴音及钢琴谱输出。灵感稍纵即逝，本项目的目标是能够记录下一段小调，以音频形式输入，读取识别其曲调，并制成谱子，最终以钢琴弹奏的形式输出，依此将一些日常生活中的小灵感保存起来，以便日后回忆甚至再创作。
audio django librosa lilypond midi python
Language:Python 84
dodiku / music-synthesis-with-python
Music Synthesis with Python talk, originally given at PyGotham 2017.
audio-analysis conference csound interactive lecture librosa mir music music-information-retrieval music-synthesis pyo python supercollider synthesis talk
Language:Jupyter Notebook 77
kristijanbartol / Deep-Music-Tagger
Music genre classification model using CRNN
music-information-retrieval fma mel-spectrograms convolutional-networks deep-learning recurrent-networks music-classification librosa keras deeplearning deep-neural-networks music music-analysis audio-analysis
Language:Python 70
environmental-sound-classification
mariostrbac / environmental-sound-classification
Environmental sound classification with Convolutional neural networks and the UrbanSound8K dataset.
environmental-sounds data-augmentation urbansound8k cross-validation sound-classification spectrograms librosa pytorch keras cnn-model
Language:Jupyter Notebook 70
Speech2Face
ravising-h / Speech2Face
Image Processing, Speech Processing, Encoder Decoder, Research Paper implementation
research-paper image-processing speech-processing encoder-decoder speech-to-face face-normalization keras-tensorflow librosa face-detection
Language:Jupyter Notebook 65
rohankrgupta / Orca-call-Classifier-Machine-learning
Advanced ML Project : An Orca Call classifier using mel-spectrograms as audio representations to detect Killer whales
advanced-machine-learning keras-tensorflow mel-spectrograms opencv feature librosa
Language:Jupyter Notebook 57
cetinsamet / music-genre-classification
Music genre classification from audio spectrograms using deep learning
music-genre-classification spectrogram convolutional-neural-networks pytorch multi-class-classification music music-genre-detection music-genre-recognition librosa
Language:Python 54
AmritK10 / Urban-Sound-Classification
Sound Classification using Neural Networks
sound-processing sound-classification urban-sound-classification neural-networks machine-learning librosa cnn-keras convolutional-neural-networks deep-learning
Language:Jupyter Notebook 50
audiomuse-ai-plugin
NeptuneHub / audiomuse-ai-plugin
Jellyfin plugin for AudioMuse-AI
audiomuse-ai essentia jellyfin jellyfin-plugin librosa tensorflow k3s llm ollama sonic-analysis instant-mix
Language:C# 50
abishek-as / Audio-Classification-Deep-Learning
We'll look into audio categorization using deep learning principles like Artificial Neural Networks (ANN), 1D Convolutional Neural Networks (CNN1D), and CNN2D in this repository. We undertake some basic data preprocessing and feature extraction on audio sources before developing models. As a result, the accuracy, training time, and prediction time of each model are compared. This is explained by model deployment, which allows users to load the desired sound output for each model that is successfully deployed, as will be addressed in more depth later.
audio audio-classification cnn convolutional-neural-networks deep-learning django keras librosa machine-learning neural-network python python3 wav
Language:Jupyter Notebook 48
Ztrimus / speech-emotion-recognition
Predicting various emotion in human speech signal by detecting different speech components affected by human emotion.
deep-learning neural-network librosa keras pytorch natural-language-processing convolutional-neural-networks python3 jupyter-notebook emotion-recognition supervised-learning colab-notebook lstm rnn audio-files data-science emotion-detection speech-emotion-recognition speech-recoginition voice
Language:Jupyter Notebook 47
bits-bytes-nn / sound-anomaly-detection-with-autoencoders
MIMII Sound Anomaly Detection with AutoEncoders
autoencoder variational-autoencoder tensorflow librosa matplotlib bokeh anomaly-detection sagemaker
Language:Jupyter Notebook 37
hernanrazo / human-voice-detection
Binary classification problem that aims to classify human voices from audio recordings. Implemented using PyTorch and Librosa.
pytorch voice-detection speech-processing deep-learning audio-classification librosa cnn-pytorch
Language:Python 36
danyalimran93 / Music-Genre-Classification
Classifying English Music (.mp3) files using Music Information Retrieval (MIR), Digital/Audio Signal Processing (DIP) and Machine Learning (ML) Strategies
audio-signal-processing librosa machine-learning music-genre music-information-retrieval
Language:HTML 34
xiaominfc / melspectrogram_cpp
C/C++实现Python音频处理库librosa中melspectrogram的计算过程
melspectrogram librosa
Language:C++ 31
adzialocha / tomomibot
Artificial intelligence bot for live voice improvisation
keras librosa machine-learning music
Language:Python 30
rudrajikadra / Speech-Emotion-Recognition-using-Librosa-library-and-MLPClassifier
In this project we use RAVDESS Dataset to classify Speech Emotion using Multi Layer Perceptron Classifier
ravdess-dataset python mlp-classifier speech-emotion-recognition librosa python-project
Language:Jupyter Notebook 28
LaoADe / music_point
100行代码实现简单音乐卡点
python librosa
Language:Python 27
albincorreya / ChromaCoverId
Methods to compute various chroma audio features and audio similarity measures particularly for the task of cover song identification
audio-processing audio-similarity-measures chroma cover-song-detection cover-song-identification essentia librosa music-information-retrieval
Language:Jupyter Notebook 26

librosa

librosa / librosa

x4nth055 / emotion-recognition-using-speech

NeptuneHub / AudioMuse-AI

Demfier / multimodal-speech-emotion-recognition

marcogdepinto / emotion-classification-from-audio-files

danyalimran93 / Music-Emotion-Recognition

scherroman / mugen

KAIST-MACLab / PyTSMod

ewan-xu / LibrosaCpp

spotify / realbook

MeidanGR / SpeechEmotionRecognition_Realtime

tiagoft / audio_to_midi

Super-Badmen-Viper / NineSong

qlemaire22 / speech-music-detection

ankurbhatia24 / MULTIMODAL-EMOTION-RECOGNITION

GianlucaPaolocci / Sound-classification-on-Raspberry-Pi-with-Tensorflow

yeyupiaoling / AudioClassification-PaddlePaddle

Guan-JW / Melody-Note

dodiku / music-synthesis-with-python

kristijanbartol / Deep-Music-Tagger

mariostrbac / environmental-sound-classification

ravising-h / Speech2Face

rohankrgupta / Orca-call-Classifier-Machine-learning

cetinsamet / music-genre-classification

AmritK10 / Urban-Sound-Classification

NeptuneHub / audiomuse-ai-plugin

abishek-as / Audio-Classification-Deep-Learning

Ztrimus / speech-emotion-recognition

bits-bytes-nn / sound-anomaly-detection-with-autoencoders

hernanrazo / human-voice-detection

danyalimran93 / Music-Genre-Classification

xiaominfc / melspectrogram_cpp

adzialocha / tomomibot

rudrajikadra / Speech-Emotion-Recognition-using-Librosa-library-and-MLPClassifier

LaoADe / music_point

albincorreya / ChromaCoverId