SutirthaChakraborty

followers

following

stars

PhD

Maynooth

http://musictech.cs.nuim.ie/sutirtha.html

Sutirtha Chakraborty's repositories

ActiveNoiseCancellation

Language:Python200

python-audio-separator

Easy to use vocal separation on CLI or as a python package, using the amazing MDX-Net models from UVR trained by @Anjok07

Language:PythonMIT100

RTFS-Net

Official code release for "RTFS-Net: Recurrent time-frequency modelling for efficient audio-visual speech separation", accepted ICLR 2024

Language:PythonMIT100

AICoverGen

A WebUI to create song covers with any RVC v2 trained AI voice from YouTube videos or audio files.

Language:PythonMIT000

av-se

Deep-Learning-Based Audio-Visual Speech Enhancement and Separation

000

Banging-interaction

Banging interaction: A ubimus-design strategy for the musical internet

Language:Python000

BlurFaceRealtime

Real time Face Blurring for multiple people

Language:Python000

ComputerVision

000

doctr

docTR (Document Text Recognition) - a seamless, high-performing & accessible library for OCR-related tasks powered by Deep Learning.

Apache-2.0000

Funny-Application

This is a repository to try out funny things.

Language:Python000

GFPGAN

GFPGAN aims at developing Practical Algorithms for Real-world Face Restoration.

NOASSERTION000

Hackathon_mashup

Language:Jupyter NotebookMIT000

lightning-hydra-template

PyTorch Lightning + Hydra. A very user-friendly template for rapid and reproducible ML experimentation with best practices. ⚡🔥⚡

000

mediapipe_face_align

Language:Python000

Melody-extraction-with-melodic-segnet

The source code of "A Streamlined Encoder/Decoder Architecture for Melody Extraction"

Language:Python000

mind-vis

Code base for MinD-Vis

MIT000

Multimodal-Synchronization-in-Musical-Ensembles

Investigating Audio and Visual Cues

Language:Python000

Music-Source-Separation-Training

Repository for training models for music source separation.

Language:Python000

musicinformationretrieval.com

Instructional notebooks on music information retrieval.

MIT000

Official

Language:SCSSApache-2.0000

PaddleDetection

Object Detection toolkit based on PaddlePaddle. It supports object detection, instance segmentation, multiple object tracking and real-time multi-person keypoint detection.

Apache-2.0000

speech_separation

Language:Jupyter NotebookMIT000

stable-ts

Transcription, forced alignment, and audio indexing with OpenAI's Whisper

MIT000

SutirthaChakraborty

My CV website

Apache-2.0000

Sync_Drum

Language:Python000

TEST

Language:Python010

viralme

Language:HTML000

VirtualConductor

首届国际“远见杯”元智能数据挑战大赛——动作认知赛道比赛数据

Language:Python000

Visual_Speech_Recognition_for_Multiple_Languages

Visual Speech Recognition for Multiple Languages

NOASSERTION000

Whisper_Audio_text

Language:Jupyter Notebook010