liutaocode

Tao Liu's repositories

Automatically Update Text-to-speech (TTS) Papers Daily using Github Actions (Update Every 12th hours)

Language:PythonApache-2.053 90

Preprocessing Scipts for Talking Face Generation

Language:Python39 40

🎓 Update Talking-Face Research Papers Daily, Now Integrated with LLM Analysis.

Language:PythonApache-2.028 50

Both audio-only and audio-visual speaker diarization datasets are listed here.

Language:HTML6 7 1

Diarization Metric in One: current support DER, JER, CDER, SER, and BER

Language:Python5 10

Visualization tools for audio-only and multi-modal speaker diarization dataset

Language:HTML4 10

MultiModal Tokenizer Resources

Balanced Error Rate for Speaker Diarization

Language:Python100

🤗 Diffusers: State-of-the-art diffusion models for image and audio generation in PyTorch

Language:PythonApache-2.0100

Detailed information for diarization metric: dscore, including errors in overlapped part.

Language:PythonBSD-2-Clause100

A PyTorch implementation of End-to-End Neural Diarization

Language:PythonMIT100

Multi-modal Speech Dataset