根据43位同学的训练语音,识别测试语音的说话者,即“Speaker Recognition”。
本项目数据在./data文件夹下,共43位同学的96条语音,文件名形如“201811580345-1-16K.wav”,“201811580345”是学号,“1”是第一条语音,“16K”是采样率
使用python+pytorch构建了三种模型,TDNN、LSTM、复合模型,识别效果越来越好。
requirements.txt
根据43位同学的训练语音,识别测试语音的说话者,即“Speaker Recognition”。
本项目数据在./data文件夹下,共43位同学的96条语音,文件名形如“201811580345-1-16K.wav”,“201811580345”是学号,“1”是第一条语音,“16K”是采样率
使用python+pytorch构建了三种模型,TDNN、LSTM、复合模型,识别效果越来越好。
requirements.txt
Apache License 2.0