yeyupiaoling / VoiceprintRecognition-Tensorflow

使用Tensorflow实现声纹识别

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

转换为二进制文件,特别占内存

wenku1992abc opened this issue · comments

image
请问下训练集10M转换为二进制TFrecord就变成6G多了
为什么二进制文件那么大啊?内存都有可能不够了
训练大数据的梦想也变得奢侈了~
大数据train.txt有100M,这样算下来需要600G的二进制文件存储内存!

@wenku1992abc 麻烦你看下代码吧

@wenku1992abc 麻烦你看下代码吧

嗯嗯,有看代码,就是提取了wav特征转换为二进制嘛,还有就是不够的补0

不好意思哈~