jeffeuxMartin / PipelineBuild

Eric Dataset 是一個用來測試用的 dataset 主要目的是建立 unit + MFA + tokenization 的 pipeline 最後形成 unit words (uncoll & coll)

audiopaths.tsv 維持 header row = root (當標題) 好直接用 fairseq 然後還是要假的 sample lengths

About

Language:Shell 99.9%Language:Python 0.1%