Eric Dataset 是一個用來測試用的 dataset 主要目的是建立 unit + MFA + tokenization 的 pipeline 最後形成 unit words (uncoll & coll)
audiopaths.tsv 維持 header row = root (當標題) 好直接用 fairseq 然後還是要假的 sample lengths
Eric Dataset 是一個用來測試用的 dataset 主要目的是建立 unit + MFA + tokenization 的 pipeline 最後形成 unit words (uncoll & coll)
audiopaths.tsv 維持 header row = root (當標題) 好直接用 fairseq 然後還是要假的 sample lengths