r9y9 / jvs_r9y9

JVS (Japanese versatile speech) コーパスの自作のラベル

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

jvs_hiho

JVS (Japanese versatile speech) コーパスの、@Hiroshiba作のラベルです。

aligned_labels_openjtalk

JVSコーパスのpalallel100(話者間で共通する読み上げ音声100発話)を、読み仮名を音声に合うように修正した上で、Juliusによる自動アライメントを行った音素系列ラベルです。

詳細

音声に関して

@Hiroshibaが見つけた音声の間違いをもとに、一部の音声ファイルを修正・削除しています。 実行コードはaudio.bashです。

テキストに関して

voiceactoress100_spaced_julius.txtがテキストです。

JVSコーパス内にある日本語テキストを元に、以下の修正を加えました。

  • カタカナ表記にする
  • 読み仮名を音声に合わせる
  • 句読点の位置を音声に合わせ、スペースにする

これらの修正を加えたテキストがvoiceactoress100_spaced.txtです。

この修正に加えて、更に以下の修正を加えました。

  • 珍しい読みのツュヴュを、チュビュに変える

この修正を加えたテキストがvoiceactoress100_spaced_julius.txtです。

Julius音素系列ラベルに関して

aligned_labels_juliusがJulius音素系列ラベルです。

テキストvoiceactoress100_spaced_julius.txtを音素系列にし、Juliusのmonophone音素モデルを用いて音素をアライメントしました。 この際、ショートポーズspの有無もJuliusで推定しました。

実行コードはphoneme.bashです。

OpenJTalk音素系列ラベルに関して

aligned_labels_openjtalkがOpenJTalk音素系列ラベルです。

Julius音素系列をOpenJTalk用に変更しました。 OpenJTalk label getterを用いてOpenJTalk用の音素を取得し、一部を修正しました。 変更後の音素がvoiceactoress100_phoneme_openjtalkです。

その後、音素をJulius用のものに変換し、Juliusのmonophone音素モデルを用いて音素をアライメントしました。

実行コードはphoneme.bashです。

ライセンス

使用ライブラリに関して

Julius Open JTalk

テキスト・音素系列ラベルに関して

CC BY-SA 4.0(声優統計コーパスの音素バランス文のライセンスを継承しています)

実行コード(Bashスクリプト)に関して

MIT LICENSE

About

JVS (Japanese versatile speech) コーパスの自作のラベル


Languages

Language:Shell 100.0%