nadare881 / voice-changer-vector-search

This is a repository for comparing voice changer results and searching datasets and trained models.

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

voice-changer-vector-search (Ver 0.1.2)

本リポジトリはボイスチェンジャーの変換結果を比較し、類似した音声のデータセットや学習済みモデルを検索するためのリポジトリです。

現在はα版で、今後データベースの列名等は追加・削除する可能性があります。。

概要

本リポジトリでは音声変換モデル、及び音声変換の学習に用いてよい音声データの収集を行います。 話者情報をembeddingに変換し、メタ情報と共に管理することで音声のベクトル検索をサポートします。

changelog

ver 0.1.2

登録しているデータ一覧をhtmlで見れるようにしました。 下記のページよりhtml形式の表で確認することができます。 https://nadare881.github.io/voice-changer-vector-search/data/meta_display.html

ver 0.1.1

VOICEVOXSHAREVOXの読み上げ音声のデータを追加しました。 機械学習に用いる際は必ず各ソフトウェアおよび各キャラクターの規約を確認してください。

ver 0.1.0

α版を公開しました。許諾不要・許諾確認済みのITAコーパスから得た収集と検索のデモを用意しました。

notebook/search_similar_voice.ipynbを実行すると音声to音声の検索が可能です。

以下のように音声の類似度を確認可能です。 image

ver 0.0.1

ver0.0.1では類似音声検索のPoCとしてJVSコーパスの話者分類、及びそのembeddingの分析結果を公開します。

こちらのnotebookを確認してください。

About

This is a repository for comparing voice changer results and searching datasets and trained models.

License:MIT License


Languages

Language:Jupyter Notebook 86.3%Language:HTML 13.7%