azisio / Speech2text2VOICEVOX

音声認識でテキスト化したあとずんだもんとかに喋らせる(遅延すごい)

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

マイク入力でずんだもんに喋らせる

動作概要

音声認識でテキスト化したあとずんだもんとかに喋らせる(遅延すごい)

マイク入力
↓
SpeechRecognition(Googleの音声認識)
↓
VOICEVOX ENGINEにリクエスト投げる
↓
WAVファイルを作ってもらう
↓
WAVファイルを再生(デバイス指定して)

必要動作環境

必須

  • Python 3.9.6
  • VOICEVOX Ver0.13.2 (GPU)

便利

  • VoiceMeeter Banana(仮想オーディオデバイス&ミキサー的な)
    • Discordとかでずんだもんに喋らせたいときに使える

変更必要箇所

入力/出力デバイスIDは環境依存
未指定の場合はWindowsの規定のデバイスが使用される

speech_to_voicevox.py 14行目

mic  = sr.Microphone(X)

speech_to_voicevox.py 36行目

sd.default.device = X

About

音声認識でテキスト化したあとずんだもんとかに喋らせる(遅延すごい)


Languages

Language:Python 100.0%