sato-susumu / susumu_ai_dialogue_system

AI dialogue system

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

susumu ai dialogue system

特徴動作環境実行方法使い方カスタマイズ対応モジュールPythonで動かす

特徴

susumu_ai_dialogue_system は音声認識や音声合成のモジュールを入れ替えて実行できるAI音声対話/AI VTuberシステムです。各モジュールの切り替えは設定画面でワンクリックで行えます。

AI VTuber

AI VTuberを作るために必要ないくつかの機能をプログラミング不要で実現します。YouTubeライブ配信のコメント取得、 OBS を使った字幕更新をサポート。


動作環境

Windows 11のみ
Windowsに依存しない形で作っていますが、他の環境では動作確認ができていません。


実行方法

リリースページにある susumu_ai_dialogue_system_x.x.x.zipをダウンロードします。
ダウンロードしたzipを解凍し、 susumu_ai_dialogue_system.exeを実行します。


使い方

クイックスタート

OpenAI API Key を取得し、設定画面で設定すれば、まずは最低限の音声対話が動作します。


OpenAI API Keyを設定する

susumu_ai_dialogue_system.exe を起動すると、設定 ボタンがあるのでクリックします。 OpenAI API Key を入力し、保存して閉じるをクリックすればAPI Keyの設定は完了です。


音声対話を使ってみる

OpenAI API Key を設定すれば、あとは初期設定で音声対話を試すことができます。起動ボタンを押せば、音声対話が開始します。音声認識結果や ChatGPT からの応答はコンソール画面に表示されます。


音声認識や音声合成をリッチにする

設定画面の 共通設定 タブで、どの音声認識や音声合成を使うか選択できます。使う機能によっては別のタブで設定を行ったり、別のアプリの起動が必要になる事もあります。


AI VTuberを動かす

susumu_ai_dialogue_system を使えば、プログラミングを行わなくてもAI VTuber(絵や3Dキャラクターを除く)を動かすことができます。 AI VTuberとして動かすためには次のステップを踏むだけ、、、ですが、正直なところ、初めてだと敷居がとても高いです。

  • Google Cloud PlatformAPI Key を発行し、設定画面で YouTubeコメント取得 に必要な設定を行う
  • OBS Studio をインストールし、字幕表示に必要な設定を行う
  • 設定画面の 共通設定 タブで、「ベース機能」はAI VTuber、「入力」は YouTubeコメント取得 、「その他」は OBS出力 をONにする

なお、susumu_ai_dialogue_systemには絵や3Dキャラクターを動かす機能はないため、 VMagicMirrorなどで別のアプリで3Dキャラクターなどを動かす必要があります。


カスタマイズ

簡単なカスタマイズ

ChatGPT 使用時は、設定画面の AI設定 タブで、プロンプトの内容を変更し、AIの性格や口調を変更できます。 プログラムの挙動も含めてカスタマイズするためには、Pythonを使って susumu_ai_dialogue_systemのソースコードを直接動かす必要があります。


対応モジュール

オプション

カテゴリ モジュール 条件
チャット ChatGPT APIキーが必要
音声認識 Googleストリーミング音声認識 GCP認証か、APIキーが必要
音声認識 SpeechRecognition(Google)
音声認識 標準入力を使った
擬似的な音声認識モジュール
音声認識 YouTubeコメント取得による
擬似的な音声認識モジュール
音声合成 VOICEVOX VOICEVOXサーバーまたはアプリの起動が必要
音声合成 Google音声合成 GCP認証か、APIキーが必要
音声合成 pyttsx3
音声合成 gTTS
翻訳 Googletrans
翻訳 DeepL API API認証キーが必要
オプション OBS連携 OBS Studioの起動と設定が必要
オプション 感情解析 感情解析サーバーが必要
オプション VMagicMirror連携 詳細説明

Pythonで動かす

PythonやGitの知識があれば、次の方法で動かすことができます。 Pythonの動作確認バージョンは3.10です。

git clone https://github.com/sato-susumu/susumu_ai_dialogue_system.git
cd susumu_ai_dialogue_system
pip install -r requirements.txt
python main.py

Windows環境でビルドするためには、事前にMicrosoft C++ Build Tools のインストールが必要です。

About

AI dialogue system

License:MIT License


Languages

Language:Python 99.4%Language:Batchfile 0.6%