このアプリは音声を分析して声の「可愛さ」や「ダンディさ」を数値化するアプリです。 C91にて発売した「KCS Tips」の「音声分析アプリの作成」の記事で紹介しています。 なお、このコードではデータが省略されているため、このままでは動きません。 再現する場合は、 コメントの指示に従い各自で音声データを用意してください。
僕のブログにも詳細が書いてあります。
括弧内は僕が使ったバージョンです。
他のOSで使えないものは使っていないと思いますが、SPTK(後述)はUNIX環境用なのでWindowsではCygwinなどが必要です。
以下は標準ライブラリ以外で使ったものです。
-
matplotlib(1.7)
- グラフを描画するライブラリです。スコアの出力に使いました。
-
PyAudio (0.2.9)
- PortAudioという音声ライブラリをPythonで使えるライブラリです。録音に使いました。インストール方法は公式サイトを参照してください。
-
scikit-learn (0.18)
- 機械学習ライブラリです。GMM(後述)の学習に使いました。
SPTK。 UNIX環境用の音声信号処理ツールです。 MFCC(後述)の抽出等に使いました。 Pythonからシェル経由でコマンドを実行して使っています。