音声分析アプリ

概要

このアプリは音声を分析して声の「可愛さ」や「ダンディさ」を数値化するアプリです。 C91にて発売した「KCS Tips」の「音声分析アプリの作成」の記事で紹介しています。なお、このコードではデータが省略されているため、このままでは動きません。再現する場合は、コメントの指示に従い各自で音声データを用意してください。

僕のブログにも詳細が書いてあります。

環境

括弧内は僕が使ったバージョンです。

Mac OS X(10.11.6)

他のOSで使えないものは使っていないと思いますが、SPTK（後述）はUNIX環境用なのでWindowsではCygwinなどが必要です。

Python(3.5)

以下は標準ライブラリ以外で使ったものです。

matplotlib(1.7)
- グラフを描画するライブラリです。スコアの出力に使いました。
PyAudio (0.2.9)
- PortAudioという音声ライブラリをPythonで使えるライブラリです。録音に使いました。インストール方法は公式サイトを参照してください。
scikit-learn (0.18)
- 機械学習ライブラリです。GMM（後述）の学習に使いました。

Speech Signal Processing ToolKit(3.9)

SPTK。 UNIX環境用の音声信号処理ツールです。 MFCC（後述）の抽出等に使いました。 Pythonからシェル経由でコマンドを実行して使っています。

ryokamoi / voice_analysis_app

音声分析アプリ

概要

環境

Mac OS X(10.11.6)

Python(3.5)

Speech Signal Processing ToolKit(3.9)

出力例

About

Languages