ryokamoi / voice_analysis_app

Voice analysis application with GMM

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

音声分析アプリ

概要

このアプリは音声を分析して声の「可愛さ」や「ダンディさ」を数値化するアプリです。 C91にて発売した「KCS Tips」の「音声分析アプリの作成」の記事で紹介しています。 なお、このコードではデータが省略されているため、このままでは動きません。 再現する場合は、 コメントの指示に従い各自で音声データを用意してください。

僕のブログにも詳細が書いてあります。

環境

括弧内は僕が使ったバージョンです。

Mac OS X(10.11.6)

他のOSで使えないものは使っていないと思いますが、SPTK(後述)はUNIX環境用なのでWindowsではCygwinなどが必要です。

Python(3.5)

以下は標準ライブラリ以外で使ったものです。

  • matplotlib(1.7)

    • グラフを描画するライブラリです。スコアの出力に使いました。
  • PyAudio (0.2.9)

    • PortAudioという音声ライブラリをPythonで使えるライブラリです。録音に使いました。インストール方法は公式サイトを参照してください。
  • scikit-learn (0.18)

    • 機械学習ライブラリです。GMM(後述)の学習に使いました。

Speech Signal Processing ToolKit(3.9)

SPTK。 UNIX環境用の音声信号処理ツールです。 MFCC(後述)の抽出等に使いました。 Pythonからシェル経由でコマンドを実行して使っています。

出力例

出力例

About

Voice analysis application with GMM


Languages

Language:Python 100.0%