kiyodori / cloud_speech_to_text

Google Cloud Speech-to-text を使用しての動画フィルの文字起こし

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

これは何?

動画ファイルを文字起こしする

  • 発話内容を文字に起こす
  • 話者を区別する

どう使うの?

1. 事前準備

必要なライブラリをインストールする。

$ brew install ffmpeg sox
$ gem install dotenv

# gsutilのインストール
$ curl https://sdk.cloud.google.com | bash
$ exec -l $SHELL
$ gcloud init

gcloud initのところで、プロジェクト作ったりごにょごにょする

Google Cloud Platform の Google Cloud Storage でバケット作成する。

  • 個別のオブジェクトが権限を設定できるようにして、バケットを作成する
  • 合わせてRakefileを編集して、アップロードするバケット先を変更する

Google Cloud Platform のAPIとサービスからAPIキーを作成する。

  • 合わせて.envファイルを.evn_sampleファイルを元に作成してAPIキーを記載する

Google Cloud Platform の Cloud Speech-to-Text API を該当プロジェクトで有効にする。

2. movファイルをinput.MOVというファイル名でinput/ディレクトリ配下に設置

3. movファイルをflacファイルに変換

$ rake cloud_speech_to_text:encode

4. Google Cloud Storage にflacファイルをアップロード

$ rake cloud_speech_to_text:upload

5. 文字起こし

$ rake cloud_speech_to_text:request

About

Google Cloud Speech-to-text を使用しての動画フィルの文字起こし


Languages

Language:Ruby 100.0%