iPhoneと音声認識アプリでテープ起こしの真似事をテスト。

iPhoneと音声認識を使ってテープ起こし

年明け早々、簡単なインタビューとその内容の文字起こしを含むコンサル業務の依頼があり、いわゆる「テープ起こし」についてのあれこれを模索。。

「音声のテキスト化」ですぐに思いついたのが、精度の高い音声認識アプリ「Dragon Dictation」。

ちょっとした音声メモなら直接iPhoneとこのアプリを使ってテキスト化すればいいのですが、録音機能が無いので今回のような案件では無理。

ということで、まずは静かな場所でボイスレコーダーにて録音。それを後でDragon Dictationを介してテキスト化出来ないかと。。

なにはともあれ、早速テスト。

外付けマイクを装着したiPhoneでボイスレコーダーを音声認識

一応、口述筆記で愛用しているナカバヤシのコンデンサーマイクをiPhoneに装着、ボイスレコーダーの音声をDragon Dictationで取り込みテスト。

低価格ながら意外と高性能、iPhone用外付けマイクIPMC-01AL

単なるアイデアメモ等なら不要ですが、長い会話などでは再生速度を下げた方が認識精度が高まる感じ。

ボイスレコーダーの再生速度を下げる

あくまでも周りの雑音やBGMなどが無い前提ですが、当然のごとく、ボイスレコーダーからの音声テキスト化は成功。。

音声認識の結果。

当たり前ですが、句読点は音声で「てん、まる」などと発声しない限りテキスト化されず、インタビューでは無理なので、後で誤字脱字とともに修正。

まあ、思うようにうまく行かなかった場合や複数人相手の場合の「テープ起こし」は、無料の「音声書き起こしクラウドエディタ」ToScribeを使えばいいわけで。。

詳しい使い方はコチラ

toscribe

ちなみに、あらかじめToScribeを使う前提で会話を録音する場合は、iPhoneでRelationalVoiceRecorderを利用して行えば、音声ファイルをDropboxに直接保存出来るので、楽です。

音声データをDropboxに保存できるRelationalVoiceRecorder

ただし、ToScribeで扱えるファイル形式がWAVかmp3のみなので、アプリの「設定」で「可能であればAAC形式で録音する」をオフにするか、AAC形式で録音したファイル(m4a形式)をmp3に変換する必要があります。

AAC形式をオフにする

なんかこうやって書いているうちに、一芸に秀でた人物をインタビューして電子書籍でも作ってみたくナリました^^;。

もう一度、プロライターの必携本「調べる技術・書く技術でも読み直してみますかね。。

調べる技術・書く技術

RelationalVoiceRecorder

RelationalVoiceRecorder
400円
(2014.01.05時点)
ICT Fractal Inc.
posted with ポチレバ