Macの「音声入力と読み上げ」でスピーチ解析する方法(7/24追記)

今、ある起業家のインタビュー映像を編集しているのですが、
そのインタビューがとにかく長い!笑


音声は思考の流れを把握できますが、内容を俯瞰することはできません。
内容を一度に把握するのに適したメディアは「文章」です。
そのため、音声を文字起こしすることにしました。


僕が現在使っている映像編集ソフトAdobe Premiereには、
2014年版まで「スピーチ解析」という機能がありました。
音声を自動的に文字起こししてくれる機能です。
しかし、ユーザーからの評判が悪く、2015年版で削除されたようです。


Adobe Premiere Pro ヘルプ | スピーチ分析


Premiereのスピーチ解析を使用するためには、
旧いバージョンをインストールしなければいけませんが、
最新バージョンと同居させると不具合が起きそうで嫌な感じです。
Adobe製品のインストールにはこれまで何かと泣かされてきたので。。。


そこで、Macに標準搭載されている「音声入力と読み上げ」機能を使えば
同じことができるんじゃね、と思いついたのでやってみました。
「音声入力と読み上げ」とは、簡単に言えばMac版のSiriです。
マイクで入力した音声に従って、コマンド操作やテキスト入力ができます。
この機能で、インタビュー音声をテキストにしてしまいたい!
基本的なやり方は下の記事を参考にしました。


Mac ハンドブック:音声入力 - Apple サポート


しかし、このままでは内蔵マイクの音声しか拾えず、映像の音声をクリアに認識できません。
PCで再生した音声を直接PCに読み込ませてやる必要があるのです。
そのため、フリーソフトの仮想オーディオデバイス「Soundflower」と、
同じくフリーソフトのサウンドミキサー「LadioCast」を使用して、
モニタリングしながら内部音声を直接PCに読み込ませることにしました。
PC画面をキャプチャして実況動画を撮る人たちにはお馴染みのソフトです。
インストール方法や使い方は下リンクを参考にしました。


OS X El CapitanにてSound flower復活!誰でも判るやり方を紹介。(動画)
QuickTimeで実況動画や画面キャプチャ(音あり)を収録する方法


ソフトの準備が整ったところで、いよいよスピーチ解析開始です。
「システム環境設定」→「サウンド」で入力と出力を「Soundflower(2ch)」にします。
そして、「音声入力と読み上げ」でも入力を「Soundflower(2ch)」に設定します。
さらに、「システム環境設定」→「アクセシビリティ」→「音声入力」で、
「音声入力中にオーディオ出力を消音」をオフにします。
デフォルトではオンになっていて、音声入力を開始した途端、画面上の音声を拾ってくれなくなります。
この方法はどこにも載っていなかったので、編み出すまでに小一時間ほど試行錯誤しました。
あとは、インタビュー映像を再生して、テキストエディットで音声入力を開始します。
すると、目の前で画面にテキストが打ち込まれていきます!

が、気になるその精度はというと・・・

ガビーン!なんじゃこりゃ〜〜〜
バグったファミコンみたいになってしまいました。
この後も色々試しましたが、結局このレベルのままでした。
当たり前ですが、ゆっくり、はっきり話さないと音声入力は認識してくれないようです。
さらに、音声入力はものすごく容量を食うらしく、HDDが一気に10GBくらい減りました。
謎のキャッシュを作りまくっているようです。


結論:現時点では手打ちの方が圧倒的に早い。


あと数年も経てば状況は変わるんでしょうかね。
開発者の皆さん、応援しています!



(2016.6.7追記)
音声認識アプリで超おすすめなものを見つけました!
iPhoneアプリ「音声認識メールクラウド」です。
iPhone標準の音声入力機能だと、ずっと音声入力することができません。
それがこのアプリは、ずっと電池が切れるまで録音できます!
スピーチ解析するにしても、スピーカーから流れる音声をiPhoneで音声認識したほうが効率いいです。
現時点で120円です。
他の音声認識アプリの値段に比べて、超格安です!
お仕事の効率アップにぜひ^^


(2016.7.24追記)

テレビ業界の裏側と家族愛を描いたノンフィクション小説を出版しました。

僕の助監督&ドキュメンタリーディレクター時代の話を書きました。
おかげさまで、Kindleランキングのエンターテイメント部門で4位を獲得しました。
期間限定で、この電子書籍をブログ読者さんに無料プレゼントしています!
お申し込みはこちら


ZOOMY

ビデオグラファー&フォトグラファー/個人による個人のための映像を作りたい。そんな想いからZOOMY VIDEO はスタートしました。TV・映画に代表される「大量消費型」映像ではなく、あなただけのオーダーメイド映像を、ZOOMYこと吉栖正明が1本1本まごころこめて制作します。twitter→@zoomy_aki


今しか撮影できない赤ちゃんの姿を、プロのムービーで残しませんか?ご自宅で撮影できますので、生後間もない赤ちゃんや、育児に追われるご両親も安心して撮影に臨めます。



ファミリームービーとは、家族が主役のドキュメンタリーです。お子様へ、そしてご家族へ、普段は言えない大切な感謝の気持ちを伝えませんか?プロのクリエイターが、一生の宝物となる映像を作ります。



あなたの情熱大陸を作りませんか?ピアノ教室・英語塾など、個人教室を応援するプロモーション映像制作サービスです。YouTubeを使った集客方法やコツ・アイデアを、初心者にもわかりやすくご指導します。



0コメント

  • 1000 / 1000