音源から自動文字起こし

取材時に録音した音声を文字に書き起こす作業を

少しでも自動化してラクしたい!

というわけで、1年ほど前から

Googleドキュメントを使って「自動文字起こし」をしています。


その時の記事がこちら。

「Googleドキュメントで音声を自動文字起こししてみた」


ただ、この方法だと自分でずっとパソコンを操作しなければならず

それはそれでけっこう面倒でした。


また、最近はオンライン会議が多くなったので

ICレコーダーでは録音精度が悪くなって使えないこともあり

より良い方法がないか、探していました。


TextaやNottaなど

オンライン会議と連動させられる自動文字起こしアプリも試してみたけど

私のやり方が悪かったのか、精度がイマイチな印象。


というわけで、下記の方法を取り入れてみました。

「寝てる間にテキスト化!?

Googleドキュメントで取材音源を自動で文字起こしをする方法」


これだと、確かに前のような張り付いての操作がいらず

ずっとラクにはなるけど

寝てる間にテキスト化ができるかとういと、それはやはり無理でした。


なぜかというと、話し方が早かったり聞き取りにくい状態が続くと

以下のような表示が出て

Googleドキュメントが止まってしまうから。


Googleドキュメント 音声入力

ちなみに写真は、表示がよく見えるように

ディスプレイを上に向けて、横から角度をつけて撮影しています。


Googleドキュメントが止まると同時に音声も止まるならば

そこからやり直せばいいのだけど

この方法は音声は止まらないので、どこからやり直すのか探すのが大変。


なので、やはりずっと横に張り付き

Googleドキュメントが止まったら音声を止め

再び両方を起動させるという作業が必要です。


それでも、前回の方法より大幅に手間がかからないのは確か。

さらに、オンライン会議の録画データを使えば

ICレコーダーより文字起こし精度が

格段に良くなるのこともわかりました。


とはいえ、例えば

苦しさがあると思います → クリスさんがあると思います

それが当たり前 → 俺が当たり前

啓発する → 警察する

など、ちょいちょいビミョーな間違いをぶっ込んでくるので

最終的には自分で仕上げの文字起こしをやる必要があります。


なので、全体的な時間は

自分で全て文字起こしするのとあまり変わらないかなあ。


まあ、これ以上を望むなら

有料のサービスやソフトを使えってことですね。


私は、手間が大幅にラクになる点を買って

しばらくはこれを利用してみようと思います。