文字起こしはどのくらい大変?

インタビュー記事の議事録作成や、会議の記録のためにたびたび必要になる音声の文字起こし。手作業で行う場合、非常に面倒で膨大な時間がかかってしまいます。例えば、1時間のインタビューの文字数を15000〜20000文字(平均17500文字)、1分で入力できる文字数:100〜200文字(平均150文字)とすると、単純計算でも1時間のインタビューの文字起こしを行うのに、約116分=約2時間かかることになります。

間違えると恥ずかしい文法ミスがゼロに
文章を入力するごとに、誰でもリアルタイムで文章のミスがチェックできます。
詳しく見る

面倒な文字起こしを少しでも楽にするには

文字起こしを楽にするために検討したいのが、無料の文字起こしソフトです。

ただ、2023年11月現在、文字起こしサービスが乱立しており、違いが分かりにくい状況です。そこで「多くのソフトやアプリがあるので、試したいけれどどれが一番正確に音声が認識されるのか分からない」「忙しいのでいちいち試している余裕がない」という方に向けて、数ある無料文字起こしソフトの中でどれが一番良さそうなのか、5つのサービスの調査を行いました。

特に議事録などのビジネス利用では、一定のセキュリティ基準を満たすことも重要になってきます。そのため、運営者が小規模な企業なサービスや、開発がストップしていると見受けられるようなサービスは対象から除外し、使い続けられるようなサービスのみに絞って検証しています。

方法としては、夏目漱石の「我輩は猫である」の冒頭の文章を約30cmの距離から早口で読み上げて解析させました。

読み上げたのは、以下の文章です。

吾輩(わがはい)は猫である。名前はまだ無い。どこで生れたかとんと見当(けんとう)がつかぬ。何でも薄暗いじめじめした所でニャーニャー泣いていた事だけは記憶している。吾輩はここで始めて人間というものを見た。しかもあとで聞くとそれは書生という人間中で一番獰悪(どうあく)な種族であったそうだ。

文字起こしアプリ・ソフト比較表

サービス名 総合評価 デバイス 発言者認識 セキュリティ
Microsoft Word ★★★ スマホ / PC ×
Google Docs ★★☆ スマホ / PC ×
CLOVA Note ★★☆ スマホ / PC
Notta ★★☆ スマホ / PC
ChatGPTアプリ ★☆☆ スマホ

【仕事でOfficeを使っているなら】「Microsoft Word」の文字起こし機能

Officeページ

「Microsoft Word」では、「ホーム」>「ディクテーション」からマイクボタンを押すだけで文字起こしをスタートすることができます。以前よりも大幅に機能が改善し、マイクでしっかりと音声を取得した音声であれば、かなり聞き取ってくれるようになりました。

※公式情報はWordで文書を音声入力するをご覧ください。

解析結果

吾輩は猫である名前はまだない。どこで生まれたかとんと見当がつかぬ。なんでも薄暗いじめじめとした所でニャーニャー泣いていたことだけは記憶している。吾輩はここで初めて人間というものを見た。しかもあとできくと、それは書生という人間で、中で一番どーわくな種族であったそうだ。

評価

総合評価
★★★

よい点

  • Microsoft Officeさえ入っていれば、誰でも無料で簡単に使用できる
  • クリックするだけで文字起こしされるので、操作に迷うことがない。
  • 回数や長さによる制限がない。
  • リアルタイムの文字起こしだけではなく、録音したファイル(wav、mp4、m4a、mp3形式に対応)からも文字起こしすることができる。(詳細は公式情報レコーディングの文字起こしをご覧ください)

悪い点

  • リアルタイムで文字起こしをしている最中に別の操作をすると、文字起こしが自動的にストップしてしまうことがある。
  • マイクに入らないような複数人の音声は聞き取ってくれない場合がある。
  • 発言者の認識ができない。
  • 録音ファイルからの文字起こしができるのは、Web用WordとWindows用Wordのみ。

【仕事でGoogleを使っているなら】「Google ドキュメント」の文字起こし機能

Googleページ

Googleドキュメントはグーグルが提供する無料のソフトウェアです。ネットにつながっていればどこでも利用することができて、自動文字起こし機能の回数や容量などの制限もありません。解析した結果は、句読点がない以外は、Microsoft Wordとほとんど同様の結果でした。

解析結果

吾輩は猫である名前はまだない どこで生まれたかとんと見当がつかぬ 何でも 薄暗いじめじめしたところで ニャーニャー 泣いていたことだけは 記憶している 吾輩はここで初めて 人間というものを見た しかも 後で聞くとそれは 書生 という人間中で一番 同枠な種族であったそうだ

評価

総合評価
★★★

よい点

  • 無料で、誰でも簡単に使用できる。
  • 利用回数の制限がない。
  • 漢字の変換も比較的適切に行われる。

悪い点

  • 途中で入力が止まってしまうことがある。
  • 句読点や改行が入らない。

【個人利用におすすめ】Notta

notta

nottaは毎月120分無料で利用できる文字起こしソフトです。フリープランではファイルの文字起こし(wav, mp3, m4a, caf, aiff, avi, rmvb, flv, mp4, mov, wmv, wma)と、音声の文字起こしができます。

解析結果

吾輩は猫である。名前はまだない。どこで生まれたかとんと見当がつかぬ。なんでも薄暗いジメジメとしたところには泣いていたことだけは記憶している。吾輩はここで初めて人間というものを見たしかも後で聞くとそれは書生という人間中で一番道悪な種族だったそうだ。

評価

総合評価
★★☆

よい点

  • 比較的精度が高い。
  • 有料版はZoomやTeams、Google Meetと連携して利用できる。

悪い点

  • テキスト化に少し時間がかかる。
  • 文字起こしする量が多いとコストがかかる。

【個人利用におすすめ】CLOVA Note

CLOVAページ

「CLOVA Note」は、ワークスモバイルジャパン株式会社というLINE WORKSを運営する企業が提供する文字起こしソフトです。オープンベータ期間中は毎月300分まで利用することができます(2023年11月現在の情報です)。発言者の認識も行うことができる点、アプリから利用できる点が他のサービスとは異なる点です。

解析結果

我輩は猫である。名前はまだない。どこで生まれたかとんと見当がつかな。なんでも薄暗いジメジメしたところでにゃあにゃあ鳴いていたことだけは記憶している。
我輩はここで初めて人間というものを見た。しかも後で聞くとそれは女性という人間中で1番同悪な種族であったそうだ。

評価

総合評価
★★☆

よい点

  • 300分まで無料で使用できる

悪い点

  • 発言者が認識されるが、2人で話しているにもかかわらず発言者が5人くらいに認識される場合があった。
  • リアルタイムでの文字起こしには対応していない。
  • PCから操作できるのはファイルのアップロードのみで、音声を読み取るのはアプリからのみ操作できる。
  • 利用料が増えると費用がかかる。
間違えると恥ずかしい文法ミスがゼロに
文章を入力するごとに、誰でもリアルタイムで文章のミスがチェックできます。
詳しく見る

【短時間の文字起こしにおすすめ】ChatGPTの音声入力

notta

OpenAIのWhisperを使いたいけれど、環境を作るのは面倒という方は、短時間であればChatGPTのアプリからの音声入力が利用できます。ChatGPTアプリの入力画面から音声入力のボタンをクリックして発言を始めると、無料で文字起こしをすることができます。Whisperが環境設定なしで利用できる方法があれば良いのですが、現状利用できる方法はありません。

解析結果

我輩は猫である。名前はまだない。どこで生まれたかとんと見当がつかぬ。何でも薄暗いジメジメとしたところでニャーニャー鳴いていたことだけは記憶している。我輩はここで初めて人間というものを見た。しかも後で聞くとそれは諸星という人間中で一番道悪な種族であったそうだ。

評価

総合評価
★☆☆

よい点

  • 精度が高い。

悪い点

  • 長い文章に対応するには、音声入力ボタンを何度もクリックする必要がある。

総評

今回全ての文字起こしソフト・アプリを試してみましたが、遠くの音声や複数人の音声を拾うことが苦手のようです。そのため、自分で声を吹き込む形でのセルフ文字起こしには十分使うことができましたが、対談やインタビューでの使用には不足があると感じました。ただし、以下の工夫を行うことで、音声の品質をあげることができましたのでご紹介します。

音声の文字起こしを行うときのポイント

ポイント1. マイクの位置

調査の結果、マイクを近づけることが何より重要であることがわかりました。

マイクと口との距離をできるだけ(5-15cm以内)に近づけるようにすることがポイントです。

マイクとの距離があると、どのソフトも全く使い物になりませんでした。

ポイント2. マイクのタイプ

自分でマイクに向かって話すのであれば、マイクの質はそれほど重要ではなく、スマホやPCについているマイクで十分です。ただ、インタビューなどで使用する場合、マイクと話者の距離がかなり近いことが前提のため、自立型のマイクなどで距離を近くすることが必要となってきます。

文字起こしソフト、アプリを使って議事録作成が効率化できる

AIの進化により、音声認識の分野は大きく進歩しました。今回ご紹介した、文字起こしツールを活用することによって、文字起こしや議事録の作成にかかる手間が少しでもなくなればと思います。まだ使ったことがない方は、自分の執筆スタイルに合うかどうか、ぜひお試しください。