急遽テレワーク導入!の顛末記

「ビデオ会議の声を無料で自動文字起こししてみた!」――急遽テレワークを導入した中小企業の顛末記(58)

「Googleドキュメント」や「Texta」など無料ツールで文字起こしは可能か?

自動文字起こしの機能がタダで使える議事録作成支援ツール「Texta」

 「Zoom」や「Google Meet」でビデオ会議を行う時、相手がホストの場合にはWindows 10の標準機能「Xbox Game Bar」で、その様子を録画するようにしている。クライアントが相手の場合は「録画データをください」と言いづらい時もあるので、ホストしか録画機能を使えない時に便利だ。

 ……この記事を書いている時点で、東京などで緊急事態宣言が解除されてから4日が過ぎた。

 私が勤めている新宿にある中小企業では現在、各スタッフが可能な範囲でリモートによる業務を行っている。その中で、今回はビデオ会議の音声について、ツールを使って文字起こしができないか試してみた。

【今回のハイライト】
Googleドキュメントで文字起こしをしたものの……
文字起こしに備え、マイクとスピーカーの音声をMIX
全体MTGの様子を実際に文字起こししてみた!
【これまでの経緯】

緊急事態宣言が発令された2020年4月、筆者の勤めている会社では何の準備もないまま、在宅勤務を始めることになった。仕事の環境は「デスクトップPC+メール」が普通だったため、データを外付けHDDで持ち運んだり、LINEの個人アカウントを流用したりと大混乱。その後、補助金などでNASやノートPCを導入、徐々にテレワーク環境を整えていく……

【2020年4~8月末までの顛末はこちら】

6月14日(月):「Xbox Game Bar」で3大ビデオ会議ツールを録画

 これまで、ビデオ会議にはZoomやGoogle Meetを使ってきたが、先日クライアントから「Microsoft Teams」の招待を受け、これで3大ツールを制覇できた。以前に「BlueJeans」というツールを使ったときは、「Xbox Game Bar」での録画ができなくて焦ったが……。3大ツールでは問題なく録画できるらしい。

Microsoft Teamsでのビデオ会議を、Xbox Game Barで録画する

 こうした録画データは会話の内容を後で確認するときに使っているが、知りたい情報の部分を頭出しするのに時間がかかる。会議中に文字起こしをしても良いのだが、話に集中できなくなるし、キーボードのタイプ音をマイクが拾ってしまうのも問題だ。

 以前に訪れた展示会では、ビデオ会議向けの自動文字起こしサービスが数多く紹介されていた。こういうツールは随分昔に試した時、音声認識する精度の悪さに絶望したが、今なら使えるツールがあるかもしれない。

6月15日(火):Googleドキュメントで文字起こしをしてみたものの……

 今日は会社の全体ミーティングの日。その様子を「Xbox Game Bar」で録画したので、さっそく自動文字起こしに挑戦してみる。

 無料で自動文字起こしに使えるツールでは、一番ポピュラーなのが「Googleドキュメント」だ。「音声入力」機能が用意されており、これに録画データの声を聴き取らせることで、それを文字に書き起こしてくれる。準備も「サウンド」の設定を変更するだけと簡単だ。

通知領域のスピーカー型のアイコンを右クリックし、「サウンド」を選択。表示された画面で「録音」の「ステレオミキサー」を「規定の通信デバイス」に設定する
Googleドキュメントで「ツール」→「音声入力」と操作。マイク型のアイコンをクリックすると、音声入力がはじまる

 あとは、「音声入力」機能をオンにしたうえで、録画データを再生するだけなのだが……。どうにも声の認識精度が悪い。発言者によっては全く声を聞き取ることができず、そのうちに機能が停止してしまった。

 その後も何度か試してみたものの、リアルタイムで自分の声は文字に起こせるが、録画データの文字起こしは上手くいかない。やはり、この機能はあくまで音声入力のためのものということなのだろう。

6月16日(水):無料の自動文字起こしツールを発見!

 あれから時間を見ては、Googleドキュメントに代わる自動文字起こしのツールを探していたところ、議事録作成支援ツール「Texta」にたどり着いた。料金プランによると、リアルタイムでの文字起こしなら無料で、利用時間の制限などもない。これは試してみるしかないだろう。

 さっそくユーザー登録してサインインすると、すぐに議事録の作成画面が表示された。後は「議事録開始」ボタンをクリックするだけのようなので、パソコンでZoomを起動。手持ちのスマホを相手に、一人芝居のミーティングを行ってみる。

サインインすると「リアルタイム」での議事録作成画面が表示された

 うん、さすがは専用ツールだけあって、文字起こしの精度はかなり高い。入力スピードもGoogleドキュメントと互角で、単語も文脈に合ったものに変換されている。

 ただ、文字起こしされるのはパソコン側の音声だけで、スマホ側の声は認識されない。やはり、無料での自動文字起こしは、まだまだ実現不可能なのだろうか?

6月17日(木):仮想ミキサーでマイク入力とスピーカー出力をMIX

 Textaについて調べていると、運営元の「LIGHTBLUE TECHNOLOGY」のブログにヒントがあった。どうやら、マイク入力とスピーカー出力をMIXさせることで、相手の声も文字起こしできるようになるらしい。

「Install」ボタンをクリックして、ダウンロードしたインストーラーからアプリをインストールする
スタートメニューからVoicemeeterBananaを起動。

 ブログでは仮想ミキサー「VoicemeeterBanana」を利用していたので、さっそくソフトをインストール。まずは「HARDWARE INPUT」にマイク入力を選択し、B1に接続。続いて、「VIRTUAL INPUTS」(PCで再生されている音)を、A1とB1に接続する。

 最後に「HARDWARE OUT」でA1にスピーカーを指定することで、「VIRTUAL INPUTS」をスピーカーで再生するようにした。「HARDWARE INPUT」と「VIRTUAL INPUTS」をMIXしたB1は、「VoiceMeeter Output」という入力デバイスにつながっているので、これをブラウザのマイクに設定すれば準備は完了だ。

「HARDWARE INPUT 1」をクリックして、マイクを選択。B1だけをONにする
「VIRTUAL INPUTS」の「Voicemeeter VAIO」でA1とB1をONに
「HARDWARE OUT」でA1にスピーカーを指定

 この状態で一人芝居のミーティングを行うと、パソコンとスマホ両方の声がTextaで自動文字起こしされた。Zoom越しにスマホの音声もきちんと認識していたので、これなら実際の仕事にも使えるかもしれない。

6月22日(火):ビデオ会議の様子をTextaで文字起こししてみた

 今日は会社の全体ミーティングの日。時間に合わせてZoomを起動するとともに、Google ChromeでTextaを表示。ミーティングの様子を文字起こししてみた。

 「おはようございます」と全員で挨拶をした後、まずは社長から話があった。緊急事態宣言は終わったものの、まん延防止等重点措置が継続されているので、引き続きテレワークを可能な範囲で行っていく。その中で、何か問題があれば、声をかけてほしい、と。

 そんな社長の発言なのだが、どうやらヘッドセットを使わず、ノートPCの内臓マイクが拾っているようで、ほとんど聞き取れないぐらいに声が遠い。おかげで、Textaも社長の声を拾えずに、文字起こしがピタッと止まってしまった。このままでは、社長がいなかった世界の議事録が出来てしまう……。

 ただ、その後は順調に音声認識が働いて、スタッフそれぞれの声を、Textaが文字起こししていった。営業の早口にも対応し、男性と女性で精度の違いがないところを見ると、苦手な声色というのは特にないらしい。

営業の早口トークも、きちんと後追いして文字起こししてくれた

 ただ、固有名詞については、変換エンジンに登録されていないものもあるようで、所々で誤記が出た。また、改行は発言者を認識してではなく、発言が途切れたタイミングで行われるので、一人一人の話し方によってバラつきが出る。あまり改行が多いと時刻表記が邪魔になるので、後で議事録に整えるなら、「時間を記録する」のオプションはオフにしておいた方が良いかもしれない。

 その後、ミーティングは1時間ほどで終了。それに合わせてTextaの「議事録終了」ボタンをクリックすると、録音された音声データ、および文字起こしされたテキストデータをファイルとしてダウンロードすることができた。簡単なミーティングであれば、録画データまではいらないので、コンパクトな音声データだけ保存できるのはありがたい。

「議事録開始」ボタンをクリックした以降の、音声データと文字起こしテキストをファイルとして保存できる

 こうしてTextaによる文字起こしは無事に終了。最終的な感想としては、「思った以上に使える」というところだろうか。過去に利用してきた音声認識による文字起こしツールは、正直精度が低すぎて、誤記だらけのテキストを読むことすら大変だった。でも、Textaの文字起こしは誤記こそあるが、全体的な文脈が理解できるレベルになっている。会議中の発言を振り返るには十分だし、記録された時間から録音データを頭出しすれば、例え誤記があっても元になった発言を確認できた。

 テレワークによって広まったビデオ会議は、今後も使い続けられることになるだろう。その使い勝手を向上させるために、Textaはあると何かと助かるツールになりそうだ。

「急遽テレワークを導入した中小企業の顛末記」記事一覧

※編集部より
テレワーク導入から在宅生活の楽しみ方まで!
「在宅で仕事する時代」の情報をまとめたサイト「在宅ライフ」を公開中です。ぜひご活用ください。

飛田九十九