急遽テレワーク導入!の顛末記

「iPhoneの音声出力をPCに繋いだら、電話もYouTubeも自動で文字起こしできるようになった」――急遽テレワークを導入した中小企業の顛末記(97)

iPhoneでの通話を録音しながら、さらに自動で文字起こし

iPhoneで通話している様子を、「Texta」で文字起こししてみた

 先日はピンマイクを使ってiPhoneで電話したり、相手の声をPCで録音したりしてみた。そこで思ったのだが、この仕組みを使えばスマホで鳴っている音声を、自動で文字起こしできるのではないだろうか?

……この記事を書いている時点で、東京都でまん延防止等重点措置が解除されてから40日が過ぎた。

 私が勤めている新宿にある中小企業では現在、各スタッフが可能な範囲でリモートによる業務を行っている。その中で、今回はスマホの音声出力を、PCのライン入力に繋ぐなどして、いろいろな音声を文字起こししてみた。

【今回のハイライト】
iPhoneとPCをケーブルで接続
文字起こし用にPCの設定を変更
YouTube動画も文字起こしできる?

4月25日(月):電話のやり取りをリアルタイムで文字起こししてみた!

 今日も自宅でテレワーク。取引先とiPhoneで電話をしているうちに、「この音声を自動文字起こしできないだろうか?」と、ふと思いついた。

 音声の自動文字起こしでは、以前に「Texta」という議事録作成支援ツールを使って、Zoomでビデオ会議中の音声をテキスト化したことがある。今回もこのWebサービスをブラウザーで表示させるとともに、ヘッドセット用変換アダプターケーブルをiPhoneに装着。このアダプタの音声出力を、PCのライン入力にケーブル接続してみた。

議事録作成支援ツール「Texta」
3極=4極変換コネクタをiPhoneに接続。マイク入力にピンマイクを装着し、音声出力をPCのライン入力に接続した

 なお、「Texta」ではブラウザーの「マイク」に指定されたデバイスの音声が、自動で文字起こしされる。今回はGoogle Chromeを利用したので、その設定画面で「マイク」にライン入力を指定。電話で会話をしたところ、その様子を「Texta」に認識させることができた。

Google Chromeの設定画面で、「セキュリティとプライバシー」→「サイトの設定」→「マイク」と操作。マイクに「ライン入力」を指定する
電話の声が「Texta」で認識され、リアルタイムで文字起こしが行われた

 ただ、最初のテスト通話では、「Texta」で文字起こしがはじまっているものの、相手の声がPCのスピーカーから聞こえなくて焦ってしまった。今回の構成で相手の声を聞くには、PCの「サウンド」設定で「このデバイスを聴く」を有効にする必要がある。さらに、相手の声が小さいと「Texta」に認識されないので、ライン入力のレベルは最大にして、ボリュームはスピーカー自体やWindowsの音量ミキサーで調整した方がよいだろう。

通知領域のスピーカー型アイコンを右クリックして、「サウンド」を選択。「録音」タブで「ライン入力」のプロパティを開き、「聴く」タブの「このデバイスを聴く」のチェックボックスをオンにする
さらに、「レベル」タブで「ライン入力」のレベルを最大(100)に変更した

4月26日(火):YouTubeで記者発表会、これも文字起こしできるか?

 今日は午後から行われる記者発表会を観ることに。このご時世のためYouTubeでのライブ配信が行われていたので、現地に行かずに、自宅からアクセスすることにした。

 このようにスマホのYouTubeで再生されている動画の音声も、「Texta」なら自動で文字起こしができる。昨日と同じように、iPhoneのライン出力とPCのライン入力をケーブルで接続。あとは、iPhoneでYouTubeの動画を再生すれば、それが「Texta」で認識されるという仕組みだ。

iPhoneでYouTubeの動画を再生
YouTube動画の音声が「Texta」で文字起こしされた

 そのまま、記者会見の様子をPCの画面で観ようとすると、スマホとPCで二重に音声が再生されてしまった。慌てて、PCのサウンド設定で「このデバイスを聴く」をオフに。これなら、スマホで再生しているYouTubeの音声を文字起こしさせながら、動画はPCの大画面で観ることができる。

4月27日(水):文字起こしの精度は、ソースとなる音声で変わる

 今日は朝から取材があったので外出することに。久々にテープレコーダーで会話の様子を録音して、その後は速やかに帰宅。録音データを文字に起こすために、「Texta」を使ってみることにした。

 テープレコーダーの録音データを「Texta」に認識させるためには、iPhoneで再生させる必要がある。そこで、iTunesを使って、音声データをiPhoneに転送。「ミュージック」アプリで再生させたところ、その音声を「Texta」で文字起こしできた。

 ただ、テープレコーダーの録音データは、電話やYouTube配信ほどクリアではないためか、一部の単語などが正しく変換されなかった。荒起こしのたたき台として使えないこともないが……。やはり「Texta」を利用するなら、ビデオ会議などPCで鳴っている音を、リアルタイムで変換するのがよさそうだ。

「INTERNET Watchの媒体」が「インターネット ホッチポッチ売店」など、文字認識が甘い部分もあった

4月28日(木):テレビの音声をPCで再生、ついでに文字起こしも

 テレワークが始まってからは、一息入れる時間にテレビを観ることも増えた。このようなテレビ番組の音声も、「Texta」を使えば文字に変換できる。作業が終了したあとは、それまで認識した声を音声ファイルとして出力することもできるので、メモしておきたい情報があるときに使えるかもしれない。

テレビ番組のクリアな音声は、かなりの精度で文字起こしができた

 スマホやテレビなどの音声を、ライン入力を通じてPCで鳴らしておくと、アプリなどを使って録音や文字起こしができるようになる。ほかにも、いろいろな使い方が考えられそうなので、しばらくライン入力には音声ケーブルを挿したままにしておこう。

「急遽テレワークを導入した中小企業の顛末記」記事一覧

※編集部より
テレワーク導入から在宅生活の楽しみ方まで!
「在宅で仕事する時代」の情報をまとめたサイト「在宅ライフ」を公開中です。ぜひご活用ください。

飛田九十九