急遽テレワーク導入!の顛末記
「無料でも結構スゴい!! 文字起こしAIに録画したWeb会議のテキスト化をさせてみた!」――急遽テレワークを導入した中小企業の顛末記(118)
「Whisper」ならボイスレコーダーの録音データなどを無料でテキスト化できる
2022年11月7日 07:00
最近では重要なビデオ会議がある時は、「Texta」という議事録作成支援ツールを使って、その様子をテキスト化するようにしている。ただ、このサービスはリアルタイムの音声しか無料で文字起こししてくれないので、会議前に準備を万端に整えておかなければならない。
……この記事を書いている時点で、東京都でまん延防止等重点措置が解除されてから228日が過ぎた。
私が勤めている新宿にある中小企業では現在、各スタッフが可能な範囲でリモートによる業務を行っている。その中で、今回は文字起こしAI「Whisper」を使って、録音した音声データの文字起こしに挑戦してみた。
10月28日(金):まずい、Zoomの録音にしくじった……
今日は新たなプロジェクトについて、取引先とZoomでビデオ会議をすることに。ただ、前の予定が詰まっていたため、開始時間ギリギリに席に戻ることになった。ミーティングは先方が設定したため、こちらからでは会議の様子を録画することもできない。
ひとまず、Windows公式の「Xbox Game Bar」アプリを使って、ビデオ会議のウィンドウを動画キャプチャすることはできたが……。「録画中はマイクをオン」の設定のまま録画してしまったため、Zoomの設定でマイクをミュートにしていた時も、咳やキーボードのタイプ音が全部収録されてしまった。
もちろん、「Texta」の設定も間に合わなかったので、もう文字起こしをすることはできない。やはり、有料プランに契約して、録音データからも文字起こしができるようにすべきだろうか?
10月31日(月):文字起こしAI「Whisper」、その精度と使いやすさは?
録音データからの文字起こしができるサービスが何かないか? と探していたところ、今年9月に発表された「Whisper」という文字起こしAIが、かなりの高精度で音声データのテキスト化を行ってくれるらしい。それも、以前に「Stable Diffusion」などの画像生成AIを使った時と同じように、Googleの「Colaboratory」上から無料で機能を利用できるようだ。
さっそく、その機能を試してみたが、導入自体はわずか数分で行うことができた。新たなノートブックを作成したら、「ハードウェア アクセラレータ」の設定を変更。あとは、コード……
---------------------------------------
!pip install git+https://github.com/openai/whisper.git
import whisper
model = whisper.load_model("base")
result = model.transcribe("/content/ファイル名")
print(result["text"])
---------------------------------------
を入力したら準備は完了だ。
録音データをアップロードして、コードを順番に実行していくと、文字起こしされたテキストが表示された。約15分のボイスレコーダーの録音データをテキスト化するのに、かかった時間は1分足らず。このスピード感には正直驚いた。
ただ、文字起こしされた文章を確認していると、人名が認識されていなかったり、文章として破綻している個所が多くみられた。「Whisper」には5つのモデルが用意されており、今回はその中で2番目にサイズが小さい「base」を利用したのだが、このモデルでは日本語を正しくテキスト化してくれないらしい。
そこで、一番サイズの大きなモデルとなる「large」を利用したところ、かなり高い精度で音声データを文字起こしすることができた。これなら、話し手が変わるところで改行を加え、一部の誤記を修正することで、十分に使える議事録になるだろう。
11月1日(火):Zoomのミーティングを録音したm4aファイルでもOK
今日は会社の全体ミーティングの日。その議事録を「Whisper」で作成してみたかったので、今回は会社のアカウントを使って、ミーティングに参加させてもらうことにした。
といっても、実際にやることと言ったら、会議が始まったところで「レコーディング」ボタンを押すだけ。あとは、ミーティングが終了すると、自動で音声データが作成されるので、これを「Whisper」に読み込ませてみた。
Zoomではm4a形式で音声ファイルが作成されるが、そのままアップロードしても、「Whisper」で読み込むことができた。昨日の時点で分かっていたことだが、音声の認識精度もかなり高い。適当に改行を挟んだうえで、このデータを会社のNASに保存しておけば、十分に議事録としての役割を果たせそうだ。
11月3日(木):YouTubeの英語プレゼンをテキスト化、そして日本語に
今日は自宅で原稿を書くことに。その参考となる記者発表会が明日行われるのだが……、会場が海外ということもあって、その内容は英語でプレゼンされるらしい。YouTubeで同時配信されるのだが、日本語の字幕が表示されることはまず期待できないだろう。
そこで、ふと思いついて、YouTubeに投稿されている英語のプレゼン動画を再生。それを、「♪超録-PC長時間録音機」というフリーソフトで録音し、音声データを「Whisper」に読み込ませてみた。その上で、テキスト化したデータを「Google翻訳」で翻訳させてみる。すると、プレゼンの内容が日本語で表示されたではないか! 英語が達者ではない筆者にとって、この精度で翻訳してくれるのは正直かなり助かる。
テレワークによってビデオ会議が普及する中、議事録を作成する機会が増えているが、「Whisper」を使えばその手間をかなり減らすことができそうだ。ほかにも、電話や講演など、さまざまな用途に利用することができるだろう。
「急遽テレワークを導入した中小企業の顛末記」記事一覧
- 【緊急事態宣言前日】 「えっ?今日から在宅勤務?」
- 【緊急事態宣言突入】初のオンライン会議で久々のシャツ姿!ところが……
- 【GW直前】初のビデオ会議!「もう、LINEでいいんじゃない?」
- 【GW明け】「そうだ!会議を録画しよう!」
- 【5月中旬】ついにZoom有料プランを導入!
- 【5月下旬(1)】先輩企業に聞いてみた「普通にやったら、効率は落ちます」
- 【5月下旬(2)】「データ移行に1日がかり…は、もう嫌だ」
- 【5月末】助成金、ついに決定! 盲点だった価格変動・在庫切れ……
- 【6月上旬】セットアップをどうしよう?
- 【6月中旬】VPNルーターを補助金で設置! IP電話用とWi-Fi用のルーターも設定を変えないと……
- 【6月下旬】うちの会社にNASがきた! VPNで自宅からも利用
- 【7月上旬】今どきのノートPCで思いっきりZoom、男の夢も…
- 【7月中旬】「紙の書類のために出社」はなんと無し?うちの経理って、実は先進的…
- 【7月下旬】「ビデオ会議で自分だけ顔が暗い……」外付けカメラもiphoneも…
- 【8月上旬】ノートPCでは在宅勤務がツラい!「画面の増やし方」を考えてみた
- 【8月中旬】「会社支給PCをテレワーク用に仕上げてみよう」UACとパスワード保護共有
- 4月にはじめたテレワーク、5ヶ月の進化を振り返る……
- 【8月下旬】ビデオ会議の音と画質、超お手軽にUPさせたい!
- 【9月中旬】「展示会に見た、これがテレワークの最前線!」
- 【9月下旬】VPNでトラブル、NASからファイルが消えた!?」自宅から会社のNASに……
- 【10月上旬】Zoomでプロジェクターを使ったプレゼンは可能か?
- 【10月中旬】テレワークの「音」と「映像」変遷記、「あえてクルマの中でビデオ会議」やAirPods Proなど
- 【10月下旬】リモートデスクトップを使いたい!……会社の反応は?
- 【11月上旬】会社のパソコンの電源を遠隔操作でONにしたい!
- 【11月上旬】会社置きのタブレットで会議にZoom参加したい!
- 【11月中旬】同僚と会社にいるのと同じ感覚でおしゃべりしたい!
- 【11月下旬】自宅に1台だけネット通信できない端末が……、原因は?
- 【12月上旬】Zoom仕様に会議室の環境を最適化したい!
- 【12月中旬】会議室をビデオ会議用に改造……、を自前でやってみた
- 【12月下旬】Zoomに『接続が不安定です』と言われた、どうすればいい?
- 【12月下旬】無料でも使える『Trello』はテレワークで増えた進行管理トラブル対策になる!?
- 【1月中旬】カードを動かすだけで関係者への連絡が自動化!! 『Trello』を1週間使ってみた
- 【1月中旬】手段が目的になる!? ITツールを導入する意味を聞いた
- 【1月下旬】リモートでの社内情報共有に『Confluence』を使ってみた
- 【1月下旬】今からでもできる『出勤7割削減』に役立つ5つのツール
- 【2月上旬】テレワーク中の電気代、在宅勤務手当はいくら非課税になる?
- 【2月上旬】原稿の校正をAIに任せたい! しかも無料で
- 【2月中旬】テレワーク不健康を解消!3000円で始めるスタンディングデスク
- 【2月下旬】テレワークの最前線をオンライン展示会に見た!!
- 【3月上旬】月額5000円からのバーチャルオフィスを無料で使ってみた
- 【3月上旬】3D空間のバーチャルオフィスに無料トライアルで出社してみた!
- 【3月中旬】Zoomで採用面接は当たり前? でも新たな課題が
- 【3月下旬】Zoomの面倒なスケジュール調整や登録をeeasyで自動化してみた
- 【3月下旬】テレワークにおける社員の安否確認方法を見直してみた!
- 【4月上旬】クラウドに散ったタスクを一つのカレンダーで管理したい!
- 【4月中旬】リモートで会社にあるPCの電源を入れる方法を再考してみた
- 【4月中旬】Gmailがパンク!? バックアップしてThunderbirdで見られるようにしてみた
- 【4月下旬】既読/未読も状態そのまま!メール環境をUSBメモリーで持ち歩いてみた
- 【5月上旬】自宅と会社のメール環境をVPN経由で同期させてみた
- 【5月中旬】無料のRPAツール、Power Automate Desktopで経理作業を自動化したい
- 【5月下旬】遠隔操作のストレス改善! Windowsとアプリを高速化してみた
- 【5月下旬】Thunderbirdをテレワーク用にカスタマイズ!
- 【6月上旬】Power Automate Desktopで精算時の運賃計算を自動化!
- 【6月中旬】アレクサをテレワーク用にカスタマイズしてみた!
- 【6月下旬】ビーズクッションのYogibo Maxで思いっきりズボラにテレワークしてみた
- 【6月下旬】ビデオ会議の声を無料で自動文字起こししてみた!
- 【7月上旬】Bluetoothより優秀! Spotifyで音楽を止めずに仕事してみた
- 【7月中旬】ホストでなくてもZoomで勝手に画面共有できるようにしてみた
- 【7月中旬】USBメモリーをもっと使いやすく安全に!! フリーソフトを試してみた
- 【7月下旬】スマホに時報させて、ビジネスの時間感覚を取り戻してみた
- 【8月上旬】自宅にいるときだけiPhoneから好みの音声の時報を鳴らす方法
- 【8月中旬】タダから始めるToDoリスト! カレンダーとの連携も
- 【8月下旬】通知からZoom連携まで、Googleカレンダーをカスタムしたら便利過ぎた
- 【8月下旬】iPhoneやPCに分散したアドレス帳を、Googleの連絡先にひとまとめにしたい
- 【9月上旬】カレンダーやToDoの通知を、PCでも受け取れるように強化してみた
- 【9月中旬】NFCタグを使って朝のルーティン作業をまとめて自動化してみた
- 【9月下旬】Aladdin Connectorが届いたので、popIn Aladdinでテレワークしてみた
- 【9月下旬】iPhoneの画面をPCにミラーリング! これ、テレワークに使えそう
- 【10月上旬】声やアラームをトリガーにして、PCをWake On LANで自動起動させてみた
- 【10月中旬】アレクサと連携してPCを声でスリープさせてみた
- 【10月中旬】リモートで同僚とのやり取りがしにくい!! を“見える化”で解消してみた
- 【10月下旬】リモートで会社にあるPCの電源を入れたい問題、ついに完全決着なるか!?【vPro特別編 その1】
- 【10月下旬】もしも中小企業がvProを導入したら……、経理業務をリモート化してみた!【vPro特別編 その2】
- 【11月上旬】プリンターがないと書類の署名が大変! フリーの画像ソフトで解決してみた
- 【11月上旬】Windows 11のアップデートでトラブル! 2つのOSがデュアルブートするようになってしまった
- 【11月中旬】リモートで会社のPCを操作したい!! 最強のリモートデスクトップ環境への道(総集編)
- 【11月下旬】ノートPCを持ち歩くのが重いので、iPhoneだけで仕事してみた
- 【11月下旬】iPhoneだけでどこまで仕事できる? 画像編集、圧縮、PDF加工をやってみた
- 【12月上旬】USBマイクでヘッドセットから解放された! iPhoneでの利用もOK
- 【12月中旬】iPhoneをハンズフリーで高音質に使いたい!! USBマイクやピンマイクは通話に使えるのか?
- 【12月中旬】iPhoneでのZoomに落とし穴! USBマイクやAirPodsの挙動を徹底検証してみた
- 【12月下旬】スマホ連携も! ホットクックで時短かつヘルシーなランチを満喫
- 【1月中旬】2021年テレワークで活躍した仕事環境UPのグッズ3選、会社にも持ってきた
- 【1月下旬】popIn AladdinはPCのマルチディスプレイとして使用できるか?
- 【1月下旬】自宅のWi-Fiがパンクしたので、TP-Linkの最新ルーターを買ってみた!
- 【2月上旬】家に転がっていたAndroidタブレットをテレワーク用にカスタムしてみた!
- 【2月中旬】ごろ寝でズボラにテレワークしたい!! 古いタブレットを再活用してみた
- 【2月下旬】請求書のオンライン受け取りに特化した『sweeep』を試してみた!
- 【2月下旬】商品在庫と発送を、クラウドサービスで管理したい
- 【3月上旬】モニターアームが使えない!? ディスプレイの置き方を検証してみた
- 【3月中旬】WoLいらず! 最新ファイルだけ自動でNASにバックアップする仕組みを作ってみた
- 【3月下旬】BunBackupを駆使して、Officeファイルだけをお手軽バックアップ
- 【4月上旬】PDF=MS Office変換を駆使して、快適にファイルをやり取りしたい!
- 【4月中旬】机の上にたまった書類をスマホアプリでPDF化したい
- 【4月中旬】パジャマ姿のまま、会社のビデオ会議に出席してもバレない方法?
- 【4月下旬】Zoomに、ハンズフリー通話に! ピンマイクをiPhoneでフル活用してみた
- 【5月上旬】iPhoneの音声出力をPCに繋いだら、電話もYouTubeも自動で文字起こしできるようになった
- 【5月中旬】ローランド製のミキサーで、ビデオ会議の品質・手軽さをUPさせてみた!
- 【5月下旬】Fire TV StickでPCの画面をテレビに! デスクトップPCをリビングでも使う方法
- 【5月下旬】実は3種類あったLINEのPC用クライアント、使い勝手を比較してみた
- 【6月上旬】祝! 連載100回記念!! 筆者が選ぶ、今からでも読んでほしいお役立ち記事10本
- 【6月中旬】Gmailの使い方を検証! PCのメモリー消費量をセーブするには?
- 【6月下旬】Web会議用の機材で、iPhoneの電話を録音してみたい【完結編】
- 【6月下旬】無料アプリでマイクやスピーカーのミュート操作を高速化してみた!
- 【7月上旬】モニターを買い増したので、マルチディスプレイ環境にしてみた
- 【7月上旬】マルチディスプレイ環境を快適にしたい!! フリーソフトや便利な設定を探してみた
- 【7月下旬】分割キーボードを疑似的に再現!「AutoHotkey」でキー割り当ての見直しも
- 【8月上旬】外出先から自宅のPCをMagic Packetで遠隔起動させたい
- 【8月上旬】指定の時間にPCを自動起動&終了! さらにデータのバックアップを自動化してみた
- 【8月下旬】Wi-Fiルーターの簡易NAS機能は使えるか!? 外出先から作業データにアクセスしたい!
- 【8月下旬】リモートデスクトップ経由で、自宅のHDDレコーダーやタブレットを遠隔操作してみた
- 【9月上旬】文字だけもなんなので、プロフィール画像をAI(Stable Diffusion)に作らせてみた
- 【9月中旬】ついに田んぼが空を飛ぶ? またAI(Disco Diffusion)にプロフィール画像を作ってもらった
- 【9月下旬】スマホからFire TV Stick、PS4まで、家中のデバイスから簡易NASにアクセスしてみた
- 【10月上旬】キャプチャボードを有効活用、iPhoneの動画やカメラ映像をZoomに流してみた
- 【10月中旬】1万3000円でリビングTVがWindows環境に! マウスの激安Winタブを試してみた
- 【10月下旬】マウスの1.3万円Winタブを会議室に置いたら、資料の共有がスマートになった!
- 【11月上旬】無料でも結構スゴい!! 文字起こしAIに録画したWeb会議のテキスト化をさせてみた!
- 【11月中旬】無料会員でもけっこう便利!! firestorageをフル活用して、テレワーク中の共同作業を快適に
- 【11月下旬】iPhoneの電源が入らなくなった!! 端末のデータはどこまで復元できる?
- 【11月下旬】Web会議中のキーボードタイプ音を消したい!! 後付けできる“マイク用”ノイズキャンセリングアダプターを試してみた
- 【12月上旬】カレンダーの同期が遅すぎる!! GoogleカレンダーよりiPhoneのカレンダーの方が優秀だった!
- 【12月中旬】Wake on Lanは不要!? スマートプラグだけで会社のPCをリモート起動させてみた
- 【12月中旬】スケジュール管理やビデオ会議にも!? Amazonセールで手に入れたEcho Show 5をテレワークで使い倒す
- 【12月下旬】SwitchBotを使って、PCのミュートやシャットダウンを声で操作してみた
- (好評連載中)