急遽テレワーク導入!の顛末記

「うちの会社に3Dキャラが降臨した!」――急遽テレワークを導入した中小企業の顛末記(19) アバターでビデオ会議はアリ? ナシ?

会社の背景に、リアルタイムでシンクロした3Dアバターを合成

 何かの連絡をするとき、電話やメールをするか、それともZoomを繋ぐかで悩むようになった。特に、「今週の業務についての調整」といったチーム内での定期連絡については、Zoomの方が全員まとめてコミュニケーションできることもあり、話がスムーズに進むような気がする

 ……この記事を書いている時点で、全国で緊急事態宣言が解除されてから107日が過ぎた。

 私が勤めている新宿にある中小企業では、緊急事態宣言にともなってZoomを導入。最近では仕事上の付き合いのある同業者もZoomに慣れて、簡単な打ち合わせはオンラインで行うようになった。クライアントが相手では試せなかったバ美肉(バーチャル美少女受肉)、ようやく使うべき時がきたようだ。

【今回のハイライト】
音声の合成で、さらなるバ美肉を!
ついに3Dアバターに手を出す日が
怒って…ないよね?

【これまでの経緯】

緊急事態宣言が発令された4月、筆者の勤めている会社では何の準備もないまま、在宅勤務を始めることになった。仕事の環境は「デスクトップPC+メール」が普通だったため、データを外付けHDDで持ち運んだり、LINEの個人アカウントを流用したりと大混乱。その後、補助金などでNASやノートPCを導入、徐々にテレワーク環境を整えていく……

【4~8月末までの顛末はこちら】

8月31日(月): としまえんが閉園した日バ美肉はオンライン会議で受け入れられるか?

 以前にZoomの環境をあれこれと改良している中で、バ美肉に挑戦したことがあった。ただ、この頃から会社の全体ミーティングはオンラインで行われなくなり、ビデオ会議の相手はクライアントが中心に。さすがに、表には出せないと、すっかりお蔵入りになっていた。

「3teneFREE」に表示したアバターを、「OBS Studio」経由でZoomに表示

 ただ、ここに来て、仕事仲間ともZoomで打ち合わせをする機会が出てきた。これはチャンスだとばかりに、満を持してバ美肉で登場してみたところ、最初こそウケは取れたのだが……。

【仕事仲間M】んー、中身が飛田さんだと分かっているせいか、途中からなんか気にならなくなってきたかな。というか、アバターの向こうに、なんか飛田さんが見える。
【仕事仲間T】あー、確かに。その割には表情が分からないから、ビデオ会議で参加している意味がなくない?
【仕事仲間M】確かに、電話しているのと変わらないよね。その声は男のままだから、なんか不自然になっているし。

 もうボロクソである。確かに、VTuberが人気を集めているのは、中の人を知らないから。アバターを本人だと錯覚して見れるのが大きい。どうやら中身を良く知っている時点で、芸の細かい仮装ぐらいにしか見えなくなっていたようだ。そして、声に表情と、まだまだ課題は多い。

9月3日(木):日経平均がコロナ以前の水準まで回復した日リアルタイムな音声合成で自然に話せるか?

 せっかく実現した夢のバ美肉なのに、言われっぱなしは悔しいので、指摘された問題点の改善策を考えてみる。

 美少女として受肉するのであれば、やはり声にはテコ入れが必要だろう。音声をリアルタイムで合成するアプリはいくつかあるが、ネット動画では音声認識型トークアプリ「ゆかりねっと」が使われているのをよく見る。

マイクに向かって話しかけると、認識された日本語が字幕表示されるとともに、それが合成音声アプリで読み上げられる

 「ゆかりねっと」はマイクで話した声をGoogle音声認識でテキストに変換。それを、VOICEROIDをはじめとした合成音声アプリに連携させて、音声に変換するというアプリだ。同時に認識したテキストが表示されるので、動画に合成すれば字幕として利用できる。

 「SofTalk」などフリーの合成音声アプリにも対応しているので、試しに使ってみたところ、「テスト」などの短い単語については、問題なく合成してくれた。ただ、長い文章になると、それをしゃべり切り、「ゆかりねっと」で認識されて、はじめて音声として再生されるので、かなりのタイムラグがある。そして、「わかりませんでした」などと認識されないことも多い。

 ただでさえ、話のタイミングが掴みづらいビデオ会議で、このタイムラグは致命的だろう。プレゼンなどで自分一人が話すならいけそうだが……。

「OBS Studio」に「3teneFREE」、「ゆかりねっと」の字幕、会社の写真を読み込ませ、それをZoomに表示させてみた

9月4日(金):京都市の私立高でクラスターが発生した日バ美肉は無理でも、アバター受肉は諦めない!

 残念ながらバ美肉でのビデオ会議は、難しいと言わざるを得ない。ただ、せめてアバターでビデオ会議に、もっとスムーズに参加できないものだろうか。

 先日のビデオ会議inバ美肉で頂いたご意見の中でも、特にダメージが大きかったのが「表情が分からないから、ビデオ会議にする意味がなくない?」という一言。ただ、最近ではアバターの技術も進化してきている。表情を再現できるアバターを使えば、この問題が解決できるのではないだろうか?

「FaceRig」はSteam価格で1480円。セールの時に買っておけば……

 そこで目を付けたのが、3Dアバターをカメラ映像にシンクロして動かせる「FaceRig」。Steamで販売されているソフトだが、その評価は「非常に好評」が圧倒的に多数を占めている。「表情を伝えることができるので、配信の幅が広がった」などのコメントもあり、かなり期待ができそうだ。……実は以前のセールの時に、1000円以下になっているのを見かけていたのだが。

 とりあえず、インストールして起動させるところまでを試してみたが、会社支給のノートPCでも問題なく動きそうだ。ただ、WebカメラはノートPC内臓のものではなく、外付けのWebカメラを使うことにする。これは、以前にバ美肉したときに、内臓Webカメラの映像が暗いせいか、上手くアバターがシンクロしてくれなかったためだ。

ランチャーの「設定」で、「インターフェイス」にある「モニター設定に~」をオフに

 ちなみに、Steamのランチャー上でソフトを購入するときに、ストアの画面が表示されないトラブルがあった。いろいろ設定をイジってみたところ、どうやら「モニター設定に合うようにテキストとアイコンの大きさを微調整する」という設定が悪さをしていたらしい。チェックボックスをオフにすると、画面が正常に表示された。

9月7日(月):台風10号が九州を通り過ぎた日いよいよアバター受肉でZoom会議に!

 前回のビデオ会議から1週間が経ち、いよいよ雪辱の機会がやって来た。

 まずは、「FaceRig」を起動してアバターを選択。女性キャラもいるようだが、前回の失敗を踏まえて動物キャラを選択する。人間男性のアバターもいたのだが、何というか、ちょっと怖すぎた。こんなのがZoomの向こうから「こんにちは」してきたら、「何か怒らせてしまっただろうか?」と心配してしまいそうだ。

大丈夫? 怒ってない?

 なお、初期状態だとなぜかアバターがやたらと目を閉じたがった。「これは、居眠りしているようにしか見えないぞ……」と焦ったが、「表情の早い自動調整」で自分の顔を認識させると、スムーズにシンクロするようになる。表情もちゃんとトラッキングしているし、これはいけそうだ。

「OBS Studio」に「FaceRig」と会社の写真を読み込ませ、それをZoomに表示してみた

【飛田】…と思うんだけど、どうかなコレ?
【仕事仲間M】んー、確かに声の違和感はなくなったかな。
【仕事仲間T】笑ったり、困ったりしているのもわかるよね、うん……。

 何だか歯切れが悪いなぁ……。

【仕事仲間T】ほら、笑っているのは声を聞けば分かるわけで、何かこう、細かいニュアンスが伝わってこないわけよ。
【仕事仲間M】うんうん。あと、多分飛田さんが笑っていないときに、アバターが笑っていることがあった。
【仕事仲間T】可愛いアバターの表情を見ている分には楽しいんだけどね……。でも、中身が飛田さんだからなぁ。

 うーん、どうやらビジネスの場にアバターを持ち込むのは、まだまだ時期尚早だったようだ。ただ、「FaceRig」は“アバターを自然に動かす”ということについては優秀で、そこについて2人の評価は高かった。

 オンライン飲み会のように、最近ではプライベートでもZoomを使う機会が増えている。「でも、顔を出すのはちょっと……」という時は、アバターを使ってみる価値はありそうだ。

「急遽テレワークを導入した中小企業の顛末記」記事一覧

※編集部より
テレワーク導入から在宅生活の楽しみ方まで!
「在宅で仕事する時代」の情報をまとめたサイト「在宅ライフ」を公開中です。ぜひご活用ください。