NTT Com、東映らとデジタルヒューマン「CONN」を活用する接客の共同実験

東映ツークン研究所のもつデジタルヒューマン技術で生成した「ビジュアル」と、NTT人間情報研究所がもつモーションや音声を生成する技術により表現された「パーソナリティ(ふるまいや音声)」を掛け合わせたデジタルヒューマン「CONN(コン)」を活用。NTT Comが顧客やパートナーと新しい事業コンセプトを共創し、社会実装するために2021年10月に開始した事業共創プログラム「OPEN HUB for Smart World」において、接客やコミュニケーションを行うデジタルカタリストとして活動するという。

具体的には、NTT Comのワークプレイス「OPEN HUB Park」で接客やコミュニケーションを行う。ARグラスや7つのLEDモニター、等身大のモニターにおいて、それぞれのデバイス用に最適化した3DCGのCONNが登場。対話の中で自らが思考しているかのように表情やふるまい、声のトーンなどを変化させ、自然なコミュニケーションによりOPEN HUB Park内の「レセプションゾーン」「プレゼンゾーン」「ライブラリーゾーン」を案内するという。

さまざまなコンテンツを提供し、企業における新たな顧客接点としてのデジタルヒューマン活用の可能性を検証するとしている。

 レセプションゾーン

 プレゼンゾーン

キャプションライブラリーゾーン

昨今、労働力不足や生産性向上が課題となる中、企業ではXRやメタバース、ロボットなどの先進技術活用の検討が進んでいる。中でも、コンタクトセンターや店舗などの顧客接点において、チャットボットやバーチャルなキャラクターの導入が広がっているが、リアルな人との接点を求める人は依然として多く、よりリアルな人間に近い動きやコミュニケーションを可能とするバーチャルキャラクターが求められているという。

そこで3社は、東映ツークン研究所のデジタルヒューマン生成技術とNTT人間情報研究所が開発した「モーション生成AI技術」「音声合成AI技術」を連携させることで、より人間に近い自然なふるまいができるデジタルヒューマンとなるCONNを生み出した。

具体的には、社内外の専門家「デジタルカタリスト」9人の顔を、東映ツークン研究所の最新版の「LightStage」にてスキャン。CGにより、リアルな人間(デジタルヒューマン)を生成する技術を活用した。

また、実在するカタリストのモーションキャプチャデータと音声データをNTTグループが開発するAIエンジンで学習し、カタリストのふるまいと声の特徴を再現。

NTT Comが開発した、独自ソフトウェアの活用により、生成したビジュアルデータとパーソナリティデータの特徴点を組み合わせ、学習済みのプログラムをもとに、モーション生成・音声生成を行うことで、CONNの3DCG化を実現したという。

3社は、同実験を通じて得られた知見をもとに、自社内でのデジタルヒューマンの活用を検討。また、イベントやショールームでのアテンダント、企業の受付、アパレル店舗の店員など幅広い業種、業界の顧客に対し、デジタルヒューマンを活用したソリューションの提供を目指すという。

Original Post>