企業のコンテンツ制作を人気IPがサポート「しゃべくりAI」

『秘密結社 鷹の爪』や『パンパカパンツ』など、独創的な企画と演出で数々のヒット作を生み出してきた株式会社ディー・エル・イー。今回は、同社の開発した「しゃべくりAI」というプロダクトについて取材をさせていただきました。プロダクトが提供する価値や今後の展望について、プロジェクトをリードされた椎木秀樹さんにお話を伺います。

「しゃべくりAI」の概要と開発背景

Q. 今回開発された「しゃべくりAI」の概要と、開発に至った背景をお聞かせいただけますでしょうか?

椎木さん: 広報やマーケティングの一貫として、SNS活用に注力されている企業様も多くいらっしゃると思います。企画の中で、キャラクターを用いたアニメーションは視聴者の反応が良くなる一方で、クオリティやコンテンツのリッチさが上がるほど制作コストが増大し、関わるステークホルダーも増えるため運用体制の構築が困難になるという大きな課題がありました。例えば、3分程度の動画を作るだけでも多くの工程を踏む必要があり、ちょっとしたアニメーションを作りたいと思ってもなかなか踏み込めないという壁が存在しています。

この課題を解決するために開発したのがしゃべくりAIです。テキストの文章を入力するだけで、本当に10秒程度で動画が完成します。入力した文章は1文ずつブロックになり、ブロック単位でアニメーションを制御できます。特定のセリフの部分で少し笑って話させたり、指をさして話させたりといった具体的な演出が簡単にできる仕組みになっています。

専門知識不要で直感的な操作、裏側を支えるAI技術

Q. どのような技術を使ってこのプロダクトを実現しているのでしょうか?

椎木さん: しゃべくりAIで自社のキャラクターを動かしたいというクライアント様向けには、私たちがゼロからサポートして音声モデルを作成し、システムに繋ぎ込んでキャラクターらしさを表現できるようにしています。また、3Dモデルを活用することで、音量や音素に合わせて口の動きを制御しています。キャラクターごとに仕様は異なり、たとえば当社の「吉田くん」の場合は音素に関係なく口が一回転するだけの動きですが、他のキャラクターでは音声ファイルから音素を読み取り、「あ」や「う」の口の形をしっかりと再現する制御も行います。最終的にこれらを全て合成して一つのアニメーションとして出力するシステムになっています。

Q. 画像生成等の機能を取り入れていないのは、理由があるのでしょうか?

椎木さん: 実は一昨年ほど前から、YouTubeなどの配信環境で人を介さずに、10時間連続で、コメントに回答するAIキャラクターの開発と運用を行っていました。多くの企業様から面白いと評価していただいたものの、AIが何を言い出すかわからないというコンプライアンス上の懸念から、なかなか実導入に進みづらいというお声もいただいておりました。

その経験から生まれたのが今回のしゃべくりAIです。AIを何が出てくるかわからないツールではなく、人が管理できる範囲内で自由に動いてもらう設計にしました。あらかじめ設定した範囲内で動くため制限はあるものの、突飛なことを言い出したり、意図しない画像が生成されたりといったリスクが一切起きない設計が特徴です。言い回しを変えたい時は文章にビックリマークをつけるだけで調整できるなど、運用者の負担を大幅に減らすことができます。

Q. リリース後、どのような反響やユースケースがありましたか?

椎木さん: デモ版をご利用いただいている企業様からは非常にご好評いただいています。直近でもインフラ系の会社様やエンタメ系の会社様に導入いただき、広報活動におけるSNS運用目的で活用されています。また、自社キャラクターをお持ちの企業様からは、「正にこういうツールが欲しかった!」というお声を頂戴しました。また、社内向けでも専門用語や「コンプライアンス上少し言いづらいことも、キャラクターを通して伝えることで角が立たなくなる」という特性を活かし、社員の育成やオンボーディング、理念の浸透などに役立てて頂いています。その他にも、投資家向けの事業説明資料や採用候補者向けの会社紹介ビデオなどにも幅広くご活用いただけると考えています。

自社IPの登録から他社IPの利用まで、柔軟な料金体系と開かれたIP戦略

Q. しゃべくりAIの利用料や、キャラクターを使う際の条件について教えてください。

椎木さん: システム利用料は3つのパターンをご用意しており、ミニマムで月額5万円からご利用いただけます。自社でお持ちのオリジナルIPを登録して使われる場合はこのシステム利用料のみで稼働させることができます。ただし、最初のキャラクター登録時のみ、セリフの生成や音声再現のためにマシンを動かす必要があるため、初期設定の登録料が別途発生します。一方で、当社の吉田くんや『そろ谷のアニメっち』などのキャラクターを利用していただく場合は、システム利用料に加えて別途キャラクターのライセンス契約をしていただく形になります。詳しくは、公式ホームページのお問い合わせフォームよりご連絡ください。

Q. 自社IPを持たない企業にとって吉田くんなどを使えるのは魅力的ですね。様々な企業がIPを利用することでキャラクターのブランディングが崩れる懸念は社内で出ましたか?

椎木さん: 議論にはなりましたが、想定していたほど大きな問題にはなりませんでした。当社は以前からNFT事業も展開しており、Web3的な観点からこれからのIPは多くの方々に関わってもらえる開かれた存在であるべきだという方針を持っていました。そのため、吉田くんなどのキャラクターについては一切の監修を不要とし、動画を作ったらそのままSNSにアップしてよいという非常に開かれたフローで提供しています。現在は『秘密結社 鷹の爪』や『そろ谷のアニメっち』など自社のキャラクターのみですが、今後は承認を頂けた他社様のIPも掲載していく予定です。

多言語対応や複数キャラクターの掛け合いなど、今後の展望

Q. 今後さらに発展させていきたい機能や、サービスの展望をお聞かせください。

椎木さん: 生成AI時代において先が読めずプロジェクトに予算をかけるのが怖いという声が多い中、しっかりとIPを搭載して磨き上げることでAIに模倣されない盤石な価値を作れると確信しています。

その上で、機能面では、画面内に2つのキャラクターを出して掛け合いながら説明するアニメーションを作れるようにしたいと考えています。さらにキャラクターの動きを滑らかにして、本格的なアニメーションに近づけていく開発も進めています。また、特に力を入れているのが多言語展開です。

Q. 多言語展開とは、具体的にどのようなことができるのでしょうか?

椎木さん: 日本語で作成したプロジェクトを、ワンクリックでそのまま他の言語に変換できる機能です。たとえば日本語で作った動画を中国語にしたい場合、コピー先の言語を選ぶだけで文章が翻訳され、字幕だけでなく音声も元のキャラクターの声質のまま他言語で出力されます。現時点では日本語のほか、英語、韓国語、中国語、広東語に対応しており、今後さらに対応言語を拡張していく予定です。

AIキャラクター配信からVTuber化まで、広がるエンターテインメントの可能性

Q. 最後に、他にも展開されているAIを活用したプロダクトについて教えていただけますでしょうか。

椎木さん: はい、ぜひ当社のAIキャラクターの取り組みについても知っていただきたいです。先ほど少し触れましたが『そろ谷のアニメっち』のサブチャンネルで、『ケツアゴ姉さん』というキャラクターをAIで実装し、10時間耐久のライブ配信などを行いました。人間には到底不可能な長時間の配信を実現したプロジェクトです。注目していただきたいのは、レスポンスの圧倒的なスピードと、キャラクターの設定をしっかりと踏襲した回答の面白さです。

Q. そのライブ配信では、視聴者とのコミュニケーションにおいてどのような工夫をされたのですか?

椎木さん: ゲーミフィケーションの要素をふんだんに取り入れました。視聴者からのコメントに対してAIがどれだけ秀逸な内容だったかを採点し、累計ランキングを表示する仕組みを導入しています。また、コメント数に応じてボルテージが上がり特定の閾値でイベントが発生したり、視聴者がコメントで吹き出しのセリフを埋める大喜利コーナーを設けたりと、アニメの中に入り込めるような体験を提供しました。常時1000人以上が視聴しているとコメントが流れてしまいますが、投げ銭をしていただくと赤枠で表示されAIが優先的に拾ってくれるというマネタイズのポイントも作りました。

Q. AIキャラクターの技術としゃべくりAIは、どのように繋がっていくのでしょうか?

椎木さん: 実は、AIキャラクターの裏側で動いているシステムと、しゃべくりAIで動いているモデルは全く同じ仕組みなんです。しゃべくりAIで自社のキャラクターモデルを作成していただき、動画制作に活用していただいた先には、自社のキャラクターを直接ファンと対話させたいと考えた場合には、構築したモデルをそのまま転用してAI VTuber化やチャットボット化することが可能です。単にツールを提供して終わりではなく、キャラクターを継続的に育てていくサポートまで一貫して行えることが、当社の最大の強みだと考えています。

 

×