自然で感情豊かな表現力で、世界中のクリエイターや企業から注目を集める音声生成AI「ElevenLabs(以下イレブンラボ)」。
その技術は、エンターテインメントの可能性を広げるだけでなく、私たちのビジネスや日常生活にも着実に浸透し始めています。昨年、2025年には日本法人も設立され、国内での展開にも大きな期待が寄せられています。
今回は、イレブンラボで日本と韓国のマーケティングを担当する寺村ジャックさんに、開発の背景から技術的な優位性、そして日本市場での展望まで、詳しくお話を伺いました。

「言語の壁を越え感情を届ける」 ポーランドでの原体験から生まれた音声生成AI
Q. まずは、イレブンラボの事業内容についてお聞かせください。
ジャックさん: イレブンラボで日本と韓国のマーケティングを担当しております、寺村ジャックと申します。弊社はイギリスで創業された会社でして、日本の組織が直接開発に携わっているわけではありませんが、本日は製品開発の背景からご紹介できればと思います。
Q. 非常に自然な発話で各種メディアでも注目されていますが、このプロダクトの開発背景を教えていただけますでしょうか。
ジャックさん: 弊社の創業者であるマティ氏とピョートル氏は、二人ともポーランド出身です。ポーランドでは昔から、ハリウッド映画などを上映する際、全登場人物の声をたった一人の声優がすべて吹き替えるという文化が続いてきました。当然、老若男女問わず同じ声になるため、映画体験の質が著しく損なわれてしまいます。この原体験が、実は開発の最初のきっかけになっています。
「言語の壁」によって失われてしまう感情や体験を、AI技術で解決することができないか、という想いからスタートしました。そのため、弊社のText to Speech(TTS)というテキストを音声に変換する技術は、非常に自然で感情豊かに発話できる点を大きな特長としています。
当初は一方的な発話の品質向上を目指していましたが、AIが人間のように自然に話せるようになったことで、新たな可能性が見えてきました。それは、人間とAIが淀みなく自然に会話できる環境の構築です。この技術を企業のサービス提供に応用し、ユーザー体験そのものを向上させていくことが、今弊社が注力していることです。
“人間らしさ”の追求とレイテンシーの最小化。技術開発の核心
Q. 開発を進める上で、特に工夫した点や、乗り越えるべき技術的な課題はどのようなものがありましたか?
ジャックさん: やはり、従来のAI音声にありがちだった「ロボットが喋っている」という不自然さを完全に排除することが、開発当初からの大きな目標でした。そのために苦労したのが、人間特有の表現をAIに学習させることです。例えば、会話の合間の自然な息継ぎ、少し言いにくいことを口にする際の躊躇の間、あるいは文脈に応じて感情が高ぶる心の揺らぎといったものを、AIにどう理解させ、再現させるか。AI自体が感情を持つわけではありませんが、「人間であれば、この文字列や文脈にどういった感情で反応するのか」という膨大なデータを学習させることが、弊社にとってチャレンジングな部分であり、技術的に最も高い壁でした。
また、この技術を応用した音声エージェントの開発においては、別の大きな課題がありました。それはリアルタイムでの会話における「レイテンシー(遅延)」の最小化です。人間が話した内容をAIが受け、理解し、LLMで回答を生成し、それを再び音声として発話する。この一連のプロセスにかかる時間を、人間同士の会話に限りなく近づけるのは非常にハードルが高い作業です。人間が話し終えてからAIが反応するまでの時間をいかに短縮できるか。これは多くの企業が挑戦し、苦戦してきた領域ですが、弊社はこの点で成功実績を積み重ねながら、現在も常に改善を追求し続けています。
ノーコードでAIエージェントを構築。ボイスクローニングが拓く新たなユースケース
Q. 他の音声生成AIプロダクトに対するイレブンラボの優位性について教えてください。
ジャックさん:これまで不可能だったユースケースに手が届くようになった点が大きいと思います。例えば、映画の吹き替えを完全にAIで行うといったことは、従来の「人間っぽいけれど、まだAIだと分かる」レベルの品質では、人を代替するものとして受け入れられませんでした。弊社の技術は、そういった従来では届かなかった領域に到達できたと考えています。
その中で弊社のユニークな点として「ボイスクローニング」という技術が挙げられます。これは、わずか数分の音声サンプルを提供するだけで、その人の声をそっくりそのままクローニングできるものです。さらに、サンプリングした私の声を基に「感情タグ」で「ささやきながら」と指定すれば、私の声でささやくような発話が可能になります。ご自身の声のトーンを活かしながら、まるでプロのナレーターが感情豊かに語りかけているような発話を生成することもできる。これは大きな優位性だと考えています。
弊社はAIエージェントのプラットフォームも提供しており、こちらも競合優位性があります。昨今「AIエージェント」はバズワード化していますが、構築には専門知識が必要なのが一般的でした。しかし、弊社のプラットフォームは、専門知識がない方でも、ガイドに沿って比較的短時間で特定ドメイン向けのAIエージェントを構築できる点が評価されています。

世界有数のIP大国・日本市場への期待と、イレブンラボ日本法人の設立
Q. 2025年4月に日本法人が設立されましたが、海外拠点として日本を選ばれたのには、どのような狙いや想いがあったのでしょうか。
ジャックさん: 大きく二つの観点があります。一つは、日本がアニメ、映画、漫画といった分野で、世界的に見ても非常に多くの声に関するIPを有している稀有なマーケットだという点です。これらの素晴らしいコンテンツを世界中の人々に楽しんでいただくために、弊社のAI技術が貢献できると考えました。オリジナルの声優さんの声のまま多言語で展開できれば、現地語の吹き替えでキャラクターのイメージが変わってしまうといった事態を避けられ、ファンにとってはより魅力的な作品体験になります。コンテンツの伸びしろという点で、日本は非常にポテンシャルのあるマーケットだと捉えています。
二つ目は、ビジネスマーケットとしてのポテンシャルの高さです。日本は人口に対するIT投資額が世界的に見ても高く、非常に魅力的な市場です。一方で、公用語が日本語であることや、日本ならではの商慣習が存在することから、海外企業が参入しづらい、あるいは日本の企業が海外展開しづらいという言語の壁があります。
弊社の音声エージェントは30以上の言語に対応し、音声認識(STT)は90以上の言語で高精度な文字起こしが可能です。
また、声をクローニングしてスペイン語の文章を読ませれば、声はそのまま、スペイン語を話しているかのようにコンテンツを多言語化できます。こうした多言語対応へのニーズを見込み、日本法人の設立に至りました。
クリエイティブからカスタマーサポートまで。広がる音声AIの活用事例
Q. すでに多くの企業で活用が進んでいるかと思います。どのような課題を持つお客様が導入され、どのような効果が生まれているのか、具体的な活用事例をお聞かせください。
ジャックさん: 国内事例はまだこれからという段階ですが、大きくクリエイティブ業界での活用と、AIエージェントとしての活用の2つのカテゴリーに分かれます。
クリエイティブ系では、映像制作会社、ゲームスタジオ、オーディオブックを手掛ける出版社などでの採用が非常に多いです。作品を多言語に展開する際のコストダウンとスピードアップ、つまりコンテンツ完成までのタイムラインが劇的に短縮される点を高く評価いただいています。特にゲームスタジオでは、NPCのような大量に登場するキャラクターに音声を割り当てるコストを抑えつつ、全てのキャラクターに個別の声を与えることが可能になります。これにより、ゲームの世界観をよりリアルに構築できると好評です。
AIエージェントの活用事例としては、まずカスタマーサポートセンターの一次対応が挙げられます。従来の音声ガイダンスと違い、用件を直接話すだけでAIが即座に意図を理解し、適切な対応や担当者への割り振りを行います。これにより、顧客体験が大幅に向上します。その他、語学学習アプリの対話パートナー(Duolingo社)でも弊社の技術が採用されています。また、空港・鉄道などでの多言語音声案内など、双方向かつ多言語でのコミュニケーションが求められる場面で、弊社のAIエージェントの導入が世界中で増えています。

イレブンラボの掲げる構想と展望
Q. プロダクトの進化と、イレブンラボとしての展望はどのようなものでしょうか。
ジャックさん: プロダクトの展望としては、2026年2月のシリーズD資金調達(5億ドル)を経て、いくつかの大きな進化を予定しています。
一つは、音声AIエージェントの対話体験をより自然にするための強化です。たとえば、会話の文脈や状況に応じて、落ち着いたトーンで丁寧に対応したり、相手の意図に合わせて話し方を調整したりといった形で、より“人間らしい”コミュニケーションを実現する方向で改良を進めています。
また、クリエイティブ分野では、動画をアップロードするだけで吹き替えができる「ビデオダビング」機能において、吹き替えた音声と口の動きをより自然に一致させるため、リップシンクの精度をさらに高めていく方針です。
イレブンラボとしても、こうしたプロダクトの進化と連動しながら、日本市場での価値提供を拡大していきます。日本は世界的なIPコンテンツの宝庫です。まだ日本国内でしか楽しまれていない素晴らしいコンテンツを、弊社の技術でより多くの言語・地域へ届けられるよう支援することで、日本発コンテンツのグローバル展開や産業の活性化にも貢献していきたいと考えています。
今後は製品の発展とともに、様々な業界団体とも協調しながら、日本における弊社のプレゼンスを高めていきたいです。
Q. 最後に、この記事の読者の皆様に向けてメッセージをお願いします。
ジャックさん: 今の日本の多くのお客様にとって、音声AIはまだ「未来の話」だと感じられているかもしれません。多くの企業でテキストベースの生成AIの活用が進む一方で、音声AIの本格的なビジネス導入はこれから、という段階だと感じています。
しかし、欧米ではすでに導入が急速に進んでおり、Fortune500に選ばれる企業の約75%が何らかの形でイレブンラボを導入しているという実績もあります。音声AIはもはや未来の技術ではなく、カスタマーサポートの改善など、今すぐビジネスを良い方向に変えられる実用的な武器なのだということを、ぜひ知っていただきたいです。