インバウンド客や海外市場に向けて動画でプロモーションを行いたいが、多言語化にかかるコストの高さや、AI特有の不自然な翻訳に不安を感じて踏み切れない——そんな悩みを抱えていませんか?
株式会社こんにちハローが提供する動画翻訳サービスは、話者の声と唇の動きをそのまま多言語で再現し、37言語に対応しています。圧倒的な低価格を実現し、アパホテルなどの大手企業から街の飲食店まで、幅広い業種で導入されています。
本サービス最大の独自性は、最新の生成AIに「人の手」による修正を組み合わせ、業界用語や抑揚まで完璧に再現するアプローチです。用途に応じて最適なAIを使い分けることで、商業利用に耐えうる高品質な動画を短納期で提供しています。本記事では、開発の原点となった築地での原体験、他ツールとの決定的な違い、そして導入後のリアルな支援体制について、同社執行役員CSOの早見さんに伺いました。

築地の干物屋を営む叔父の悩みが原点。”言語の壁”を解決するための起業
Q. このサービスを開発した経緯や、背景にある課題意識についてお伺いできますか?
早見さん: 私と、現在代表を務める弟は、ともに生まれも育ちも築地です。私たちの叔父が市場で干物屋を営んでいるのですが、そこにはたくさんの外国人観光客が訪れます。しかし、叔父は日本語しか話せないため、外国人に対して魚の魅力やこだわりを伝えたくても、言語の壁があって伝えられないという悩みを抱えていました。それを解決したいという思いが、兄弟ともにずっとあったのです。
言語の壁を解決するためのサービスとして、今流行しているAIをどうにか使えないかと考えていた折、当時アメリカでインターンをしていた弟が「HeyGen」という多言語の動画生成AIを見つけてきました。もともとはプレゼンテーション用のAIで、翻訳精度はまだ実用レベルとは言えませんでした。しかし、人が修正や翻訳の部分に手を入れることで、商業利用ができるクオリティになることに気づいたのです。これが、叔父の悩みと直結し、日本に持ってきて事業化すればうまくいくのではないかと考えたのが、起業の最大のきっかけです。
最適なAIの使い分けと「人の手」の融合で、商業利用レベルの精度を実現
Q. サービスの特徴や、類似のAIツールとの違いについて教えてください。
早見さん: 一番の強みであり独自性は「AIだけを使っていない」という点です。AIの技術は著しく進歩していますが、固有名詞や業界用語、感情表現など、AIでは完璧に訳せない領域が必ず存在します。そこを必ず人がチェックし、最後はAIと人の組み合わせで生成するモデルになっています。
現在、AIを使ってリアルタイムに翻訳するスタートアップのサービスは多いと思いますが、私たちはあえて「リアルタイム」を捨てています。人の手を入れて翻訳精度を100%にし、正しい情報を正しく動画で伝えるということにフォーカスしているのが決定的な違いです。代表の留学生仲間や帰国子女、パートナー会社と提携することで、37言語に対応しており、商業利用に耐えうる品質を提供しています。
Q. 様々なAIを組み合わせて動画を作成されているとのことですが、具体的にどのようにAIを使い分け、制作されているのでしょうか?
早見さん: 一口でAIと言っても種類は多く、それぞれ強みと弱みが全く異なります。ガイド動画なのか、エンタメ系なのか、複数人が話すのかなど、動画の用途によって最適なAIをチョイスしたり、複数を組み合わせたりしています。最後に人が翻訳、発音、イントネーション、抑揚や感情表現のチェックと修正を行って完成させます。
これを実現できている背景には、代表である弟がアメリカに拠点を置いていることが大きく関係しています。彼は東京大学を卒業後、アメリカを拠点に活動しています。現地でHeyGenやElevenLabsの幹部とも定期的に対話の機会を持っており、最先端のAI情報を常にキャッチアップできる体制が整っています。
30秒10,000円の買い切り価格。中小企業や個人店にこそ使ってほしい
Q. 幅広い業界で使われているとのことですが、料金設定についても教えていただけますか?
早見さん: 多くの人に使っていただくため、誰でも使える価格設定を目指しました。完全な買い切りモデルで提供しており、料金体系は以下のようになっています。
| プラン | 料金(30秒あたり) | 特徴 |
| リップシンクなし | 5,000円 | 音声のみを多言語化 |
| リップシンクあり | 10,000円 | 話者の唇の動きも言語に合わせて修正 |
私と弟がずっと話し合っていたのは、飲食店や街のお蕎麦屋さんなどの個人店にこそ使っていただきたいという思いです。インバウンド対応で困っている方々が、言語の壁をなくすために気軽に試せるよう、30秒10,000円という価格に設定しました。現在ではアニメやエンタメ系、大企業の社内研修など用途は多岐にわたっていますが、起業の原点はこの価格設定に表れています。1回使うのに数十万円もかかるサービスではないので、まずは1本試していただきたいですね。動画の二次利用も自由に行っていただけます。リップシンクなしの場合は、30秒5,000円でご利用いただけます。
▼プランの詳細はこちら
https://www.konnichihello.com/plan/
飲食店からホテル、大手企業まで。具体的な導入事例と圧倒的な成果
Q. 実際に導入されている企業では、どのような成果が出ているのでしょうか?具体的な活用事例を教えてください。
早見さん: まず、私たちの原点でもあるインバウンド向けの事例として、築地のお蕎麦屋さんの事例があります。店主がお店の歴史やこだわりについて話す動画を多言語化し、Googleマップに掲載したところ、それだけで海外のお客様が1.5倍に増えました。海外の方は「麺類=ラーメン」というイメージを持っていることが多く、お蕎麦屋さんに入ってきてトラブルになることもあったそうです。正しいお店のプロモーションを行うことで、そうしたミスマッチも防げています。面白い工夫として、この動画ではあえて「日本人が頑張って喋っているような英語と中国語」で生成し、店主の人間味を残す調整を行いました。
また、アウトバウンドの事例として某大手化粧品メーカーにも導入いただいています。美容部員が日本語で話す縦型動画を多言語化し、中国のSNSや現地の店頭モニターで流しています。化粧品業界特有の専門用語など、AIだけでは正しく翻訳できない部分を、ネイティブが翻訳を行うことで高品質な動画制作を実現しています。
ファイテン様の事例では、販売員の方の抑揚のある話し方やトーンを崩さずに多言語化しました。店舗の商品棚に英語や中国語のQRコードを用意し、お客様がスマホでかざして見るという活用法で成果を上げています。他にも、美術館の館長が館内を回りながら説明する30分間の長尺ガイド動画を多言語化し、来館者がラジオ感覚で音声を聞きながら展示を楽しめるようにした事例や、お遍路の88箇所の札所を8言語に翻訳する大規模な観光プロジェクトなども進行しています。
Q. アパホテル様のような大規模な導入事例もあると伺いました。
早見さん: アパホテル様には、客室案内動画の多言語化で全面導入していただいています。Wi-Fiの接続方法やアメニティの場所などを案内する動画で、チェックイン時に提示されるパスポートから言語を判別し、客室のテレビでその国の言語の案内動画を自動で流すというシステムに組み込まれて活用されています。
もともとアパホテル様は、それぞれの言語を話せるスタッフに実際に喋らせて動画を撮影していましたが、時間もお金もかかっていました。私たちのサービスなら、1分間のリップシンクあり動画が1言語2万円で作れます。3言語分でも6万円で済み、かつ3営業日後に納品できるため、圧倒的に早くて安いと評価いただいています。
今後はエンタメ領域に注力しつつ、”世界への架け橋”として裾野を広げたい
Q. 今後さらに力を入れていきたい領域や、事業の展望について教えてください。
早見さん: 今後一番力を入れていきたいのは、映画やアニメなどのエンタメ領域です。例えばアニメなら1話3分だとしても複数話、複数シリーズがあり、ボリュームが非常に大きくなります。何より、エンタメは「作品」であるため、AIだけで作ったものをそのまま世に出す時代は一生来ないと私たちは考えています。キャラクターの声を担当する声優さんの雰囲気を残したまま多言語化するなど、まさに「人が介在する」という私たちの最大の強みを発揮できる領域です。すでに某テレビ局と共同で、日本のお笑い番組を7言語に翻訳してYouTubeで世界に発信するプロジェクトも進んでおり、登録者も27万人規模に成長しています。
一方で、私たちの企業理念は「世界への架け橋、あなたの声で」というものです。エンタメ領域の導入を増やしつつ、起業の原点である小さな飲食店、ホテル、旅館、クリニックなど、インバウンド対応で困っているあらゆる方々に、幅広く手軽に使っていただきたいという思いは変わりません。これからも規模の大小を問わず、言語の壁をなくすための支援を続けていきたいと考えています。