GoogleがAI動画生成モデル「Veo 3.1 Lite」を2026年3月31日に発表しました。Gemini APIとGoogle AI Studio経由で即日提供が開始されており、Veo 3.1シリーズの中で最もコストを抑えられるモデルとして位置づけられています。
この記事では、Veo 3.1 Liteの概要から他モデルとの比較、おすすめの使い方まで詳しく解説します。
Veo 3.1 Liteとは
Veo 3.1 Liteは、Google DeepMindが開発するAI動画生成モデル「Veo」シリーズの最新モデルです。テキストや画像を入力するだけで高品質な動画を自動生成でき、Gemini APIを通じて開発者が自社プロダクトに組み込んで使うことができます。

引用:Google
「Lite」という名称から生成速度が遅いモデルを想像するかもしれませんが、実際には上位モデルのVeo 3.1 Fastと同等の速度を持ちながら、コストを大幅に抑えた設計になっています。大量の動画を生成するプロダクト開発や、アイデアを素早く形にするプロトタイピング用途に特化したモデルです。モデルコードは veo-3.1-lite-generate-previewで、テキストと画像を入力として受け付け、音声付き動画を出力します。
Veo 3.1シリーズごとの特徴・違い
今回のリリースにより、Veo 3.1シリーズはフル・Fast・Liteの3モデルでの提供となります。
| モデル | 最大解像度 | 最大尺 | 4K対応 | 音声生成 | 720p料金 | 1080p料金 | 4K料金 | 主な用途 |
|---|---|---|---|---|---|---|---|---|
| Veo 3.1 | 4K | 最長60秒 | ○ | ○ | ー | ー | $0.40 / 秒 | 最高品質の最終成果物 |
| Veo 3.1 Fast | 4K | ー | ○ | ○ | $0.10 / 秒 | $0.12 / 秒 | $0.30 / 秒 | 品質とコストのバランス重視 |
| Veo 3.1 Lite | 1080p | 最長8秒 | ー | ○ | $0.05 / 秒 | $0.08 / 秒 | 非対応 | 大量生成・コスト優先 |
※ Veo 3.1 Fastの料金は2026年4月7日以降の値下げ後の価格です。
2025年7月にVeo 3のAPIが初めて開放された際の価格は1秒あたり$0.75でした。Liteの登場によって、AI動画生成のコストは約1年で15分の1以下まで下がってきたことになります。
生成速度の観点では、実際の検証によると、Veo 3.1 Liteで8秒動画(最長)を生成した場合の所要時間は1分以内とされています。
品質面では、LiteとFastの差はそれほど大きくなく、フルモデルとFastの差のほうが顕著という評価もあります。
Veo3.1 Liteと他の動画生成AIの比較
Veo 3.1 Liteを他の主要なAI動画生成ツールと比較します。各ツールは対象ユーザーやユースケースが異なるため、単純な優劣ではなく「どんな用途に向いているか」という観点で整理しています。
| ツール | 強み | 価格帯 | APIアクセス |
|---|---|---|---|
| Veo 3.1 Lite | 低コスト・高速・音声付き動画 | $0.05〜/秒 | ✓(Gemini API) |
| Veo 3.1 / Fast | 最高品質・4K・長尺・音声同期 | $0.10〜/秒 | ✓(Gemini API) |
| Seedance 2.0 | マルチモーダル入力・高品質モーション・音声同期 | $9.60〜/月(※) | ✓(BytePlus) |
| Runway Gen-4.5 | クリエイティブコントロール・映像編集との統合 | $12〜/月 | ✓ |
| Kling AI(2.6) | フォトリアルなモーション・人物の動き | $6.99〜/月 | 一部対応 |
| Luma Dream Machine(Ray3) | 高速生成・空間的な奥行き感・建築・製品映像 | $7.99〜/月 | ✓ |
| Pika 2.5 | 操作の手軽さ・SNS向けスタイル動画 | $8〜/月 | 限定的 |
※ Seedance 2.0はByteDanceが2026年2月にリリースしたモデルですが、ハリウッドスタジオとの著作権問題からグローバルAPIのロールアウトが延期されており、2026年4月時点では一部地域・プラットフォームでのみ利用可能です。(参考:the-decoder.com)
Veo 3.1 Liteは「APIで大量に動画を生成したい開発者・企業」向けに最も最適化されています。音声を含む動画を1本あたり最低$0.20(720p・4秒)から生成できるコスト効率は、他ツールの月額サブスクリプションとは根本的に異なるアプローチです。
Seedance 2.0はテキスト・画像・動画・音声の最大12ファイルを同時に参照入力できるマルチモーダル設計が特徴で、品質面でもVeoに迫ると評されています。ただし現時点ではグローバルAPI提供が限定的です。Runway Gen-4.5は映像編集ツールとしての機能も充実しており、映像クリエイターや制作プロダクションに向いています。Kling AIは人物や物体のリアルなモーション品質で定評があります。Luma Dream Machineは空間的な奥行きを活かした建築・製品ビジュアルに強みを持ちます。
Veo 3.1 Liteの特徴5選
①Veo 3.1 Fastと同じ速度で、コストは50%以下
最大の特徴はコストパフォーマンスです。720pで1秒あたり$0.05という価格は、Veo 3.1 Fastの現行価格($0.15/秒)の3分の1以下です。それでいて生成速度はVeo 3.1 Fastと同等で、「Lite」という名前が示すような速度の低下はありません。
たとえば8秒の動画を720pで生成した場合、1本あたりのコストは$0.40です。同じ動画をVeo 3.1 Fastで生成すると$1.20かかるため、大量に生成するほどコスト差が広がります。月に1,000本の動画を量産するプロダクトであれば、LiteとFastの差は月額約800ドルにも上ります。スピードを落とさずにコストだけ下げたい開発者・企業にとって、実質的に最初の選択肢となるモデルです。
2. Text-to-VideoとImage-to-Videoの両方に対応
テキストプロンプトから動画を生成する「Text-to-Video」と、画像を起点に動画を生成する「Image-to-Video」の両方に対応しています。
Text-to-Videoは、場面や雰囲気をテキストで指定するだけで動画が生成されるため、イメージを素早く映像化したい場面に向いています。一方のImage-to-Videoは、すでに手元にある静止画を動かしたい場合に有効です。たとえば商品の物撮り写真を渡してカメラがゆっくりパンする映像を生成したり、ロゴ画像をアニメーションさせたりといった使い方ができます。静止画アセットが豊富な企業にとっては、既存素材をそのまま活かせる点が大きなメリットです。
3. 縦型・横型の両フォーマットに対応
横型(16:9)と縦型(9:16)のアスペクト比を選択できます。一見シンプルな仕様ですが、実運用上はかなり重要なポイントです。
多くのAI動画生成ツールは横型出力を基本としており、縦型に対応していなかったり、横型を後からトリミングするだけだったりするものが少なくありません。Veo 3.1 Liteは生成段階から縦型に対応しているため、InstagramリールやTikTok、YouTubeショートといったショート動画プラットフォーム向けのコンテンツを、画質の劣化やフレームの欠損なくそのまま生成できます。縦型コンテンツの量産を自動化したい場合、この対応は必須条件になります。
4. 音声付き動画を1パスで生成
Veo 3.1シリーズ全体の大きな強みの一つが、動画と音声を同時に生成できる点です。Veo 3.1 Liteもこの機能を引き継いでいます。
多くのAI動画生成ツールは映像のみを出力するため、音声は別途編集ソフトで追加する必要があります。これに対してVeo 3.1 Liteは、プロンプトの内容に合わせた環境音や効果音を映像と同時に生成します。たとえば波打ち際の映像であれば波音が、カフェの映像であれば雑踏の音が、自然に付随して出力されます。後処理の工数を減らしたい場面や、大量の動画をパイプラインで自動処理するワークフローでは、この「1パスで完結する」設計が大きく効いてきます。
5. SynthIDによるデジタル透かし対応
Veo 3.1 Liteで生成されたすべての動画には、Googleのデジタル透かし技術「SynthID」が自動的に付与されます。SynthIDは映像の見た目には影響しない形でAI生成であることを示すメタデータを埋め込む技術で、人間の目には判別できませんが、専用のツールで検出が可能です。
昨今、AI生成コンテンツの開示を義務づける規制や業界ガイドラインが各国で整備されつつあります。広告・マーケティング・メディア分野など、コンテンツの出所の明示が求められる用途においては、このような透かし機能がコンプライアンス対応の一助となります。自動で付与されるため、開発者側で特別な設定は不要です。
Veo 3.1 Liteのおすすめユースケース3選
① ECサイトの商品紹介動画を大量に自動生成する
ECサイトで扱う商品が数百・数千点に及ぶ場合、1本ずつ動画を制作するのは現実的ではありません。Veo 3.1 LiteのImage-to-Video機能を活用すれば、商品の静止画を入力として動きのある紹介映像を自動で量産できます。720pで1本(4秒)あたり$0.20というコストは、人手による撮影・編集と比べると大幅に安く、小売・EC事業者にとって現実的な選択肢になります。
② SNS向けショートクリップのパイプラインを組みたい
InstagramリールやTikTok、YouTubeショートなど、縦型ショート動画の需要は高まる一方です。
Veo 3.1 Liteは縦型(9:16)対応・4〜8秒の尺・Gemini APIからの呼び出しが揃っており、コンテンツ生成を自動化するパイプラインに組み込みやすい設計です。たとえば商品情報やキャンペーン内容をテキストで渡すと動画が自動生成される仕組みを構築すれば、SNS運用担当者の作業量を大幅に削減できます。
③ アイデア検討・プロトタイピングを繰り返したい
映像の方向性を固める段階では、複数のパターンを試しながらイメージを絞り込むことが多いです。上位モデルで何度も生成すると費用がかさみますが、Veo 3.1 Liteのコスト感であれば気軽に試行錯誤できます。クライアントへのコンテ提案や、広告クリエイティブの方向性確認など、最終品質よりも「スピードと本数」が重要な段階での利用に特に向いています。
Veo 3.1 Liteが向いていないユースケースも
①4K品質や長尺動画が必要な場合
Liteは最大1080p・最長8秒に制限されています。映像制作の最終納品物として4K品質が求められる案件や、30秒・1分といった長尺のムービーを作りたい場合はVeo 3.1(フルモデル)を選んでください。8秒という尺の上限は、SNSのショートクリップや短い商品紹介映像には十分ですが、ブランドフィルムや説明動画などには対応できません。
②映像のクリエイティブコントロールを細かくしたい場合
Veo 3.1 Liteはプロンプトと設定パラメータで動画を生成するモデルであり、シーン単位の編集・カット構成の指定・ブラシによる動きの細かい制御といった機能は持っていません。映像クリエイターが自分の意図を細かく反映させながら制作したい場合は、編集ツールとしての機能も充実しているRunway Gen-4.5や、Cupcut内で統合され使用することができるSeedance2.0の方が向いています。
③人物のリアルなモーションにこだわりたい場合
人物が登場する広告映像など、自然な身体の動きや表情の再現が重要な用途では、この分野で定評のあるKling AIも有力な候補です。
Kling AIは人物・物体のリアルなモーション生成に特化した設計で、フォトリアルな動きを求める案件での評価が高いです。
④建築・製品の空間表現を重視したい場合
建築ビジュアライゼーションや製品の立体的な見せ方など、空間的な奥行きやライティングの精度を重視する場合は、Luma Dream Machineが強みを発揮します。3D空間の把握に優れた設計が特徴で、カメラが物体の周囲を回り込むようなショットや、奥行きのある室内空間の描写で高い評価を得ています。
Veo 3.1 Liteの使い方
アクセス方法
Veo 3.1 LiteはGemini APIとGoogle AI Studioから利用できます。Geminiアプリからは利用できないため注意してください。
Google AI Studioでの基本的な使い方
- Google AI Studioにアクセスし、Googleアカウントでログインします。
- 有料ティアに切り替え、新しい動画生成プロンプトを作成します。
- モデルとして
veo-3.1-lite-generate-previewを選択します。 - テキストプロンプトを入力するか(Text-to-Video)、画像をアップロードして(Image-to-Video)動画を生成します。
- アスペクト比(16:9 または 9:16)、解像度(720p または 1080p)、尺(4秒・6秒・8秒)を設定して生成を開始します。
Gemini APIでの実装イメージ
APIを使った組み込みの詳細はGemini API 動画生成ドキュメントに記載されています。
モデル名として veo-3.1-lite-generate-preview を指定し、プロンプト・アスペクト比・解像度・尺をパラメーターとして渡す形で利用できます。
まとめ
今回は、Googleの動画生成モデル「Veo 3.1 Lite」について解説しました。
速度は落とさず、コストだけを大幅に下げる。この点がVeo 3.1 Liteの大きな特徴です。大量生成・量産パイプライン・プロトタイピングといった「品質よりも本数とコスト」が問われる用途に対し、720pで1秒$0.05という価格は十分に実用的な水準です。
ただし、Liteは万能ではありません。4Kや長尺が必要な場面ではフルモデルのVeo 3.1が、細かい映像制御が求めらるならRunway Gen-4.5が、それぞれより適した選択肢になります。用途によってモデルを使い分けることが、AI動画生成を現場で活かすための現実的なアプローチです。
まずはGoogle AI Studioで実際に生成してみて、自分のユースケースに合うかどうかを確かめてみてください。