DEEP DIVE

Google Flow 完全ガイド
AI画像・動画生成の統合クリエイティブ環境

Nano Banana 2 × Veo 3.1 × Whisk × ImageFX — すべてが一つに
2026年3月11日 | shobobo リサーチ

Contents

  1. Google Flowとは何か
  2. 搭載AIモデル(Nano Banana 2 / Veo 3.1 / Gemini)
  3. 統合ツール(Whisk / ImageFX)
  4. 制作ワークフロー
  5. 主要機能の詳細
  6. 料金プラン
  7. 競合比較(Runway / Sora / Kling / Pika)
  8. 現時点での制限事項
  9. shobobo的活用ポイント
  10. 公式リンク集

1. Google Flowとは何か

Google Flowは、2026年2月25日にGoogleが大幅リニューアルしたAIクリエイティブスタジオ。 もともと動画生成ツールだったFlowに、画像生成のImageFXとビジュアルリミックスのWhiskを統合し、 「アイデア → 画像 → 動画 → 編集 → 書き出し」を一つのワークスペースで完結させるプラットフォームに進化した。

一言で言うと:Photoshop + Premiere Pro + Midjourney のAI版を一つにまとめたようなもの。 テキストを打つだけで画像も動画も作れて、細かい編集もその場でできる。しかも画像生成は無料。
15億+
累計生成数(画像+動画)
140+
対応国・地域
3ツール
統合(Flow + Whisk + ImageFX)
無料〜
画像生成は無料
画像生成 動画生成 ネイティブ音声 スタイル転写 タイムライン編集 4K対応 商用利用可

2. 搭載AIモデル

Google FlowはGoogleの最新AIモデル3つを組み合わせて動作する。

🍌
Nano Banana 2(画像生成)
2026年2月26日発表 — Gemini 3.1 Flash Imageベース

Google DeepMindが開発した最新の画像生成モデル。Nano Banana Proの高品質とGemini Flashの高速性を兼ね備える。 名前は「バナナ」だが、Googleの画像生成AIの正式なブランド名である。

主な特徴

  • 解像度:512pxから最大4K(3840×2160)まで対応。複数アスペクト比に対応
  • キャラクター一貫性:最大5キャラクターの外見を1つのワークフロー内で維持可能
  • オブジェクト忠実度:1シーンに最大14オブジェクトまで正確に描写
  • テキスト描画:画像内に正確で読みやすいテキストを生成。多言語翻訳・ローカライズも可能
  • リアルタイム知識:Web検索と連動し、最新の情報を反映した画像を生成
  • 生成速度:Flashモデルベースのため、旧モデルより大幅に高速化
  • 料金:Flow内での画像生成は無料
ポイント:生成した画像をそのままVeo 3.1の「素材(ingredient)」として動画生成に投入できる。 これにより「画像→動画」の一貫したビジュアルが実現する。
🎬
Veo 3.1(動画生成)
2025年10月初公開 → 2026年1月13日 大型アップデート

Google DeepMindの動画生成モデル。テキストから動画、画像から動画、シーン延長など多彩な機能を持つ。 2026年1月のアップデートで「Ingredients to Video」機能が追加され、参照画像を元にした一貫性のある動画生成が可能に。

主な特徴

  • 解像度:ネイティブ1080p出力。アップスケールで4K(3840×2160)対応 — 主流AI動画モデル初の真4K
  • 動画尺:1回の生成で4秒・6秒・8秒。シーン延長で60秒以上も可能
  • アスペクト比:16:9(横)と9:16(縦=YouTube Shorts対応)
  • ネイティブ音声生成:環境音・効果音・会話音声を自動生成。リップシンク精度は120ms以下
  • Ingredients to Video:参照画像(キャラ・背景・小物)を「素材」として指定し、一貫したビジュアルの動画を生成
  • シーン延長:前のクリップの最終1秒を参照して次のクリップを生成。つなぎ目のないロング動画が作れる
  • カメラ制御:パン・ズーム・ティルトなどのカメラワークをプロンプトで指定可能
  • 出力形式:MP4、WebM、フレームシーケンス
注目:音声のネイティブ生成がVeo 3.1の大きな差別化ポイント。 画面上のアクションと音声が自然に同期し、会話もリップシンクされる。 後から別ツールで音を当てる必要がない。
💎
Gemini(言語理解・プロンプト解釈)
裏方としてプロンプトの意図を理解し、生成を最適化

ユーザーが入力した自然言語プロンプトを解釈し、Nano BananaやVeoに最適な指示を渡す役割を担う。 「夕暮れの渋谷でネコが歩いてる」のような曖昧な指示でも、シーンの構図・光・雰囲気を補完してくれる。

3. 統合ツール(Whisk / ImageFX)

以前は独立していたWhiskとImageFXがFlowに統合された。 2026年3月から、既存のWhisk/ImageFXプロジェクトをFlowのライブラリに移行できる。

🎨
Whisk(ビジュアルリミックス・ムードボード)
画像ベースのスタイル転写ツール

テキストではなく画像を入力として使うのが最大の特徴。 3つの「素材」を組み合わせて新しい画像を生成する。

  • Subject(被写体):「何を」描くか — キャラクター・人物・オブジェクト
  • Scene(シーン):「どこに」置くか — 背景・環境・場所
  • Style(スタイル):「どんな雰囲気で」描くか — 画風・テイスト・色調

3枚の画像をアップロードするだけで、それらを融合した新しい画像が生成される。 テキストプロンプトを書くのが苦手でも、参考画像を見せるだけで意図が伝わる。

Flow内での役割:Whiskで作ったムードボードの雰囲気が、そのまま動画生成のビジュアルスタイルに反映される。 テキストプロンプトだけでは伝えにくい「空気感」を、画像で直接指定できる。
ImageFX(テキスト→画像生成)
テキストプロンプトから高品質画像を生成

従来のImageFXの役割は、Flow内ではNano Banana 2に引き継がれている。 テキストで「サイバーパンクな東京の夜景」と打てば、即座に高精細画像が生成される。 生成した画像はそのままVeo 3.1の動画素材として活用可能。

4. 制作ワークフロー

Google Flowの核心は「一気通貫」のパイプライン。ツール間の行き来が不要になった。

1 🎨
ムードボード
Whiskで参考画像を
組み合わせて
世界観を固める
2 🖼️
画像生成
Nano Banana 2で
キーフレーム画像を
生成(無料)
3 🎬
動画生成
Veo 3.1で
画像→動画に変換
音声も自動生成
4 ✂️
編集・書き出し
タイムラインで
トリミング・並べ替え
MP4/WebM出力
従来:Midjourney(画像) → ダウンロード → Runway(動画化) → ダウンロード → Premiere(編集) → 書き出し
Flow:画像生成 → 動画化 → 編集 → 書き出し ← 全部Flow内で完結

5. 主要機能の詳細

🔧
精密編集ツール
  • 投げ縄(Lasso)選択:画像の特定部分を囲んで「この人を消して」「鯉を追加して」と自然言語で指示。部分的な修正が可能
  • 描画編集(Draw-to-Edit):直接描き込みで編集指示
  • 動画内オブジェクト追加/削除:生成済み動画のシーン内の要素を変更
  • カメラモーション制御:パン・ズーム・ティルトをプロンプトで指定
📁
アセット管理
  • プロジェクト構造:スタイル設定・キャラクター設定・ビジュアル参照がプロジェクト内で保持される
  • アセットグリッド:生成物をグリッド表示で一覧管理。コレクションにグループ化可能
  • @参照:プロンプト内で「@キャラA」のように過去のアセットを直接参照できる
  • 検索・フィルタ:大量の生成物から目的のものを素早く見つけられる
🎞️
タイムライン編集
  • マルチクリップ配置:複数のAI生成クリップをタイムライン上に配置
  • 自動トランジション:クリップ間のトランジションを自動生成
  • トリミング・並び替え:不要部分のカットとシーケンス調整
  • 60秒以上の動画:シーン延長を繰り返すことで長尺動画を構築(約8クレジットで60秒)
🔊
ネイティブ音声生成(Veo 3.1)
  • 環境音:シーンに合った環境音(雨音、街の喧騒、鳥のさえずりなど)を自動生成
  • 効果音:画面内のアクションに同期した効果音
  • 会話音声:キャラクターの台詞をリップシンク付きで生成(120ms以下の精度)
  • 音楽的な要素:シーンの雰囲気に合ったアンビエントサウンド

6. 料金プラン

Free
$0
初回100クレジット + 日50クレジット
  • 画像生成は無料
  • 動画生成は制限あり
  • 基本的なワークフロー
AI Plus
$7.99
/月
  • 追加クレジット
  • 標準機能
AI Pro
$19.99
/月
  • 大幅なクレジット増
  • 全機能利用可
  • 商用利用OK
AI Ultra
$249.99
/月
  • 最大クレジット
  • 全機能利用可
  • 商用利用OK
  • 最優先キュー
注意:未使用クレジットは翌月に繰り越されない。 有料プランのサブスクライバーはGoogleの利用規約に基づく商用利用権が付与される(広告・マーケティング・コンテンツ配信に利用可能)。 APIは別体系で、Veo 3.1 APIは生成動画1秒あたり約$0.75。

7. 競合サービスとの比較

項目 Google Flow
(Veo 3.1)
Runway
Gen-4.5
OpenAI
Sora 2
Kling
2.6
Pika
2.5
最大解像度 4K 4K 1080p 1080p 1080p
最大尺 60秒+(延長) 40秒 20秒 10秒 10秒
音声生成 ネイティブ対応 なし なし ネイティブ対応 なし
画像→動画 Ingredients対応 対応 対応 対応 対応
画像生成内蔵 あり(無料) なし あり なし なし
編集機能 タイムライン編集 モーションブラシ リミックス マルチショット 編集モード
無料枠 あり なし 制限付き あり あり
料金 $0〜$249.99/月 $12〜/月 $20〜/月 $5.99〜/月 $8〜/月
強み 統合ワークフロー
4K・音声・無料画像
映像品質No.1
ベンチマーク首位
シネマティック品質
物理表現
超高速生成
ネイティブ音声
最速生成(30-90秒)
手軽さ
Google Flowの競争優位: 「画像生成(無料)→ 動画変換 → 編集 → 書き出し」の全パイプラインを1プラットフォームで提供しているのはFlowだけ。 他サービスは動画生成単体では優れていても、画像生成は別ツール、編集はさらに別ツールが必要になる。

8. 現時点での制限事項

⚠️
知っておくべき制限
  • 自分の動画のアップロード不可:現時点では外部動画をFlowに取り込んで編集することができない。Googleはロードマップに入っていると表明しているがタイムラインは未定
  • タイムライン編集は基本的:Premiere ProやDaVinci Resolveのような本格的な編集機能はない。トリミング・並び替え・トランジション程度
  • API非公開(Flow自体):Flow UIの操作を自動化するAPIは提供されていない(Veo 3.1のAPIは別途利用可能)
  • チーム共同作業機能なし:複数人での同時編集やプロジェクト共有機能は未実装
  • ベータ版の安定性:まだベータ段階のため、生成の失敗やUIの不具合が報告されている
  • クレジット消費:60秒動画で約8クレジット消費。無料枠では数本の動画で使い切ってしまう
  • 1回の生成は最大8秒:長い動画はシーン延長を繰り返す必要がある

9. shobobo的活用ポイント

🎯
YouTube事業での活用
  • サムネイル制作:Nano Banana 2で高品質サムネイルを無料で量産。キャラクター一貫性機能でシリーズもののサムネを統一できる
  • ショート動画の素材:Veo 3.1の9:16(縦型)出力でYouTube Shorts素材をそのまま生成
  • イメージボード作成:Whiskで参考画像を組み合わせて、動画の世界観を事前にビジュアル化
  • 効果音・環境音の自動生成:ネイティブ音声生成により、別途音源を探す手間が省ける
💡
試してみるべきこと
  • まず無料枠でNano Banana 2の画像生成品質を確認
  • Whiskでキャラクターの参考画像3枚(Subject/Scene/Style)を試してみる
  • 画像→Veo 3.1で動画化のパイプラインを一通り体験
  • シーン延長で10秒以上のクリップを作ってみる
  • YouTube Shorts向け縦型動画の品質を確認