Google Flow 完全ガイド — AI画像・動画生成の統合クリエイティブ環境

1. Google Flowとは何か

Google Flowは、2026年2月25日にGoogleが大幅リニューアルしたAIクリエイティブスタジオ。もともと動画生成ツールだったFlowに、画像生成のImageFXとビジュアルリミックスのWhiskを統合し、 「アイデア → 画像 → 動画 → 編集 → 書き出し」を一つのワークスペースで完結させるプラットフォームに進化した。

一言で言うと：Photoshop + Premiere Pro + Midjourney のAI版を一つにまとめたようなもの。テキストを打つだけで画像も動画も作れて、細かい編集もその場でできる。しかも画像生成は無料。

15億+

累計生成数（画像＋動画）

140+

対応国・地域

3ツール

統合（Flow + Whisk + ImageFX）

無料〜

画像生成は無料

画像生成動画生成ネイティブ音声スタイル転写タイムライン編集 4K対応商用利用可

2. 搭載AIモデル

Google FlowはGoogleの最新AIモデル3つを組み合わせて動作する。

🍌

Nano Banana 2（画像生成）

2026年2月26日発表 — Gemini 3.1 Flash Imageベース

Google DeepMindが開発した最新の画像生成モデル。Nano Banana Proの高品質とGemini Flashの高速性を兼ね備える。名前は「バナナ」だが、Googleの画像生成AIの正式なブランド名である。

主な特徴

解像度：512pxから最大4K（3840×2160）まで対応。複数アスペクト比に対応
キャラクター一貫性：最大5キャラクターの外見を1つのワークフロー内で維持可能
オブジェクト忠実度：1シーンに最大14オブジェクトまで正確に描写
テキスト描画：画像内に正確で読みやすいテキストを生成。多言語翻訳・ローカライズも可能
リアルタイム知識：Web検索と連動し、最新の情報を反映した画像を生成
生成速度：Flashモデルベースのため、旧モデルより大幅に高速化
料金：Flow内での画像生成は無料

ポイント：生成した画像をそのままVeo 3.1の「素材（ingredient）」として動画生成に投入できる。これにより「画像→動画」の一貫したビジュアルが実現する。

🎬

Veo 3.1（動画生成）

2025年10月初公開 → 2026年1月13日大型アップデート

Google DeepMindの動画生成モデル。テキストから動画、画像から動画、シーン延長など多彩な機能を持つ。 2026年1月のアップデートで「Ingredients to Video」機能が追加され、参照画像を元にした一貫性のある動画生成が可能に。

主な特徴

解像度：ネイティブ1080p出力。アップスケールで4K（3840×2160）対応 — 主流AI動画モデル初の真4K
動画尺：1回の生成で4秒・6秒・8秒。シーン延長で60秒以上も可能
アスペクト比：16:9（横）と9:16（縦＝YouTube Shorts対応）
ネイティブ音声生成：環境音・効果音・会話音声を自動生成。リップシンク精度は120ms以下
Ingredients to Video：参照画像（キャラ・背景・小物）を「素材」として指定し、一貫したビジュアルの動画を生成
シーン延長：前のクリップの最終1秒を参照して次のクリップを生成。つなぎ目のないロング動画が作れる
カメラ制御：パン・ズーム・ティルトなどのカメラワークをプロンプトで指定可能
出力形式：MP4、WebM、フレームシーケンス

注目：音声のネイティブ生成がVeo 3.1の大きな差別化ポイント。画面上のアクションと音声が自然に同期し、会話もリップシンクされる。後から別ツールで音を当てる必要がない。

💎

Gemini（言語理解・プロンプト解釈）

裏方としてプロンプトの意図を理解し、生成を最適化

ユーザーが入力した自然言語プロンプトを解釈し、Nano BananaやVeoに最適な指示を渡す役割を担う。「夕暮れの渋谷でネコが歩いてる」のような曖昧な指示でも、シーンの構図・光・雰囲気を補完してくれる。

3. 統合ツール（Whisk / ImageFX）

以前は独立していたWhiskとImageFXがFlowに統合された。 2026年3月から、既存のWhisk/ImageFXプロジェクトをFlowのライブラリに移行できる。

🎨

Whisk（ビジュアルリミックス・ムードボード）

画像ベースのスタイル転写ツール

テキストではなく画像を入力として使うのが最大の特徴。 3つの「素材」を組み合わせて新しい画像を生成する。

Subject（被写体）：「何を」描くか — キャラクター・人物・オブジェクト
Scene（シーン）：「どこに」置くか — 背景・環境・場所
Style（スタイル）：「どんな雰囲気で」描くか — 画風・テイスト・色調

3枚の画像をアップロードするだけで、それらを融合した新しい画像が生成される。テキストプロンプトを書くのが苦手でも、参考画像を見せるだけで意図が伝わる。

Flow内での役割：Whiskで作ったムードボードの雰囲気が、そのまま動画生成のビジュアルスタイルに反映される。テキストプロンプトだけでは伝えにくい「空気感」を、画像で直接指定できる。

✨

ImageFX（テキスト→画像生成）

テキストプロンプトから高品質画像を生成

従来のImageFXの役割は、Flow内ではNano Banana 2に引き継がれている。テキストで「サイバーパンクな東京の夜景」と打てば、即座に高精細画像が生成される。生成した画像はそのままVeo 3.1の動画素材として活用可能。

4. 制作ワークフロー

Google Flowの核心は「一気通貫」のパイプライン。ツール間の行き来が不要になった。

1 🎨

ムードボード

Whiskで参考画像を
組み合わせて
世界観を固める

→

2 🖼️

画像生成

Nano Banana 2で
キーフレーム画像を
生成（無料）

→

3 🎬

動画生成

Veo 3.1で
画像→動画に変換
音声も自動生成

→

4 ✂️

編集・書き出し

タイムラインで
トリミング・並べ替え
MP4/WebM出力

従来：Midjourney(画像) → ダウンロード → Runway(動画化) → ダウンロード → Premiere(編集) → 書き出し
Flow：画像生成 → 動画化 → 編集 → 書き出し ← 全部Flow内で完結

5. 主要機能の詳細

🔧

精密編集ツール

投げ縄（Lasso）選択：画像の特定部分を囲んで「この人を消して」「鯉を追加して」と自然言語で指示。部分的な修正が可能
描画編集（Draw-to-Edit）：直接描き込みで編集指示
動画内オブジェクト追加/削除：生成済み動画のシーン内の要素を変更
カメラモーション制御：パン・ズーム・ティルトをプロンプトで指定

📁

アセット管理

プロジェクト構造：スタイル設定・キャラクター設定・ビジュアル参照がプロジェクト内で保持される
アセットグリッド：生成物をグリッド表示で一覧管理。コレクションにグループ化可能
@参照：プロンプト内で「@キャラA」のように過去のアセットを直接参照できる
検索・フィルタ：大量の生成物から目的のものを素早く見つけられる

🎞️

タイムライン編集

マルチクリップ配置：複数のAI生成クリップをタイムライン上に配置
自動トランジション：クリップ間のトランジションを自動生成
トリミング・並び替え：不要部分のカットとシーケンス調整
60秒以上の動画：シーン延長を繰り返すことで長尺動画を構築（約8クレジットで60秒）

🔊

ネイティブ音声生成（Veo 3.1）

環境音：シーンに合った環境音（雨音、街の喧騒、鳥のさえずりなど）を自動生成
効果音：画面内のアクションに同期した効果音
会話音声：キャラクターの台詞をリップシンク付きで生成（120ms以下の精度）
音楽的な要素：シーンの雰囲気に合ったアンビエントサウンド

6. 料金プラン

Free

$0

初回100クレジット + 日50クレジット

画像生成は無料
動画生成は制限あり
基本的なワークフロー

AI Plus

$7.99

/月

追加クレジット
標準機能

AI Pro
$19.99
/月
大幅なクレジット増
全機能利用可
商用利用OK

AI Ultra

$249.99

/月

最大クレジット
全機能利用可
商用利用OK
最優先キュー

注意：未使用クレジットは翌月に繰り越されない。有料プランのサブスクライバーはGoogleの利用規約に基づく商用利用権が付与される（広告・マーケティング・コンテンツ配信に利用可能）。 APIは別体系で、Veo 3.1 APIは生成動画1秒あたり約$0.75。

7. 競合サービスとの比較

項目	Google Flow (Veo 3.1)	Runway Gen-4.5	OpenAI Sora 2	Kling 2.6	Pika 2.5
最大解像度	4K	4K	1080p	1080p	1080p
最大尺	60秒+（延長）	40秒	20秒	10秒	10秒
音声生成	ネイティブ対応	なし	なし	ネイティブ対応	なし
画像→動画	Ingredients対応	対応	対応	対応	対応
画像生成内蔵	あり（無料）	なし	あり	なし	なし
編集機能	タイムライン編集	モーションブラシ	リミックス	マルチショット	編集モード
無料枠	あり	なし	制限付き	あり	あり
料金	$0〜$249.99/月	$12〜/月	$20〜/月	$5.99〜/月	$8〜/月
強み	統合ワークフロー 4K・音声・無料画像	映像品質No.1 ベンチマーク首位	シネマティック品質物理表現	超高速生成ネイティブ音声	最速生成（30-90秒）手軽さ

Google Flowの競争優位： 「画像生成（無料）→ 動画変換 → 編集 → 書き出し」の全パイプラインを1プラットフォームで提供しているのはFlowだけ。他サービスは動画生成単体では優れていても、画像生成は別ツール、編集はさらに別ツールが必要になる。

8. 現時点での制限事項

⚠️

知っておくべき制限

自分の動画のアップロード不可：現時点では外部動画をFlowに取り込んで編集することができない。Googleはロードマップに入っていると表明しているがタイムラインは未定
タイムライン編集は基本的：Premiere ProやDaVinci Resolveのような本格的な編集機能はない。トリミング・並び替え・トランジション程度
API非公開（Flow自体）：Flow UIの操作を自動化するAPIは提供されていない（Veo 3.1のAPIは別途利用可能）
チーム共同作業機能なし：複数人での同時編集やプロジェクト共有機能は未実装
ベータ版の安定性：まだベータ段階のため、生成の失敗やUIの不具合が報告されている
クレジット消費：60秒動画で約8クレジット消費。無料枠では数本の動画で使い切ってしまう
1回の生成は最大8秒：長い動画はシーン延長を繰り返す必要がある

9. shobobo的活用ポイント

🎯

YouTube事業での活用

サムネイル制作：Nano Banana 2で高品質サムネイルを無料で量産。キャラクター一貫性機能でシリーズもののサムネを統一できる
ショート動画の素材：Veo 3.1の9:16（縦型）出力でYouTube Shorts素材をそのまま生成
イメージボード作成：Whiskで参考画像を組み合わせて、動画の世界観を事前にビジュアル化
効果音・環境音の自動生成：ネイティブ音声生成により、別途音源を探す手間が省ける

💡

試してみるべきこと

まず無料枠でNano Banana 2の画像生成品質を確認
Whiskでキャラクターの参考画像3枚（Subject/Scene/Style）を試してみる
画像→Veo 3.1で動画化のパイプラインを一通り体験
シーン延長で10秒以上のクリップを作ってみる
YouTube Shorts向け縦型動画の品質を確認

10. 公式リンク・参考情報

Google Flow（公式） Flow公式アナウンス Nano Banana 2 Veo 3.1 Ingredients to Video

Google Flow 完全ガイド
AI画像・動画生成の統合クリエイティブ環境

Contents

1. Google Flowとは何か

2. 搭載AIモデル

主な特徴

主な特徴

3. 統合ツール（Whisk / ImageFX）

4. 制作ワークフロー

5. 主要機能の詳細

6. 料金プラン

7. 競合サービスとの比較

8. 現時点での制限事項

9. shobobo的活用ポイント

10. 公式リンク・参考情報

参考記事

Google Flow 完全ガイドAI画像・動画生成の統合クリエイティブ環境

Contents

1. Google Flowとは何か

2. 搭載AIモデル

主な特徴

主な特徴

3. 統合ツール（Whisk / ImageFX）

4. 制作ワークフロー

5. 主要機能の詳細

6. 料金プラン

7. 競合サービスとの比較

8. 現時点での制限事項

9. shobobo的活用ポイント

10. 公式リンク・参考情報

参考記事

Google Flow 完全ガイド
AI画像・動画生成の統合クリエイティブ環境