1. Google Flowとは何か
Google Flowは、2026年2月25日にGoogleが大幅リニューアルしたAIクリエイティブスタジオ。
もともと動画生成ツールだったFlowに、画像生成のImageFXとビジュアルリミックスのWhiskを統合し、
「アイデア → 画像 → 動画 → 編集 → 書き出し」を一つのワークスペースで完結させるプラットフォームに進化した。
一言で言うと:Photoshop + Premiere Pro + Midjourney のAI版を一つにまとめたようなもの。
テキストを打つだけで画像も動画も作れて、細かい編集もその場でできる。しかも画像生成は無料。
3ツール
統合(Flow + Whisk + ImageFX)
画像生成
動画生成
ネイティブ音声
スタイル転写
タイムライン編集
4K対応
商用利用可
2. 搭載AIモデル
Google FlowはGoogleの最新AIモデル3つを組み合わせて動作する。
Google DeepMindが開発した最新の画像生成モデル。Nano Banana Proの高品質とGemini Flashの高速性を兼ね備える。
名前は「バナナ」だが、Googleの画像生成AIの正式なブランド名である。
主な特徴
- 解像度:512pxから最大4K(3840×2160)まで対応。複数アスペクト比に対応
- キャラクター一貫性:最大5キャラクターの外見を1つのワークフロー内で維持可能
- オブジェクト忠実度:1シーンに最大14オブジェクトまで正確に描写
- テキスト描画:画像内に正確で読みやすいテキストを生成。多言語翻訳・ローカライズも可能
- リアルタイム知識:Web検索と連動し、最新の情報を反映した画像を生成
- 生成速度:Flashモデルベースのため、旧モデルより大幅に高速化
- 料金:Flow内での画像生成は無料
ポイント:生成した画像をそのままVeo 3.1の「素材(ingredient)」として動画生成に投入できる。
これにより「画像→動画」の一貫したビジュアルが実現する。
Google DeepMindの動画生成モデル。テキストから動画、画像から動画、シーン延長など多彩な機能を持つ。
2026年1月のアップデートで「Ingredients to Video」機能が追加され、参照画像を元にした一貫性のある動画生成が可能に。
主な特徴
- 解像度:ネイティブ1080p出力。アップスケールで4K(3840×2160)対応 — 主流AI動画モデル初の真4K
- 動画尺:1回の生成で4秒・6秒・8秒。シーン延長で60秒以上も可能
- アスペクト比:16:9(横)と9:16(縦=YouTube Shorts対応)
- ネイティブ音声生成:環境音・効果音・会話音声を自動生成。リップシンク精度は120ms以下
- Ingredients to Video:参照画像(キャラ・背景・小物)を「素材」として指定し、一貫したビジュアルの動画を生成
- シーン延長:前のクリップの最終1秒を参照して次のクリップを生成。つなぎ目のないロング動画が作れる
- カメラ制御:パン・ズーム・ティルトなどのカメラワークをプロンプトで指定可能
- 出力形式:MP4、WebM、フレームシーケンス
注目:音声のネイティブ生成がVeo 3.1の大きな差別化ポイント。
画面上のアクションと音声が自然に同期し、会話もリップシンクされる。
後から別ツールで音を当てる必要がない。
ユーザーが入力した自然言語プロンプトを解釈し、Nano BananaやVeoに最適な指示を渡す役割を担う。
「夕暮れの渋谷でネコが歩いてる」のような曖昧な指示でも、シーンの構図・光・雰囲気を補完してくれる。
4. 制作ワークフロー
Google Flowの核心は「一気通貫」のパイプライン。ツール間の行き来が不要になった。
1
🎨
ムードボード
Whiskで参考画像を
組み合わせて
世界観を固める
→
2
🖼️
画像生成
Nano Banana 2で
キーフレーム画像を
生成(無料)
→
3
🎬
動画生成
Veo 3.1で
画像→動画に変換
音声も自動生成
→
4
✂️
編集・書き出し
タイムラインで
トリミング・並べ替え
MP4/WebM出力
従来:Midjourney(画像) → ダウンロード → Runway(動画化) → ダウンロード → Premiere(編集) → 書き出し
Flow:画像生成 → 動画化 → 編集 → 書き出し ← 全部Flow内で完結
5. 主要機能の詳細
- 投げ縄(Lasso)選択:画像の特定部分を囲んで「この人を消して」「鯉を追加して」と自然言語で指示。部分的な修正が可能
- 描画編集(Draw-to-Edit):直接描き込みで編集指示
- 動画内オブジェクト追加/削除:生成済み動画のシーン内の要素を変更
- カメラモーション制御:パン・ズーム・ティルトをプロンプトで指定
- プロジェクト構造:スタイル設定・キャラクター設定・ビジュアル参照がプロジェクト内で保持される
- アセットグリッド:生成物をグリッド表示で一覧管理。コレクションにグループ化可能
- @参照:プロンプト内で「@キャラA」のように過去のアセットを直接参照できる
- 検索・フィルタ:大量の生成物から目的のものを素早く見つけられる
- マルチクリップ配置:複数のAI生成クリップをタイムライン上に配置
- 自動トランジション:クリップ間のトランジションを自動生成
- トリミング・並び替え:不要部分のカットとシーケンス調整
- 60秒以上の動画:シーン延長を繰り返すことで長尺動画を構築(約8クレジットで60秒)
- 環境音:シーンに合った環境音(雨音、街の喧騒、鳥のさえずりなど)を自動生成
- 効果音:画面内のアクションに同期した効果音
- 会話音声:キャラクターの台詞をリップシンク付きで生成(120ms以下の精度)
- 音楽的な要素:シーンの雰囲気に合ったアンビエントサウンド
6. 料金プラン
Free
$0
初回100クレジット + 日50クレジット
- 画像生成は無料
- 動画生成は制限あり
- 基本的なワークフロー
AI Ultra
$249.99
/月
- 最大クレジット
- 全機能利用可
- 商用利用OK
- 最優先キュー
注意:未使用クレジットは翌月に繰り越されない。
有料プランのサブスクライバーはGoogleの利用規約に基づく商用利用権が付与される(広告・マーケティング・コンテンツ配信に利用可能)。
APIは別体系で、Veo 3.1 APIは生成動画1秒あたり約$0.75。
7. 競合サービスとの比較
| 項目 |
Google Flow (Veo 3.1) |
Runway Gen-4.5 |
OpenAI Sora 2 |
Kling 2.6 |
Pika 2.5 |
| 最大解像度 |
4K |
4K |
1080p |
1080p |
1080p |
| 最大尺 |
60秒+(延長) |
40秒 |
20秒 |
10秒 |
10秒 |
| 音声生成 |
ネイティブ対応 |
なし |
なし |
ネイティブ対応 |
なし |
| 画像→動画 |
Ingredients対応 |
対応 |
対応 |
対応 |
対応 |
| 画像生成内蔵 |
あり(無料) |
なし |
あり |
なし |
なし |
| 編集機能 |
タイムライン編集 |
モーションブラシ |
リミックス |
マルチショット |
編集モード |
| 無料枠 |
あり |
なし |
制限付き |
あり |
あり |
| 料金 |
$0〜$249.99/月 |
$12〜/月 |
$20〜/月 |
$5.99〜/月 |
$8〜/月 |
| 強み |
統合ワークフロー 4K・音声・無料画像 |
映像品質No.1 ベンチマーク首位 |
シネマティック品質 物理表現 |
超高速生成 ネイティブ音声 |
最速生成(30-90秒) 手軽さ |
Google Flowの競争優位:
「画像生成(無料)→ 動画変換 → 編集 → 書き出し」の全パイプラインを1プラットフォームで提供しているのはFlowだけ。
他サービスは動画生成単体では優れていても、画像生成は別ツール、編集はさらに別ツールが必要になる。
8. 現時点での制限事項
- 自分の動画のアップロード不可:現時点では外部動画をFlowに取り込んで編集することができない。Googleはロードマップに入っていると表明しているがタイムラインは未定
- タイムライン編集は基本的:Premiere ProやDaVinci Resolveのような本格的な編集機能はない。トリミング・並び替え・トランジション程度
- API非公開(Flow自体):Flow UIの操作を自動化するAPIは提供されていない(Veo 3.1のAPIは別途利用可能)
- チーム共同作業機能なし:複数人での同時編集やプロジェクト共有機能は未実装
- ベータ版の安定性:まだベータ段階のため、生成の失敗やUIの不具合が報告されている
- クレジット消費:60秒動画で約8クレジット消費。無料枠では数本の動画で使い切ってしまう
- 1回の生成は最大8秒:長い動画はシーン延長を繰り返す必要がある
9. shobobo的活用ポイント
- サムネイル制作:Nano Banana 2で高品質サムネイルを無料で量産。キャラクター一貫性機能でシリーズもののサムネを統一できる
- ショート動画の素材:Veo 3.1の9:16(縦型)出力でYouTube Shorts素材をそのまま生成
- イメージボード作成:Whiskで参考画像を組み合わせて、動画の世界観を事前にビジュアル化
- 効果音・環境音の自動生成:ネイティブ音声生成により、別途音源を探す手間が省ける
- まず無料枠でNano Banana 2の画像生成品質を確認
- Whiskでキャラクターの参考画像3枚(Subject/Scene/Style)を試してみる
- 画像→Veo 3.1で動画化のパイプラインを一通り体験
- シーン延長で10秒以上のクリップを作ってみる
- YouTube Shorts向け縦型動画の品質を確認