Google I/O 2026の目玉として「Gemini Omni」が発表された。Geminiの推論能力とDeepMindの創造系モデル(Nano Banana / Veo / Genie 等)を統合し、テキスト・画像・音声・動画を単一プロンプトで受け取って「動画を生成し、会話で編集する」ことを実現する次世代マルチモーダルモデル。
デモは衝撃的で、キャラクターの一貫性を保ったまま「彫刻をシャボン玉に変換」「鏡を液体のように波打たせて、人の腕を鏡の素材に変える」など、これまで専用ツールで何時間もかかった編集が会話一発で完結。物理シミュレーション精度・複数ターン編集(文脈保持)・複数入力参照という3点で既存モデルと一線を画す。
提供は本日5/20から。Google AI Plus / Pro / Ultra サブスクライバーは Gemini アプリ・Google Flow で即日利用可。さらに **YouTube Shorts / YouTube Create アプリでは今週中に無料開放**される。開発者・エンタープライズ向け API は数週間内に展開予定。HNでは公式ページが285ポイントを集めフロントページ入り、Xでは「Sora 2亡き後の動画AI覇権が交代した」との議論が再燃している。