谷歌在今日 I/O 大会上推出 Gemini Omni（Omni 意为“全能”），这是 Gemini 家族迄今最全面的多模态模型，由 DeepMind 负责人 Demis Hassabis 介绍核心能力：任意输入 → 任意输出：无缝处理文字、图像、视频、音频等模态

11:50 · 2026年5月20日 · 周三

谷歌在今日 I/O 大会上推出 Gemini Omni（Omni 意为“全能”），

这是 Gemini 家族迄今最全面的多模态模型，由 DeepMind 负责人 Demis Hassabis 介绍

核心能力：
任意输入 → 任意输出：无缝处理文字、图像、视频、音频等模态。
对话式视频编辑：一句话即可修改视频中的角色、背景等元素，极其便捷。

首款落地版本 Gemini Omni Flash 已即日起上线，支持 Gemini App、Google Flow、YouTube Shorts，后续将开放 API。
这是谷歌在多模态统一与生成能力上的重大突破。

京东🧧每天抽 3 次：点此抽取
淘宝🧧每天抽 1 次：点此抽取
标签:#gemini
Created by RocM
官方频道:@rocCHL
官方群组:@roctech
官方合作:@rocmmbot

Video is too big

via XP Digital Lab - Telegram Channel (author: RocM 不私聊任何人“小心骗子”)