Skip to main content

谷歌在今日 I/O 大会上推出 Gemini Omni(Omni 意为“全能”),这是 Gemini 家族迄今最全面的多模态模型,由 DeepMind 负责人 Demis Hassabis 介绍核心能力:任意输入 → 任意输出:无缝处理文字、图像、视频、音频等模态

  1. 谷歌在今日 I/O 大会上推出 Gemini Omni(Omni 意为“全能”),

    这是 Gemini 家族迄今最全面的多模态模型,由 DeepMind 负责人 Demis Hassabis 介绍

    核心能力:
    任意输入 → 任意输出:无缝处理文字、图像、视频、音频等模态。
    对话式视频编辑:一句话即可修改视频中的角色、背景等元素,极其便捷。

    首款落地版本 Gemini Omni Flash 已即日起上线,支持 Gemini App、Google Flow、YouTube Shorts,后续将开放 API。
    这是谷歌在多模态统一与生成能力上的重大突破。

    京东🧧每天抽 3 次:点此抽取
    淘宝🧧每天抽 1 次:点此抽取
    标签:#gemini
    Created by RocM
    官方频道:@rocCHL
    官方群组:@roctech
    官方合作:@rocmmbot
    Video is too big


    via XP Digital Lab - Telegram Channel (author: RocM 不私聊任何人“小心骗子”)
👀 open eyes to see the world. 丨 site views: -