k8凯发天生赢家

新闻中心 新闻中心

一文看懂谷歌I/O2026:谷歌打响智能体大战

出品|《态度》

作者:罗志杰
颁布功夫:2026-06-01 13:07:37
阅读量:15

一文看懂谷歌I/O2026:谷歌打响智能体大战

出品|《态度》

作者|袁宁 丁广胜

山景城海岸线剧场 ,再次成为全球科技圈的焦点。

北京功夫5月20日凌晨1点 ,2026 Google I/O正式登场。这个能够包容两万多人的露天剧场 ,每年都一票难求。主会场坐满后 ,甚至有不少人坐到山坡草坪上 ,远了望向舞台 ,期待Google这位顶尖玩家亮牌。

现场的空气并不像一场传统开发者大会 ,更像一场巨大的科技派对。走进入口 ,工作人员会周到地和与会者击掌;入口左近有室表乐队表演;剧场表则是大片Demo展区 ,Google各条业务线和合作同伴都在展示自己的最新产品与利用 ,好比来自中国的Xreal?⒄摺⒚教濉⒋匆嫡摺⑼蹲嗜撕秃献魍榇┧笃渲 ,所有人都在期待统一个问题的答案:

在大模型竞争进入智能体阶段后 ,Google筹备怎么出牌?

从前一年 ,AI行业的叙事发生了显著变动。OpenAI 依然是焦点 ,但 Anthropic 在变得越来越 “抢镜”。据我们相识 ,某种水平上 ,Google 的“假想涤妆已经不再只是 OpenAI ,也起头越来越多地指向 Anthropic。

今天凌晨 ,Google CEO Sundar Pichai 给出了这次大会的主题叙事:“Gemini 3.5和 Antigravity 在开启一个智能体和智能体能力的新世界。我们已经把智能体带给开发者和企业一段功夫了。此刻 ,我们极度专一于把智能体的力量 ,以安全、靠得住的方式带给消费者 ,让它合用于每一幼我。”

在这次 I/O 上 ,Google 险些把所有主题业务线都重新用“智能体”串了一遍:从 Gemini 3.5 Flash ,到 Gemini Omni Flash;从 Search 里的信息智能体、预约智能体 ,到 Gemini App 里的24/7幼我智能体 Gemini Spark;从开发者平台 Antigravity ,到购物场景里的 Universal Cart;再到 Workspace、YouTube、Flow、Android、Cloud 以及内容溯源工具。

我们看到 ,Google试图把 AI 从“回覆问题的模型” ,推动到“持续理解、规划、执行工作的系统”D芄凰 ,2026 Google I/O ,是 Google 全面押注 Agentic AI 的一次集中展示。

01 Gemini 3.5 Flash 登。核俣瓤4倍 ,“会行动的模型”将成默认入口

本届 I/O 最受关注 ,也是最主题的技术颁布 ,仍旧是Gemini。

但并非各人等待的Gemini 4 ,Google 颁布了 Gemini 3.5模型家族的首个成员 Gemini 3.5 Flash。Google 将其界说为“结合前沿智能与行动能力”的新一代模型 ,主打两个关键词:智能体能力和速度。

依照 Google 的说法 ,Gemini 3.5 Flash 是其目前最强的智能体和代码模型 ,在复杂长周期工作、代码天生、多模态理解等方面均有显著提升。Google 给出的 benchmark 蕴含:Terminal-Bench 2.1达到76.2% ,GDPval-AA 达到1656 Elo ,MCP Atlas 达到83.6% ,CharXiv Reasoning 达到84.2%。

更重要的是 ,Google 强调3.5 Flash 在输出速度上比其他前沿模型快4倍。这意味着它并不是单纯钻营“更壮大模型”的路线 ,而是试图在能力、延长和成本之间找到一个更适合大规模产品化的平衡点。

这也诠氏缢为什么 Google 首发的是 Flash ,而不是 Pro。

从前大模型竞争强调“谁更强” ,但进入2026年 ,产品化竞争更看重“谁能以更低延长、更低成本、更不变地服务海量用户”。Flash 的定位正好符合这一点:能力足够强 ,同时能够大规模铺进搜索、App、开发者工具和企业平台。

凭据 Google 的铺排 ,Gemini 3.5 Flash 将进入多个主题场景:

● 面向通常用户 ,成为 Gemini App 和 Google Search AI Mode 的默认模型;

● 面向开发者 ,进入 Google Antigravity、Gemini API、Google AI Studio 和 Android Studio;

● 面向企业 ,进入 Gemini Enterprise Agent Platform 和 Gemini Enterprise。

据现场泄漏 ,Gemini 3.5 Pro 已在内部使用 ,打算于下个月推出。这意味着 Google 会吓酌 Flash 承接规;枰 ,再用 Pro 服务更复杂的高阶工作。

02 Gemini Omni Flash:从“理解多模态”走向“天生肆意模态”

若是 Gemini 3.5 Flash 代表 Google 对“行动模型”的押注 ,那么 Gemini Omni Flash 则代表 Google 在多模态天生上的新野心。

Google 对 Omni 的界说极度直接:能够从任何输入天生任何输出的模型 ,首先从视频起头。这句话背后 ,是多模态 AI 的范式变动。

从前的多模态更多是“输入多模态”:模型能够看图、听音频、理解视频 ,再用文字回覆。但 Gemini Omni 要做的是“输入和输出都多模态”。用户能够用文本、图片、音频、视频作为输入 ,再天生高质量视频。将来 ,它还会支持图像和音频等更多输出大局。

它的主题能力蕴含三类。

● 第一 ,是通过天然说话编纂视频。用户能够陆续对视频提出批改要求 ,好比扭转环境、角度、作为、风格 ,甚至参与角色和物体。Google 强调 ,Omni 能够在多轮对话中维持角色一致性、物理逻辑和场景陆续性。

● 第二 ,是基于 Gemini 的世界知识天生视频。Google 暗示 ,Omni 不只是天生“看起来真实”的画面 ,而是能结合物理、汗青、科学和文化语境 ,天生更有逻辑的视觉叙事。例如更正确地阐发重力、动能、流体等物理成效 ,或者把复杂概想转化为诠释型视频。

● 第三 ,是从肆意素材起头创作。用户能够把文本、图片、视频 ,甚至语音作为参考输入 ,天生统一风格的视频内容。初期音频输入重要支持语音参考 ,更多音坡粪型会在之后推出。

值妥贴心的是 ,Google 还提到了数字化身职能。用户能够使用自己的声音创建幼我 avatar ,让天生视频看起来和听起来像自己。但在视频编纂中批改音频和语音的能力 ,Google 暗示仍在测试 ,以更审慎地处置潜在风险。

在内容安全方面 ,Omni 天生的视频将蕴含不成感知的 SynthID 数字水印。用户能够通过 Gemini App、Chrome 中的 Gemini 以及 Google Search 验证视频是否由 Gemini Omni 天生。

(Sundar Pichai调侃他不吃汉堡 ,这是假图)

从颁布节拍看 ,Gemini Omni Flash 会向 Google AI Plus、Pro 和 Ultra 订阅用户全球推出 ,也会从本周起在 YouTube Shorts 和 YouTube Create App 中向用户免费盛开。将来数周内 ,Google 还将把它通过 API 提供给开发者和企业客户。

这意味着 ,Google 不只是想做一个视频天生工具 ,而是想把视频天生能力嵌入整个创作者生态:Gemini 掌管幼我创作入口 ,Flow 掌管专业工作流 ,YouTube Shorts 掌管分发场景。

这套关环 ,正是 Google 相比很多纯 AI 创业公司的优势地点。

03 Gemini App 造成24/7幼我助理:Gemini Spark 是关键

Gemini App 也在这次 I/O 上迎来大更新。

Sundar Pichai 泄漏 ,从前一年 Gemini App 增长迅速:去年 Google I/O 时 ,Gemini 有4亿用户;今年月活已经超过9亿 ,覆盖230个国度和地域、70多种说话。

新的 Gemini App 有几个重点变动。

● 首先是设计说话升级。Google 推出了新的 Neural Expressive 设计说话 ,蕴含更流畅的动画、更鲜明的色彩、新字体和触觉反馈。Gemini Live 也被直接整合进 Gemini ,用户能够在文字提问和语音对话之间无缝切换。

● 其次是回覆状态的变动。Gemini 不再只是输出长文本 ,而是能够凭据问题实时设计答案大局 ,参与图片、交互式功夫线、旁白视频和动态图形。

● 第三 ,也是最重要的 ,是两个智能体职能:Daily Brief 和 Gemini Spark。

Daily Brief 是一个个性化晨间简报智能体 ,能够援手用户整顿每天起头前必要知路的信息。

Gemini Spark 则是 Google 面向消费者推出的幼我 AI agent。它会24/7运行 ,在用户授权和指令下援手治理工作、处置数字生涯。

此表 ,macOS 版 Gemini App 也会集成 Gemini Spark ,使其能够在本地机械上执行操作 ,并参与更强的语音职能。

Google 打算先向 trusted testers 推出 Gemini Spark ,并鄙人周面向美国 Google AI Ultra 用户推出 Beta。macOS 版 Gemini App 将来也会集成 Gemini Spark ,使其能够在本地机械上执行操作。

这对 Google 很重要。由于它占有 Gmail、Calendar、Photos、Drive、Chrome、Android、Search、Maps 等高频产品。若是 Gemini Spark 能在用户授权下调动这些服务 ,它就不只是谈天机械人 ,而可能成为真正的幼我工作调度层。

同时 ,Google 颁发推出 每月100美元的 AI Ultra 打算 ,同时为 AI Plus、Pro 和 Ultra 订阅用户增长新职能和权利。

04 Search 迎来25年最大改版:搜索框造成智能体入口

Google I/O 的另一个重磅更新 ,是 Search。

据介绍 ,新的搜索框会动态扩大 ,允许用户输入更复杂、更天然的问题;它能够给出 AI 驱动的问题建议 ,不再只是传统 autocomplete;它还支持多模态输入 ,蕴含文本、图片、文件、视频和 Chrome 标签页。

更主题的是 ,Google 在把 Search 从“找答案”造成“派工作”。

首先 ,AI Mode 将使用 Gemini 3.5 Flash 作为全球默认模型。用户能够从 AI Overview 直接持续追问 ,进入 AI Mode 的对话式履历 ,并保留高低文。

其次 ,Google 推出了 Search agents。这类智能体能够在后盾24/7运行 ,持续跟踪用户关切的信息 ,并在相宜功夫给出综合更新。

好比 ,你在找房 ,能够通知 Search 预算、地位、户型、通勤和其他前提 ,信息智能体味持续扫描网页、新闻、博客、社交信息 ,以及金融、购物、体育等实时数据 ,一旦发显欹配了局就通知用户。又好比 ,你关注某位活带头和品牌联名的球鞋 ,智能体也能够在新产品颁布时提醒。

这类信息智能体将率先在今年夏天面向 Google AI Pro 和 Ultra 订阅用户推出。

Google 还在扩大 Search 中的 agentic booking 能力。用户能够让 Search 助忙寻找并预约本地服务 ,好比周五晚上可包容六人、供给夜宵的个人 KTV 包间。Search 会整合最新价值和可用性 ,并给出直接预约链接。

在家政维建、美容、宠物护理等部吩旆类中 ,用户还能够让 Google 代为给商家打电话。这些能力将于今年夏天在美国面向所有效户推出。

更有设想空间的是 ,Search 还将获得“天生式 UI”和“迷你利用”能力。

借助 Gemini 3.5 Flash 的代码能力 ,以及 Antigravity 的智能体开发能力 ,Search 能够凭据用户问题即时天生交互界面。好比 ,当用户想理解天体物理问题 ,或者想看懂机械表运行道理 ,Search 能够自动天生蕴含图表、表格、仿照器、交互组件的定造答案。

更进一步 ,对于持久工作 ,好比婚礼筹备、搬场治理、健全打算 ,Search 能够天生一个可持续使用的 dashboard 或 tracker。Google 把这类履历称为用户专属的 mini apps。

这其实是对搜索产品状态的一次底子改写。

从前 ,搜索了局页的主题是链接、提要和告白。将来 ,它可能造成一个动态天生的工作操作台:既能理解问题 ,也能天生工具 ,还能持续跟踪状态。

对 Google 来说 ,这既是防守 ,也是进攻。防守在于 ,AI 谈天产品在侵蚀传统搜索入口;进攻在于 ,Google 试图用智能体把搜索重新界说为更强的工作入口。

05 AI 购物:Universal Cart 是 Google 的“智能体贸易化”试验田

AI 时期 ,Google 最大的问题之一是:若是搜索了局不再以链接为主题 ,告白和贸易化怎么办?

本届 I/O 给出的答案之一 ,是 agentic commerce ,也就是智能体购物。

Google 颁发推出 Universal Cart ,一个智能购物车 ,也是用户在 Google 上进行 AI 购物的中心。

购物天然适合智能体。

由于用户真实的购物需要往往很复杂 ,不是一个关键词能解决的。好比买一台适合出差的轻薄本 ,用户关切的不只是价值 ,还蕴含重量、续航、机能、接口、品牌、售后、优惠、库存、配送功夫和用户评价。传统搜索必要用户反复筛选 ,智能体则能够持续比力、监控价值、组合商品 ,甚至协助实现采办。

Universal Cart 的价值就在这里:它可能把 Search、Shopping、告白、商家数据和支付链路衔接起来 ,让 AI 不只是推荐商品 ,而是参加购物决策和买卖流程。

这对 Google 拥有战术意思。

从前 ,搜索告白的主题是用户点击链接 ,而后跳转到商家页面。AI 搜索若是削减了用户点击 ,Google 就必要新的贸易关环。智能体购物可能成为一种新蹊径:Google 从信息分发者 ,造成买卖决策和执行过程中的参加者。

但它也会带来新问题:AI 推荐商品时若何排序?是否会左袒告白主?用户若何知路推荐凭据?商家若何适配这种新渠路?这些都将影响 AI 购物能否成立信赖。

06从 Android Halo 到 Antigravity:Gemini 正成为系统级基础设施

当智能体起头替用户执行工作 ,Google 必须重新界说 AI 在系统里的地位。

一个很直接的问题是:若是 AI 不只是回覆问题 ,而是起头助你搜索、预约、整顿、天生、比力价值、治理日程 ,用户怎么知路它在做什么?又该在哪里暂停、查看或收受?

Google 给出的答案之一 ,是 Android Halo。

这是一个将在今年晚些时辰上线的 Android 新能力 ,用来在手机屏幕顶部显示智能体在处置的工作。你能够把 Android Halo 理解为智能体时期的状态栏。

从前 ,状态栏显示的是功夫、电量、信号、通知;到了 AI 时期 ,系统还必要显示“你的智能体在做什么”。好比它在搜索航班、整顿文档、比力商品、天生视频、联系商家 ,或者后盾持续追踪某个工作。

这也注明 ,Google 对智能体的理解并不是单点利用 ,而是系统级能力。模型、利用、搜索、浏览器、操作系统之间的天堑会越来越吞吐 ,真正的竞争会发生在“谁能成为用户所有工作的调度层”。

若是 Android Halo 解决的是“用户若何看见和节造智能体” ,那么 Antigravity 解决的就是“开发者若何构建智能体”。

Google 显然不仅愿智能体能力只留在自家产品里。除了 Search、Gemini App 和 AI 购物 ,Google 还但愿通过 Antigravity ,把 Gemini 的能力交给开发者。

Antigravity 能够理解为 Google 面向 agentic AI 时期的开发平台。它的重点不是单一挪用一个大模型接口 ,而是让开发者可能构建、调度和部署多个合作式智能体。

从前的 AI 开发 ,好多时辰是“利用挪用模型”:用户输入问题 ,模型返回覆案。但智能体时期的开发逻辑更复杂?⒄弑匾 AI 理解指标、拆解步骤、挪用工具、接见数据、执行作为、查抄了局 ,并在必要时持续迭代。

这就要求平台不只是提供模型 ,还要提供工作流、权限、工具挪用、影象、评估和部署能力。

Antigravity 的价值就在这里:它想把 Gemini 从一个可挪用的模型 ,造成一个可开发、可组合、可部署的智能体平台。

这对 Google 很关键。由于智能体时期不成能只靠 Google 自己开发利用。真正的发作 ,必要开发者基于 Gemini 做出大量新工具、新插件、新工作流和新利用。只有开发者生态起来 ,Gemini 能力从 Google 自己的产品矩阵 ,延长到更宽泛的软件世界。

与此同时 ,Google 自己的“全家桶”也在持续 AI 化。

● 在 Workspace 里 ,Gemini 会持续进入 Gmail、Docs、Sheets、Slides、Meet 等办公场景 ,援手用户写邮件、总结文档、整顿睬议、天生表格、造作演示和治理工作。对企业用户来说 ,这不是单点职能 ,而是把 AI 嵌进日常办公流。

● 在 YouTube 里 ,Gemini Omni Flash 和视频天生能力会进一步参加内容创作 ,尤其是 Shorts。创作者能够用 AI 天生素材、批改镜头、调整风格 ,甚至把一个创意急剧造成短视频内容。

● 在 Flow 里 ,Google 更明确地把 AI 视频天生做成创作工作流。相比一次性天生视频 ,Flow 的价值在于陆续编纂、分镜治理和多轮调整 ,让 AI 视频从“玩具”造成更靠近专业出产的工具。

● 在 Pics / Photos 有关场景里 ,AI 会持续承担图片天生、图片编纂、视觉理解和内容整顿的角色。用户不再只是保留照片 ,而是能够让 AI 助忙建图、天生回顾、提守信息 ,甚至萦绕图片持续创作内容。

这些产品看似分散 ,但背后逻辑是一致的:Google 在把 Gemini 放进每一个高频场景。

07 Google 的真正意图:把 AI 做成下一代操作层

把本届 I/O 的颁布串起来 ,Google 的路线已经极度明显。它不是单独颁布几个 AI 职能 ,而是在搭建一套智能体时期的齐整系统:

● 模型层:Gemini 3.5 Flash 掌管行动和代码 ,Gemini Omni Flash 掌管多模态天生;

● 工具层:Antigravity、Gemini API、AI Studio、Android Studio 服务开发者;

● 入口层:Search、Gemini App、Android、Chrome、Workspace、YouTube、Shopping 承接用户场景;

● 贸易层:AI Ultra、AI Plus、Pro、Universal Cart 和企业服务掌管变现;

● 基础设施层:Google Cloud、TPU 和 Enterprise Agent Platform 支持大规模部署;

● 治理层:SynthID、水印验证、内容通明、安全框架和用户授权节造风险。

而将来 ,Search 不再只是搜索了局页 ,而是工作入口;Gemini 不再只是谈天副手 ,而是幼我 agent;Android 不再只是利用平台 ,而是智能体运行环境;Shopping 不再只是商品索引 ,而是买卖智能体;Cloud 不再只是算力租赁 ,而是企业智能体平台。

当然 ,Google 的挑战也很现实。

智能体要真正替用户行动 ,必须解决靠得住性、隐衷、安全、权限、误操作、可诠释性和商衣符益矛盾等问题。尤其在搜索、购物、预约和幼我数据场景中 ,一次谬误推荐、一次误拨电话、一次不相宜的自动操作 ,都可能侵害用户信赖。

从2026年 Google I/O 看 ,Google 想界说的新阶段已经很明确:智能体不再只是产品职能 ,而会成为新的基础设施;AI 不再只是信息工具 ,而会造成下一代操作层。

(Google I/O26主题演讲天团)

 

文章点评

未查问到任何数据!

颁发评论

◎迎接参加会商 ,请在这里颁发您的见解、互换您的概想。

最新文章

热点文章

随机推荐

【网站地图】