18:34AI Will@FinanceYF5Google 推出 AI Threat Defense,这是一套由 AI 驱动的网络安全解决方案,旨在持续监控并阻止 AI 驱动的威胁。该方案整合了 Wiz 平台进行风险扫描与优先级排序,利用 Gemini 等前沿模型对高风险应用进行深度漏洞扫描,并通过新软件修复代理 CodeMender 加速漏洞修复。此外,Wiz 的自主代理会持续测试系统以发现未知漏洞。与其他仅标记漏洞的方案不同,Google 的方案主动优先处理最关键的现实风险,并利用多种模型协同修复。AI产品AI 安全威胁防御GoogleGemini漏洞修复推荐理由:安全团队终于有了能主动防御 AI 威胁的完整方案——Google 把扫描、修复、测试全链路打通了,做企业安全运维的可以直接关注。原文
16:55rohanpaul_ai@rohanpaul_aiGoogle 修复了 Gemini 使用配额中的多个问题,包括因 Bug 导致 1-2 个 Omni 视频耗尽部分用户配额的情况。Ultra 用户现在获得 2 倍 Omni 生成次数;Pro 提示词新增每次提示的配额上限;失败请求不再计入配额;Flash-Lite 模型免费且不消耗配额。此外,即将推出更细粒度的使用量分解和警报功能,且选定模型将保持记忆,除非用户手动更改或达到上限。这些改进显著提升了 Gemini 的使用体验和配额透明度。AI产品Gemini配额修复OmniFlash-LiteGoogle推荐理由:重度 Gemini 用户终于不用被配额 Bug 困扰了,Ultra 用户 Omni 生成翻倍直接受益,做多模态创作的团队建议更新后试试。原文
07:05Gary Marcus@GaryMarcus精选Gary Marcus 在 X 上引用 METR_Evals 的结果,反驳某英国大报声称 AI 能完成任何人类任务的论断。他指出 Google 连可靠计数都做不到,且 METR 的测试仅针对软件领域,不要求完全准确。许多人类数秒即可完成的任务,AI 仍然无法可靠执行。行业Gary MarcusMETR_EvalsAI能力评估媒体报道Google推荐理由:戳破AI万能论,带你看清真相原文
03:03Google Gemini App@GeminiApp精选Gemini App 宣布印度用户现在可以上传视频并使用 Gemini Omni 进行编辑和变换。该功能支持从相机胶卷或保存的文件中上传。Gemini Omni 被描述为在 Vibe 视频编辑方面超越一切。目前该更新是否会在印度以外地区推出尚未明确。AI产品Gemini AppGemini OmniGoogle视频编辑推荐理由:谷歌推出 Gemini Omni 视频编辑原文
10:28Google Gemini App@GeminiAppGoogle 宣布 Gemini Omni 现已面向所有 Google AI Plus、Pro 和 Ultra 订阅用户开放,支持网页版和 Gemini 应用。该功能提供了更强大的多模态交互能力,用户可以在对话中同时处理文本、图像和音频。此次开放标志着 Gemini 在多模态 AI 领域的重要进展,订阅用户可以直接体验。AI产品Gemini多模态订阅服务AI 助手Google推荐理由:多模态交互是 AI 的下一个关键方向,Gemini Omni 让订阅用户能同时处理文本、图像和音频,做内容创作或数据分析的团队值得立即体验。原文
18:44宝玉@dotey一篇对 Gemini 前核心科学家 Andrew Dai 的专访揭示,Google 在技术储备上其实早于 OpenAI:2021 年就做出了比 GPT-3 更强的 MoE 大模型 GLaM,PaLM 2 也在 2023 年初训练完成。但组织问题拖累了发布节奏——为了等 Google I/O,PaLM 2 被刻意延迟,而 OpenAI 抢先发布 GPT-4,改写了市场叙事。这解释了为什么 Gemini 2.5 Pro 之前,Google 模型从未超越 GPT-4。行业GeminiGPT-4GoogleOpenAI模型竞争10 个信源在谈推荐理由:做 AI 产品战略或关注模型竞争的读者,这篇专访点出了技术领先不等于市场领先的残酷现实——Google 的组织惯性如何让先发优势变成后发劣势,值得所有技术团队反思。原文
12:00AI Will@FinanceYF5Google 的 SynthID 技术选择在 AI 生成内容的源头嵌入数字水印,而非事后检测,目前已标记超过 1000 亿条内容。OpenAI 和 ElevenLabs 也宣布接入该方案,推动 AI 内容透明度成为行业基础设施。这一做法旨在解决 AI 生成内容难以识别的问题,为内容溯源和可信度提供底层支持。随着更多平台加入,水印标准有望统一,影响内容审核、版权保护和用户信任。AI产品AI 内容识别数字水印SynthID透明度Google10 个信源在谈推荐理由:AI 内容真假难辨是所有人的痛点,SynthID 从源头打水印的思路比事后检测更靠谱,做内容平台、审核或版权管理的团队值得关注这个行业趋势。原文
16:32AI Will@FinanceYF5Google 发布了 Antigravity CLI,让用户可以在终端中直接使用 Antigravity agent。该 CLI 版本轻量、功能完整且完全可定制,满足了部分开发者希望在命令行环境中使用 agent 的需求。在 AI 工具普遍转向 GUI 的趋势下,Google 反其道推出 CLI 版本,为偏好终端操作的开发者提供了新选择。AI产品AntigravityCLI终端智能体Google推荐理由:终端党终于等到了官方 CLI 版 Antigravity agent,做自动化脚本或习惯命令行的开发者可以直接上手,省去 GUI 的繁琐。原文
06:36rohanpaul_ai@rohanpaul_ai72°Google 新论文指出,大语言模型的幻觉问题根源不在于回答错误,而在于错误时仍显得过于自信。论文提出应将目标从追求完美事实性转向让模型诚实表达自身不确定性,即“忠实的不确定性”。作者认为,模型缺乏的不是知识,而是对自身认知的元认知能力。对于智能体而言,不确定性感知能决定何时搜索、何时信任来源、何时停止,比工具本身更重要。论文LLM幻觉不确定性元认知Google推荐理由:这篇论文点破了 LLM 幻觉的核心矛盾——不是知识不够,而是不知道什么时候该说“不确定”。做 AI 产品、智能体或对话系统的团队,看完会对“诚实比正确更重要”有更深理解,建议直接读原文。原文
21:30The Rundown AI@therundownaiGoogle 的 AI 系统成功解决了九个长期未解的数学难题,标志着 AI 在数学推理领域取得重大突破。这些难题曾困扰数学家多年,AI 的解法可能为数学研究开辟新路径。该成果展示了 AI 在复杂逻辑和抽象推理方面的潜力,对数学、计算机科学等领域具有深远影响。AI模型GoogleAI 数学推理未解难题突破研究推荐理由:数学和 AI 研究者值得关注——Google AI 破解未解难题,可能改变数学研究范式,建议点开了解具体突破。原文
23:36Logan Kilpatrick@OfficialLoganK精选Gemini 3.5 Flash 模型在 Vending Bench 基准测试中达到性价比帕累托前沿。Vending Bench 用于衡量模型运行模拟商店的能力。该模型在成本与智能之间取得最优平衡,优于其他竞品。这是 Gemini 系列在推理效率上的重要进展。AI模型Gemini 3.5 FlashGoogleVending Bench推理模型推荐理由:谷歌新模型性价比超群原文
08:27rohanpaul_ai@rohanpaul_ai精选72°Google 发表新论文,提出 SensorFM,一个基于 500 万人超过 1 万亿分钟未标记穿戴传感器数据训练的基础模型。该模型旨在学习人类生理活动的通用模式,而非仅处理孤立事件。SensorFM 在 35 项预测任务中的 34 项上超越了传统特征工程方法,涵盖心血管、代谢、心理健康、睡眠和生活方式等领域。研究表明,穿戴数据的价值在于先学习其内在结构,而非过早压缩为粗略摘要。论文基础模型穿戴设备生理信号GoogleSensorFM推荐理由:穿戴设备厂商和健康 AI 研究者终于有了一个通用基础模型,不用再为每个健康任务单独设计特征工程。做可穿戴健康分析的团队可以直接参考 SensorFM 的预训练思路,大幅降低模型开发成本。原文
02:16Logan Kilpatrick@OfficialLoganK精选Gemini 3.5 Flash 在 Roboflow 视觉评估中多项指标超越 3.1 Pro。其平均推理速度快约6倍,大幅降低延迟。该模型在多模态理解上展示出更强能力,尤其适合视觉密集型任务。AI模型Gemini 3.5 FlashGemini 3.1 ProGoogle多模态视觉理解推荐理由:谷歌新 Flash 视觉又快又准原文
00:01a16z@a16z精选Google 目前每月处理超过 3.2 quadrillion 个 Token,相比一年前增长了 7 倍。这一数据来自 a16z 发布的图表。Token 处理量的激增反映了 Google 在 AI 和搜索领域的大规模部署。行业Googletokensa16z数据处理量推荐理由:Google 处理量暴增 7 倍原文
19:27rohanpaul_ai@rohanpaul_aiGoogle CEO Sundar Pichai 在播客中透露,2022 年 Google 已基于 LaMDA 模型开发出接近 ChatGPT 的产品,但因模型输出毒性过高、不符合 Google 搜索质量标准而放弃公开发布。Pichai 承认公司当时对产品质量有更高门槛,且事后看 OpenAI 的 ChatGPT 也并非一开始就明显是赢家。Google 曾通过 AI Test Kitchen 发布受限版 LaMDA,但最终未全面推出。这一决策让 Google 在对话 AI 浪潮中落后,但也反映了其谨慎的产品哲学。行业GoogleLaMDAChatGPTAI 产品化Sundar Pichai10 个信源在谈推荐理由:Pichai 的复盘揭示了科技巨头在 AI 产品化中的两难——质量 vs 速度,做 AI 产品决策的团队值得看看 Google 当年为何选择不赌。原文
08:31DeepLearning.AI@DeepLearningAI研究发现,Google 的 AI 系统在乳腺钼靶图像中检测癌症的准确率略高于人类放射科医生。该系统能够发现一些医生最初遗漏的病例,同时有望减轻放射科医生的工作负担。然而,研究人员指出,信任问题仍是该技术临床推广的主要障碍。AI产品GoogleAI 医疗乳腺癌检测放射科临床信任推荐理由:AI 在医疗影像诊断中展现出超越人类的潜力,做医学影像分析或关注 AI 落地的读者值得关注这项进展,了解其优势与挑战。原文
08:05The Rundown AI@therundownaiOpenAI 在数学领域取得突破,破解了一个困扰学界 80 年的数学猜想,展示了 AI 在基础科学推理上的潜力。Google 的 AI Co-Scientist 系统开始进入实验室实际应用,辅助科学家进行实验设计。此外,Anthropic 推出 Claude 上下文审计功能,帮助用户了解 AI 如何理解自己的工作。Emergence 公司发起五镇 AI 对齐挑战赛,探索多智能体协作中的价值观对齐问题。本周还有 4 款新 AI 工具和社区工作流发布,值得关注。行业OpenAIGoogleAI Co-Scientist数学推理AI对齐10 个信源在谈推荐理由:数学和科学研究者会看到 AI 如何从工具变成合作者——OpenAI 的突破和 Google 的实验室应用都指向同一个方向:AI 正在改变科研范式,做基础研究的团队值得跟进。原文
07:53AI Will@FinanceYF5Google 发布了名为 Gemini Omni 的新模型,能够从任意输入(如视频)生成任意内容。该模型首先支持视频输入,类似“Nano Banana”但针对视频场景。目前已在 Gemini App、Flow 和 YouTube 中可用,API 支持即将推出。这标志着多模态 AI 能力的重大扩展,让用户能更灵活地创作和交互。AI模型Gemini Omni多模态视频生成GoogleAI模型推荐理由:多模态 AI 又进一步——Gemini Omni 从视频直接生成内容,做视频创作或内容生产的团队值得关注,API 开放后可以直接集成到工作流中。原文
07:35The Rundown AI@therundownai72°在 Google I/O 2025 上,CEO Sundar Pichai 接受了独家专访,重点介绍了新发布的 Omni(跨设备个性化智能)和 Spark 智能体。Pichai 将 Omni 比喻为“视频界的 Nano Banana”,并讨论了 YouTube 的未来、AI 怀疑论者的建议、Gemini 的普及策略,以及 AI 在三年内的发展方向。他还回答了 AI 不会取代哪些任务、对 18 岁青年的建议,以及如今是否还会上大学等个人问题。行业GoogleSundar PichaiOmniSpark 智能体AI 未来推荐理由:想了解 Google 对 AI 未来的真实战略,而不是产品参数?Pichai 的访谈直接给出了 Omni 和 Spark 的定位,做 AI 产品规划或关注巨头动向的读者值得一看。原文
15:20AI Will@FinanceYF5Google 发布了全新模型 Gemini Omni,能够根据任意输入(如文本、图像、音频)生成任意输出内容,首先支持视频生成。该功能将集成到 Gemini App、Flow 和 YouTube 中,API 支持即将推出。Omni 被视为“Nano Banana”的视频版,标志着多模态生成能力的重大突破。这一进展将极大简化内容创作流程,尤其对视频创作者和开发者意义重大。AI产品Gemini Omni多模态生成视频生成GoogleAPI推荐理由:多模态生成从文本扩展到视频,做内容创作或视频开发的团队可以直接在 Gemini App 和 YouTube 中体验,建议第一时间试用。原文
08:01Google Gemini App@GeminiAppGoogle 宣布全球 AI Plus、Pro 和 Ultra 订阅用户现可在 Gemini 应用中试用 Gemini Omni 功能。该功能允许用户直接在应用内进行多模态交互和创作。Google 鼓励用户分享自己的创作成果。此举标志着 Google 在 AI 多模态能力上的进一步扩展,面向高级订阅用户开放。AI产品Gemini多模态订阅用户AI 创作Google推荐理由:Google 将多模态 AI 能力直接集成到 Gemini 应用中,Plus/Pro/Ultra 订阅用户现在就能上手体验,做内容创作或 AI 实验的团队值得一试。原文
08:00Simon Willison@simonwSimon Willison 在 X 上提问,Google 的 Gemini Spark 模型声称运行在 Gemini 3.5 上并使用 Antigravity 框架。他疑惑 Antigravity 是 Google 对智能体框架的通用称呼,还是类似 Claude 的 Claw 的竞品,并且是否开源。这条推文引发了对 Google 智能体技术栈的讨论。AI产品智能体GeminiAntigravityGoogle框架推荐理由:Google 的智能体框架命名引发猜测,做 AI 智能体开发的团队值得关注——这可能意味着 Google 在智能体领域有了新动作。原文
08:00小互@imxiaohuGoogle 推出了全新的 Omni 模型,这是一个多模态 AI 模型,能够同时处理文本、图像、音频等多种输入。该模型在理解和生成跨模态内容方面表现出色,有望推动 AI 交互方式的革新。Omni 模型的出现标志着多模态 AI 技术的重要进展,为开发者提供了更强大的工具来构建更自然的用户界面。AI模型多模态OmniGoogleAI模型跨模态推荐理由:多模态模型是 AI 交互的下一个前沿,做跨模态应用的开发者可以直接关注 Omni 模型的能力边界,看看能否替代现有方案。原文
07:59LlamaIndex@llama_index精选Google 发布了 Agents API,这是一个在沙盒 Linux 环境中构建和运行自定义智能体的服务。LlamaIndex 团队随即构建了一个模板,使这些智能体能够集成 LlamaParse 和 LiteParse,自动处理非结构化文档。工作流程包括配置 Git 仓库、克隆到沙盒、安装解析工具和技能,然后让智能体自主执行任务。该方案让智能体可以直接处理真实世界的复杂文档,适合需要自动化文档处理的开发者。AI产品智能体GoogleLlamaIndex文档解析沙盒环境推荐理由:Google 的 Agents API 让智能体有了安全沙盒环境,LlamaIndex 的模板直接打通了文档解析能力,做文档自动化处理的团队可以立刻上手试试。原文
07:59Google AI Developers@googleaidevsGoogle推出了Antigravity SDK,允许开发者以编程方式访问与Google产品相同的Agent框架。该SDK旨在为构建Agent应用提供完全的部署控制权。开发者可以通过该SDK直接调用Google内部使用的Agent能力,实现更灵活的应用构建。这对于希望深度定制Agent行为的团队是一个重要工具。AI产品智能体SDK/工具部署控制GoogleAgent框架推荐理由:想构建Agent应用又不想受限于黑盒平台的开发者,这个SDK让你直接调用Google自家产品的Agent框架,部署控制权完全在你手里,值得一试。原文
07:59shao__meng@shao__meng83°Google 在 I/O 2026 首日发布了 Antigravity 2.0,这是一款从「带 Agent Manager 的 IDE」彻底重构为「Agent-first 原生应用」的桌面端产品。新版本支持多智能体团队协作、定时任务、原生语音以及一键集成其他 Google 产品。其界面布局与 Codex App、Cursor Agents 相似,引发关于 Agent App 主流形态的讨论。官方演示中甚至出现了“Codex”文件夹,暗示了与竞品的关联或致敬。AI产品GoogleAntigravityAgent-firstIDE多智能体10 个信源在谈推荐理由:Antigravity 2.0 定义了 Agent-first 应用的新范式,做 AI 工具或 Agent 开发的团队值得关注其界面与架构设计,看看是否代表未来方向。原文
07:59Logan Kilpatrick@OfficialLoganK72°Google 的 Gemini 团队正在全力推进智能体(Agent)时代的发展,以极快的速度发布新功能。官方表示,更多令人期待的功能即将上线,并邀请用户尽快体验。这一动态表明 Gemini 在智能体领域的布局正在加速,可能带来更强大的自主任务处理能力。对于关注 AI 智能体发展的用户来说,这是一个值得关注的信号。AI产品Gemini智能体AI 产品功能更新Google推荐理由:Gemini 智能体时代全面提速,做 AI 应用或自动化流程的开发者值得关注,新功能可能直接提升你的工作效率,建议保持跟进。原文
07:59Google Gemini App@GeminiAppGoogle 的 Gemini 助手现已扩展至超过 230 个国家和地区,支持 70 多种语言,成为全球覆盖范围最广的 AI 助手。这一里程碑意味着更多用户可以在日常生活中使用 Gemini 进行对话、查询和任务辅助。Gemini 的广泛可用性将推动 AI 助手的普及,并可能改变用户对智能助手的依赖习惯。AI产品GeminiAI 助手全球覆盖多语言Google推荐理由:Gemini 的全球覆盖让更多地区的用户能直接使用 AI 助手,日常需要智能助手的人群可以试试看是否比现有选择更好用。原文
07:59Google Gemini App@GeminiAppGoogle 宣布 Gemini Spark 将于本周向可信测试者推出,下周面向美国 Google AI Ultra 订阅者开放 Beta 版。此外,Google 还计划通过 Google Workspace 和 Gemini Enterprise 为企业提供 Gemini Spark 版本。这意味着 Gemini Spark 将逐步覆盖个人和企业用户,扩展 Google AI 生态。AI产品Gemini SparkGoogleAI 助手Beta 测试企业应用推荐理由:Google 的 Gemini Spark 是 AI 助手的新形态,关注 AI 工具生态的开发者可以抢先体验,企业用户也值得留意后续的 Workspace 集成。原文
07:59Paul Couvert@itsPaulAi76°Google 即将推出的 Gemini Spark 是一个真正的自主智能体,可以 24/7 在 Gemini 中运行。它能从 Gmail、网页、Drive 等获取上下文,自主处理任何任务,甚至可以在手机上使用。与许多未来规划不同,Gemini Spark 将在下周而非明年推出。这一进展标志着 AI 从对话工具向全天候自主代理的转变,对个人和团队效率有重大影响。AI产品智能体Gemini自主代理Google效率工具推荐理由:Gemini Spark 让 AI 从对话助手升级为全天候自主代理,做自动化工作流和效率提升的团队可以直接在下周试用,值得关注。原文
07:59Google Gemini App@GeminiApp72°Google 在 Google I/O 上发布了 Gemini Spark,一款可 24/7 全天候运行的自主 AI 智能体。用户只需下达任务,它就能在后台自主工作,即使手机和笔记本电脑关机也能持续执行。Gemini Spark 设计为在采取重大行动前会征求用户同意,确保安全可控。这一功能将 AI 从被动响应升级为主动服务,有望改变用户与 AI 的交互方式。AI产品智能体GoogleGemini Spark自主执行GoogleIO推荐理由:Google 把 AI 智能体从“随叫随到”升级为“全天候待命”,做自动化任务管理的用户可以直接用起来,省去手动监控的麻烦。原文
07:59Google AI Developers@googleaidevsGoogle 在 Gemini API 中推出了托管智能体(Managed Agents)功能,开发者只需一次 API 调用即可构建生产级智能体。该功能降低了智能体开发的门槛,无需管理底层基础设施。Google 通过 Twitter 线程详细介绍了其用法和优势,旨在让更多开发者快速上手并部署智能体应用。AI产品智能体Gemini API托管智能体GoogleAPI推荐理由:Google 把智能体部署简化到一次 API 调用,做 AI 应用开发的团队可以大幅降低运维成本,值得立即上手体验。原文
07:42Google AI Developers@googleaidevsGoogle 发布了 Stitch by Google 的更新,这是一款 AI 设计伙伴,能将想法转化为可运行的移动端和网页端 UI。新功能包括实时流式设计构建,支持边编辑边看布局更新;支持导入现有代码库或 Design.md 文件,保持品牌一致性;可生成动态交互动效;并支持一键导出到可分享的线上 URL。这些更新显著提升了原型设计和部署的效率,现已全球可用。AI产品AI 设计工具UI 原型实时协作GoogleStitch推荐理由:对于 UI/UX 设计师和前端开发者来说,Stitch 的实时流式设计和一键部署功能能大幅缩短从创意到上线的周期,建议直接上手试试。原文
07:08Google Gemini App@GeminiApp精选Google 发布 Gemini 3.5 Flash,即日起全球用户可免费使用。用户只需在 gemini.google 或移动应用底部下拉菜单中选择“3.5 Flash”即可体验。该模型侧重高效推理与快速响应,面向免费层级开放。AI模型Gemini 3.5 FlashGoogle推理模型免费推荐理由:谷歌免费上架新模型,试试手速原文
07:08Google Gemini App@GeminiApp精选谷歌发布 Gemini 3.5 Flash 新能力,可理解复杂主题和图表。模型能解读高级数学论文,识别关键元素并生成个性化可视化。示例展示其将论文内容转化为视觉图表的完整过程,用户可根据需求调整输出。AI产品Gemini 3.5 FlashGoogle可视化图表理解推荐理由:谷歌新模型能看图解数学论文原文
02:07Google AI@GoogleAI精选Google宣布构建Gemini for Science,面向科研社区。该项目与超过100个机构合作,测试者从博士生到诺贝尔奖得主。目标是确保技术足够严谨,能解决真实世界的科学问题。更多细节见官方博客。AI产品GeminiGoogle科学AI for Science合作推荐理由:给科学家用的Gemini来了原文
00:10小互@imxiaohu精选Midjourney创始人公开表示,团队因采用Google TPU进行训练,研究进度相比使用Nvidia GPU技术栈落后约一年。他称如果回到过去,会从一开始就全部使用Nvidia的方案。这一言论反映了大模型训练中硬件生态适配的隐蔽成本。行业MidjourneyGoogleTPUNvidiaGPUAI训练2 个信源在谈推荐理由:创始人亲述选错硬件的代价原文
20:14Jerry Liu@jerryjliu0Google AI 通过 Gemini API 推出了 Managed Agents 服务,这是对 Anthropic Managed Agents 的回应。该服务基于新的 Antigravity 智能体(由 Gemini 3.5 Flash 驱动),号称是面向开发者最具成本效益的通用智能体沙箱。LlamaIndex 团队已为 Gemini Managed Agents 构建了第一天支持,通过 LlamaParse 和 LiteParse 让智能体能够解析 PDF 等非结构化文档。开发者可以配置 Git 仓库,将数据和输出存入其中,智能体在沙箱内自动安装工具并处理文档任务。这为需要处理复杂真实世界文档的开发者提供了一个低成本、自动化的解决方案。AI产品智能体GoogleGemini文档解析LlamaIndex10 个信源在谈推荐理由:Google 终于推出了自己的托管智能体服务,而且基于 Gemini 3.5 Flash 成本极低,做文档处理的团队可以直接用 LlamaIndex 的模板快速上手,省去自己搭建解析流程的麻烦。原文
15:12AI Will@FinanceYF5精选72°Google 提出 Nexus 框架,将时间序列预测从纯数值模式匹配转向事件驱动的推理问题。Nexus 通过多个智能体分别处理历史文本事件、宏观环境、局部冲击,并由合成器校准,让模型理解数字背后的原因。在 Zillow 房价测试中,基于 Claude 的版本相比直接思维链提示,平均绝对百分比误差(MAPE)降低 86.6%。虽然目前仅在有限数据集上验证,但方向明确:未来的预测不仅要外推曲线,还要解释曲线为何移动。论文时间序列预测智能体推理模型GoogleClaude推荐理由:做时间序列预测的团队终于有了一个能理解「为什么涨跌」的框架,Nexus 把事件和数字结合,效果显著。做量化、经济预测或房地产分析的建议点开论文看看。原文
15:08AI Will@FinanceYF5精选72°Google 新论文 Nexus 提出,时间序列预测不应仅依赖历史曲线,还需理解背后的事件。该方法将预测任务拆分为多个 agent:整理事件、判断环境、追踪冲击和综合校准。在 Zillow 数据集测试中,使用 Claude 的 Nexus 版本比普通 CoT 提示平均 MAPE 降低 86.6%。这标志着预测模型从单纯画曲线转向解释曲线为何变动,为金融、房地产等领域提供更可解释的预测。论文时间序列预测多智能体事件驱动GoogleClaude推荐理由:做时间序列预测的团队终于有了新思路——Nexus 把事件理解引入预测,MAPE 降低 86.6% 的效果值得在业务中试试。原文