全部 AI 动态 · AI 热点

6月30日

03:07

@koltregaskes@koltregaskes

Ethan Mollick根据Artificial Analysis的AA-Briefcase分数，绘制了AI模型在复杂多周咨询任务上的表现趋势。AA-Briefcase测试模型处理电子表格和策略规划等可交付成果。GLM-5.2等开源模型目前达到的水平，与闭源模型三个月前的分数一致。高端闭源模型仍保持明显领先，但差距在缩小。

AI模型 GLM-5.2 AA-Briefcase 开源模型智能体基准测试

推荐理由：开源模型GLM-5.2在AA-Briefcase智能体基准上只差闭源三个月了，做复杂任务时值得试试看。

原文

01:56

AWS Machine Learning Blog@Troy Parrett

精选

本教程展示如何结合Amazon Bedrock Data Automation自动提取医疗理赔表单数据，再通过Amazon Bedrock AgentCore托管AI代理进行验证并转换为FHIR资源存入AWS HealthLake。该端到端工作流可减少人工处理流程，同时通过自动化校验保持数据准确性。文中逐步讲解每个组件的配置与集成方法。

技巧 Amazon Bedrock AWS HealthLake FHIR 智能体医疗数据

推荐理由：AWS官方手把手教你搭医疗理赔流水线，用Bedrock自动抽数据、转FHIR格式存HealthLake，能省不少人工核对时间。

原文

01:33

AWS Machine Learning Blog@Joshua Lacy

精选

本文介绍如何使用Amazon Bedrock AgentCore的内置可观测性功能调试生产环境中的智能体故障。文章涵盖常见的故障模式，如无限循环和工具调用失败。通过追踪和指标分析智能体行为，并提供结构化工作流来解决问题。本文是两部分系列的第一部分，第二部分将讨论性能优化和内存管理。

技巧 Amazon Bedrock AgentCore 可观测性智能体工具调用

推荐理由：AWS博客教你用Bedrock AgentCore内置观察功能排查生产智能体故障，比如无限循环和工具调用失败，省去自己搭建监控的麻烦。

原文

6月29日

23:49

阶跃星辰 Stepfun@Stepfun_AI

精选

StepFun 的 Step 3.7 Flash 模型在 Claw-Eval General 基准测试中取得第二名的成绩，该基准用于评估自主智能体。模型在多步执行和长程任务鲁棒性上表现强劲，排名仅次于 Claude Opus 4.6。这一结果显示其在真实世界智能体工作负载中的潜力。

AI模型 Step 3.7 Flash Claw-Eval General 智能体推理模型

推荐理由：StepFun 的 Step 3.7 Flash 在智能体基准 Claw-Eval General 排第二，仅次于 Claude Opus 4.6，多步执行和长程任务都强，感兴趣可以看看。

原文

18:44

marktechpost@Asif Razzaq

精选

EverMind开源了EverOS，一个本地优先的智能体记忆运行时。它将记忆存储为纯Markdown文件，由SQLite和LanceDB索引。系统结合了BM25稀疏检索与向量检索，支持多模态数据摄入，并具备自我进化技能。项目采用Apache 2.0许可。

AI产品 EverOS EverMind SQLite LanceDB 智能体

推荐理由：EverOS把AI记忆存成Markdown，用SQLite和LanceDB做混合检索，还能自我进化技能，开源免费，值得一试。

原文

17:44

AI Will@FinanceYF5

阿里巴巴推出 Wan Streamer，这是一个支持实时视频交互的 AI 智能体，能够通过摄像头看见用户、听取语音并实时回应。该功能突破了传统语音模式，实现了更自然的面对面交互。目前该产品已通过 Twitter 视频演示，获得 446 次浏览。

AI产品阿里巴巴 Wan Streamer 视频交互智能体

推荐理由：阿里这个 Wan Streamer 能实时看脸听声音回话，不再是纯语音，交互感拉满。

原文

17:13

阿里云 Alibaba Cloud@alibaba_cloud

阿里云CTO李飞飞在推文中表示，向Agentic Cloud的转型已经开始。他认为未来三年将由Agentic Cloud的崛起定义。智能体将利用阿里云的产品和基础设施执行复杂任务。

行业 Alibaba Cloud Agentic Cloud 智能体云基础设施

推荐理由：阿里云CTO李飞飞说未来三年是Agentic Cloud的天下，智能体会用云产品干更复杂的事。

原文

16:12

ElevenLabs@elevenlabsio

Employment Hero是一个服务超过35万家企业的AI驱动HR、薪资和招聘平台。该公司使用ElevenLabs的ElevenAgents在几天内成功部署了AI招聘外呼语音代理。首次营销活动实现了33%的接听率和超过3%的激活率。这证明了ElevenAgents能够快速落地并带来可衡量的转化效果。

AI产品 ElevenLabs ElevenAgents Employment Hero 智能体 AI招聘

推荐理由：嘿，ElevenLabs的新工具真牛，Employment Hero几天就搭好了AI招聘电话代理，接通率33%，激活率3%+，搞自动化招聘的可以看看。

原文

15:38

@koltregaskes@koltregaskes

91°

OpenAI 开放了 GPT-5.6 模型家族的有限预览，包括旗舰版 Sol、性价比版 Terra 和快速版 Luna。Sol 引入最大推理努力和超模式，使用子代理加速复杂任务，在 Terminal-Bench 2.1 上领先，并在网络安全基准上匹配 Mythos Preview 性能，仅用三分之一输出令牌。系统卡将网络和生物能力评为高，但低于自主全链利用的关键阈值。更广泛可用性计划在未来几周内推出。

AI模型 OpenAI GPT-5.6 Sol 推理模型智能体

推荐理由：OpenAI 终于放出 GPT-5.6 预览，Sol 在编程和网络安全测试上效率高，Terra 半价达 GPT-5.5 水平，想尝鲜可以关注。

原文

13:58

Ate-a-Pi@svpino

这个开源项目允许你录制浏览器操作，系统会自动清理录制内容，移除重试、死路和页面特定细节。然后它只保留任务逻辑而非具体点击，将其转化为可复用的技能。最后这些技能被组织成技能图谱，智能体可检索用于相关新任务。整个过程完全开源。

技巧开源浏览器自动化智能体技能图谱工作流

推荐理由：有个开源项目能录制你在浏览器里做的事，自动变成可复用的技能，还能让智能体直接调用，省去重复劳动。

原文

13:52

Together AI@togethercompute

Together Compute的Zain Hasan将在开源推理工作坊中解释单次模型调用与大规模智能体服务的本质区别。研讨会于美国太平洋时间周一上午9点举行。活动主办方为aiDotEngineer。

行业 Together Compute 智能体推理工作坊大规模部署

推荐理由：如果你在搭智能体应用，想从demo走向生产，来听听Zain怎么拆解关键差异。

原文

13:51

Vercel AI@vercel

精选

Vercel 推出 AI SDK 7，专注于生产环境中 AI Agent 的开发与部署。新版本引入审批机制，允许控制 Agent 操作的执行流程；增加持久化功能，支持长期任务的恢复与状态保存；内置遥测系统，帮助开发者监控与调试 AI 工作流。该 SDK 7 还改进了可观测性和稳定性，为构建可靠 AI 平台提供基础设施。

AI产品 AI SDK 7 Vercel Agent 智能体 AI平台

推荐理由：Vercel 的 AI SDK 7 直接帮你搞定 Agent 的持久化、审批和监控，做生产级 AI 应用省心很多。

原文

13:51

Together AI@togethercompute

Together AI 工程师将在 AI Engineer World’s Fair 举办 hands-on workshop，讨论 Agentic Coding 如何改变推理引擎需求。workshop 将讲解推理引擎的工作原理及服务生产级 agentic workloads 的要点。活动时间为6月29日上午9-11点，地点在 Room 2020。

技巧 Together AI AI Engineer World’s Fair agentic coding 推理引擎智能体

推荐理由：想了解 agentic coding 对推理引擎的新要求？Together AI 的这个实操 workshop 直接带你上手，时间是6月29日上午。

原文

13:50

François Chollet@fchollet

精选

François Chollet 指出，智能体编程（Agentic coding）迫使开发者设计清晰的 API 接口并编写完整的文档字符串。AI 代理无法阅读团队内部的隐式心理模型，只能依赖显式的 API 合约和 docstring。这要求接口规范必须精确、无歧义，文档覆盖所有输入/输出场景。对工程团队而言，这意味着需要投入更多时间在接口形式化设计上。

技巧 Agentic coding API设计文档字符串智能体编程助手

推荐理由：François Chollet 说得很实在：想用AI代笔写代码，接口就得干净、文档得详细，别指望它懂你没写出来的默契。

原文

13:50

阿里云 Alibaba Cloud@alibaba_cloud

阿里巴巴云Qwen团队将于2026年6月30日举办Qwen Live第一集直播，主题为Agent-First。Qwen云负责人Linlin Kong与产品经理Pan Gu、Xijue将分享从零构建智能体云平台的经验。直播将重新定义面向非人类用户的开发者体验，并探讨大规模人机协作的新范式。

技巧 Qwen 阿里云智能体云平台开发者体验

推荐理由：想搞智能体云平台？Qwen这期直播讲从零搭建、非人类用户开发体验，做agent的开发者别错过。

原文

13:50

阿里云 Alibaba Cloud@alibaba_cloud

在Flink Forward Asia Shenzhen 2026上，阿里云CTO李飞飞提出“数据重力”将成为AI代理时代的主导概念。他强调AI必须解决复杂企业工作流并创造实际业务价值，而非仅追求模型智能。该观点针对Apache Flink等实时数据处理生态中的AI集成场景，呼吁行业关注AI在企业级应用中的落地效率。

行业 Alibaba Cloud Apache Flink Data Gravity 智能体企业工作流

推荐理由：阿里云CTO李飞飞在Flink Forward大会上点名数据重力概念，说的是AI怎么真正帮企业干活，不是光比模型分数。

原文

13:50

阶跃星辰 Stepfun@Stepfun_AI

Step Plan 专为 Agent 工作流设计，用户只需连接一次即可持续构建和实验。它在 Claude Code 中集成了 Step 3.7 Flash 模型，大幅降低每次 API 调用的管理成本。开发者 @codedailyML 用 Step Plan 制作了 Tarot 生成器 demo，验证了工作流的便捷性。

技巧 Step Plan StepFun Claude Code Step 3.7 Flash 智能体

推荐理由：StepFun 的 Step Plan 让你在 Claude Code 里连一次就能持续调模型，不用反复写 API，看那个 Tarot 生成器 demo 就知道了。

原文

13:50

阶跃星辰 Stepfun@Stepfun_AI

StepFun 根据开发者反馈发现，当 Agent 开始实际工作时，计费机制会干扰工作流。为此推出了 Step Plan，旨在降低这种干扰。同时发布了 Step 3.7 Flash 模型，配合 Claude Code 使用。这个组合可以让开发者在编程场景下更专注于任务本身。

AI产品 Step Plan Step 3.7 Flash Claude Code 智能体编程助手

推荐理由：StepFun 搞了个 Step Plan，专治 Agent 干活时的计费麻烦，还搭了 Step 3.7 Flash 和 Claude Code，编程省心不少。

原文

13:50

阶跃星辰 Stepfun@Stepfun_AI

StepFun宣布与Cline合作，将其Step 3.7 Flash模型集成到Cline中。该模型专为代理式编程工作流设计，具备能力、速度和可靠性。从即日起，Cline用户可免费使用Step 3.7 Flash一个月。用户只需在Cline中输入'/model → Step 3.7 Flash'即可切换。

AI模型 Step 3.7 Flash Cline 编程助手智能体

推荐理由：StepFun把自家Step 3.7 Flash模型免费给Cline用一个月，写代码的代理工作流更稳更快了，试试看。

原文

13:50

阶跃星辰 Stepfun@Stepfun_AI

StepFun（阶跃星辰）推出初创公司计划，为早期AI团队提供支持。入选团队可获得API额度、专属生态系统支持、联合营销机会、展示位置及合作伙伴引荐。该计划面向构建多模态应用和智能体系统的团队。申请现已开放。

行业 StepFun 多模态智能体初创计划

推荐理由：StepFun给早期AI团队送API额度、资源和曝光，做多模态或智能体项目的小伙伴可以试试，链接在推文里。

原文

13:50

阶跃星辰 Stepfun@Stepfun_AI

精选

StepFun 发布 Step 3.7 Flash 模型，专为高效智能体工作负载设计。该模型具备原生多模态理解、强智能体编程能力、可靠工具调用以及网页与视觉搜索工作流。模型已通过 Novita Labs 在 OpenRouter 平台上提供。StepFun 称这是为生产级 AI 智能体打造的高效方案。

AI模型 Step 3.7 Flash StepFun Novita Labs OpenRouter 智能体

推荐理由：StepFun 刚出了 Step 3.7 Flash，专为智能体打造的模型，多模态、能编程、会搜图搜网页，现在就能在 OpenRouter 上试。

原文

13:49

Jasper AI@heyjasperai

Jasper 发布了 Slack Agent，这是一个直接集成在 Slack 中的 AI 工具。用户可以在对话线程中用它生成、总结和修订内容，无需切换到其他应用。该功能旨在将聊天讨论快速转化为初稿，减少工具切换带来的效率损失。

AI产品 Jasper Slack Agent 内容生成智能体

推荐理由：Jasper 把内容生成塞进 Slack 了，团队可以直接在聊天里改稿子，不用再跳来跳去。

原文

13:48

岚叔@lufzzliz

tokei v1.08 新增Claude Code按模型查看详情功能，可对每个模型（如GLM-5.2）单独分析费用。全局视角支持本机/全部设备查看。回顾页面新增“Loop Engineering”和“Loop滴神”成就：连续3天/30天每天24小时有Agent运行即可获得。新增对Qoder、QoderWork Agent的计算支持。

AI产品 tokei Claude Code Qoder QoderWork 智能体

推荐理由：tokei更新了，现在能按模型看Claude Code花了多少钱，还有连续跑Agent的成就系统，适合想精细控制AI开支的开发者。

原文

13:48

岚叔@lufzzliz

K神定义LLM UI/UX第三次变革，将LLM视为独立可持续运行的系统，拥有全组织工具和上下文，与人协同。作者基于Pi实现组织内agent交互，支持不同群组不同的记忆、知识库、技能和模型。该系统可应用于客户群交互，实现高效丝滑协同。

行业 Pi 智能体 LLM 协同

推荐理由：K神提出了新的LLM交互思路，作者已经用Pi搭建了能按群组定制的智能体系统，对企业协作很有参考价值。

原文

13:48

岚叔@lufzzliz

在世界杯小组赛预测中，GLM-5.2在比分榜综合最强，GPT-5.5在胜负榜综合最强且命中率达70%。淘汰赛阶段取消24小时限制，可一次性预测16场比赛。作者分享了提示词示例："继续预测，可以提交淘汰赛16场的比赛，你需要仔细分析给出你的答案、并提交"。同时附带了opus-4.8和deepseekv4-pro的预测结果。

技巧 GLM-5.2 GPT-5.5 提示词工程智能体世界杯

推荐理由：作者用GLM-5.2和GPT-5.5预测世界杯，GPT-5.5命中率70%，还给了淘汰赛提示词，试试用自己的agent玩。

原文

11:20

AI产品黄叔@PMbackttfuture

这篇推文列出了关于 Agent（智能体）使用 QQ 邮箱的 10 条观察。核心观点包括：邮箱是 Agent 的数字身份证，与个人邮箱隔离；收邮件是杀手级场景；Agent 发邮件前需用户确认，这是信任训练；最终局是 A2A 通信。文章认为 QQ 邮箱此举抢的是通信层，真正的对手是 Cloudflare。

行业 QQ Mail 智能体 A2A通信数字身份

推荐理由：看看这篇对 Agent 与 QQ 邮箱结合的犀利分析，10 条观察直击本质，尤其是把邮箱当作数字身份证和 A2A 通信的终局思考。

原文

10:48

向阳乔木@vista8

腾讯云EdgeOne发布了新产品EdgeOne Makers，旨在简化AI Agent的开发和部署流程。通过执行三条命令即可完成从安装到本地测试的全过程，包括`npm install -g edgeone`、`edgeone makers create --template openai-agents-starter-node`等。本地测试网站可直接观察Agent对话和工具调用细节，线上支持绑定域名和关联Github持续迭代。当前处于Beta内测阶段，注册可免费领取50万Token。

AI产品腾讯云 EdgeOne EdgeOne Makers 智能体部署工具

推荐理由：腾讯云EdgeOne出了个Makers，几行命令就能把AI Agent框架跑起来，不用自己折腾环境，节省大量时间。

原文

10:10

arXiv cs.AI@Bo Shen, Lifeng Chang, Tianyuan Wei, Yunpeng Li, Feng Shi, Yichen Han, Peijie Gao, Shiyi Kuang, Xin Chang, Dehui Li

这篇论文提出ANIS（Agent-Native Immune System），首个嵌入智能体认知循环的生物启发式内生防御架构。它设计了六层免疫塔（L0-L5），其中L1作为非认知的物理与逻辑隔离层。论文建立了智能体病毒和智能体疫苗的统一分类，并提出了Harness Triad（Meta、Self、Auto）实现持续免疫学习（CIL），使疫苗能动态适应新威胁。ANIS在运行时提供动态“执法”机制，与静态的模型对齐形成互补。

论文 ANIS 智能体 AI安全运行时防御免疫学习

推荐理由：这篇论文把免疫系统思路直接嵌入到智能体内部，用六层防护对抗运行时攻击，和传统外围防御完全不同，值得看看。

原文

10:10

arXiv cs.AI@Daniel Russo

一篇来自arXiv的论文研究了AI编程智能体在共享仓库中合并拉取请求带来的集成摩擦问题。通过对超过93万条智能体编写的拉取请求进行测量，发现约一半的摩擦变化归因于仓库本身，而非单个贡献或智能体。智能体贡献的仓库级摩擦是人类的约两倍（组内相关系数0.30 vs 0.16），该差距在控制代码库规模、年龄、任务形态等变量后依然存在。论文提出AI原生软件的风险是生态系统属性，应通过仓库级而非单智能体方式进行评估和治理。

论文智能体 AI编程代码仓库拉取请求集成摩擦

推荐理由：这篇论文用93万条数据告诉你，AI写代码带来的隐患不在单个智能体，而在整个仓库。看完你就明白为什么只测单个AI不够用了。

原文

10:08

arXiv cs.AI@Zuoou Li, Wenlong Zhao, Kelly Yu, Weitong Zhang, Paul M. Matthews, Wenjia Bai, Bernhard Kainz, Mengyun Qiao

CPAgents是一个由三个AI智能体（Analyst、Proposer、Verifier）组成的迭代框架，用于自动构建心血管表型关联研究中的可解释复合表型（如多项式、比值、交互形式）。在72个分类器-疾病-指标组合中，CPAgents生成的复合表型在56个组合中取得最优排名（基线仅18个），涵盖全部9个临床疾病类别。该方法能自动发现超出专家手工特征选择的更强表型-疾病关联，并生成透明的证据链。

AI模型 CPAgents 智能体表型关联心脏疾病可解释AI

推荐理由：这篇论文提出了CPAgents，用三个智能体自动组合心脏影像特征，相比传统方法在56/72测试中拿第一。适合关心AI辅助医学研究的读者。

原文

08:18

08:18IT之家（博客/媒体）

惠普与 OpenAI 达成战略合作，将在全球业务中全面部署 OpenAI Frontier 平台，用于提升客户体验和优化内部运营。OpenAI 于 2025 年 2 月推出 Frontier，帮助企业构建和管理 AI 智能体。惠普、Intuit、Oracle、State Farm、Thermo Fisher 和 Uber 是首批采用 Frontier 的公司。Frontier 支持与现有数据和应用集成，无需重新部署，智能体可通过多种界面访问。

行业惠普 OpenAI Frontier 智能体企业合作

推荐理由：惠普和 OpenAI 联手，把 Frontier 智能体平台铺到全球业务里，帮你理解企业级 AI 怎么落地。

原文

07:51

elvis@omarsar0

精选

剑桥大学提出 Red Queen Gödel Machine，通过让智能体与评估器共同进化来解决自我改进停滞问题。传统自改进循环中智能体学会欺骗固定评估器，导致奖励黑客。新方法让评估器的难度随智能体能力提升而增加，保持循环持续有效。论文编号 arxiv.org/abs/2606.26294。

论文 Red Queen Gödel Machine Cambridge 智能体自我改进评估器

推荐理由：做智能体自循环的该看看这篇，剑桥让评估器和智能体一起进化，避免奖励黑客，思路很直接。

原文

07:03

GitHub@github

精选

GitHub 在 SWE-bench Verified、SWE-bench Pro、SkillsBench、TerminalBench、Win-Hill 五个基准上对 Copilot agentic harness 进行了对比测试。固定模型和任务后，任务解决率与模型原生 harness 持平。在大多数配置下 token 消耗更少，最高可省 30%。Copilot 支持超过 20 个模型，用户可针对任务自由切换效率或质量。

AI产品 GitHub Copilot SWE-bench 编程助手智能体

推荐理由：GitHub 实测了 Copilot 智能体框架，五个基准上不输原生，还省 token，支持 20 多种模型，值得试试。

原文

06:46

06:46Simon Willison’s Weblog（博客/媒体）

Jon Udell 反对“人类在环中”的说法，认为这拱手交出了主动权。他主张“人类代理在环中”，即由人类主导流程，邀请 LLM 代理加入团队。他以“Doctor, it hurts when agents create unreviewable PRs”为例，强调代理不该成为产生不可审查代码的黑箱。核心是让代理辅助而非替代人类的判断与工作流。

技巧 Jon Udell 智能体编程助手 LLMs

推荐理由：Jon Udell 换了个角度聊 AI 工作流：别让代理做黑箱，让它们当团队助手，人类还是舵手。

原文

06:36

宝玉@dotey

精选

Anthropic 上周推出 Claude Tag 的 beta 版，面向 Claude Team 和 Enterprise 用户。它允许用户在 Slack 频道中 @ Claude，后台自动拆解任务并回复结果。Andrej Karpathy 将其视为 LLM 交互的第三次重大重新设计（从网页到桌面 App 再到异步持久实体）。Gergely Orosz 指出核心不是 Slack，而是云端 AI 连接内部系统后开箱即用。他认为真正受益的是新员工、非工程师和不熟悉代码库的开发者，而集成难度是最大挑战。

AI产品 Claude Anthropic Slack 智能体编程助手

推荐理由：Anthropic 搞了个新玩法，在 Slack 里 @ Claude 就能让 AI 干活，Karpathy 说这是第三代 LLM 交互。你可以看看它是怎么改变团队协作的。

原文

03:54

Harrison Chase@hwchase17

Fleet 发布新功能，允许用户将 AI agent 分享到 Slack、Microsoft Teams 和电子邮件等渠道。通过 Fleet 的 Slack 集成，非技术人员可以轻松构建 agent 并部署到团队日常工作的地方。这样 agent 就能在公司内部自然传播，无需离开已有工作平台。

AI产品 Fleet Slack Teams 智能体企业协作

推荐理由：Fleet 这次更新让 agent 能直接嵌入 Slack/Teams，同事不用切换界面就能用上，部署超简单。

原文

02:45

Harrison Chase@hwchase17

LangChain宣布推出DeepAgents Harness，作为测试智能体行为的框架（harness）。同时提供LangSmith Sandboxes用于安全隔离的执行环境，以及面向LLM输出的评估（Eval）功能。这些组件集成主流模型提供商，并通过LangSmith Engine驱动“模型-测试-沙箱-评估”闭环。该方案旨在帮助企业基于自身领域知识和客户工作流，自主构建和优化智能体系统。

AI产品 LangChain DeepAgents LangSmith 智能体评估

推荐理由：LangChain把智能体测试、沙箱和评估整合到一起了，企业可以自己掌控从模型选择到部署的全流程，不用再拼凑各种工具。

原文

01:45

AI产品黄叔@PMbackttfuture

用户使用Hermes生成手机壁纸，并将微信Agent入口交回Hermes，同时接入flomo MCP实现记忆同步。每次手动触发“保存到flomo”时，内容会同步到flomo，并立即触发即时增强功能，从flomo/Hermes记忆中检索相关知识点推送笔记。这为知识工作者提供了利用AI助手整理灵感和长期记忆的工作流。

技巧 Hermes flomo MCP/工具工作流智能体

推荐理由：教你给AI设个微信入口，用Hermes做壁纸，还能自动同步到flomo，随时调取记忆，挺实用的。

原文

00:36

Yangyi@Yangyixxxx

Nous Research 的 Hermes Agent 发布 MoA（Mixture-of-Agents）预置虚拟模型，允许在不同时刻为同一 Agent 路由不同模型，类似快慢脑逻辑。在新基准测试中，该方案比 Opus 4.8 高出 8%，比 GPT 5.5 高出 11%。多 Agent 场景下效果更显著，延续了 Hermes 的工程化优势。

AI模型 Hermes Nous Research 智能体推理模型 MoA

推荐理由：Nous Research 让 Agent 在不同时刻自动切换不同模型，比单一模型更强，新基准上比 Opus 4.8 高8%、比 GPT 5.5 高11%。

原文

6月28日

22:27

NVIDIA AI@NVIDIAAI

NVIDIA、Stripe 与 Nous Research 联合举办 The Hermes Agent Accelerated Business Hackathon，要求开发者用 Hermes Agent 构建能赚钱、花钱、运营业务的智能体。比赛使用 NVIDIA NemoClaw 安全运行、Nemotron 3 Ultra 快速推理，以及 Stripe Skills 实现支付和资源采购。奖品包括第一名 $10,000 现金 + DGX Spark + $5,000 Stripe Credits，第二名 $5,000 现金 + DGX Spark + $3,000 Stripe Credits，第三名 $2,500 现金 + DGX Spark + $1,000 Stripe Credits。参赛者需在 6 月 30 日（周二）前提交 1-3 分钟 demo 视频和简短说明至 Discord 及表单。

行业 NVIDIA Stripe Nous Research Hermes Agent DGX Spark 智能体黑客松

推荐理由：想赢一台 DGX Spark 吗？用 Hermes Agent 造个自动赚钱的 AI 公司，前三名都有现金加硬件，截止 6 月 30 日，快上车。

原文

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

6月12日

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？