AITP
精选全部 AI 动态AI 日报Agent 接入关于更新日志信源提报反馈
登录 / 注册
AITOP
全部 AI 动态
AI 相关资讯全量信息流
全部博客资讯推文论文
全部模型产品行业论文技巧
标签:自主代理×
6月19日
11:08
11:08arXiv cs.LG@Jun He, Deying Yu
论文提出 Sovereign Execution Broker (SEB),一种运行时执行边界,用于证书绑定的自主基础设施。SEB 消耗由 Sovereign Assurance Boundary (SAB) 签发的证书,验证请求变更是否匹配认证执行契约,检查有效期窗口、策略纪元、撤销纪元和实时状态漂移。SEB 铸造作用域执行身份,调用基础设施 API,记录签名决策和结果记录。原型在 AWS 和 Kubernetes 集群上评估,测量延迟开销、撤销传播、漂移检测和故障注入下的安全性。
论文Sovereign Execution Broker自主代理证书绑定执行边界安全

推荐理由:想给自主代理加一把安全锁?这篇论文提出了SEB,一个在运行时强制证书绑定的执行边界,能控制突变操作。实测在AWS和K8s上延迟开销可控。
原文
6月16日
20:46
AITOP6月16日 20:46
600亿美元买下Cursor,xAI终于拿到了编程工具,但真正值得跟踪的或许不是AI600亿美元买下Cursor,xAI终于拿到了编程工具,但真正值得跟踪的或许不是AI
6月12日
12:57
AITOP6月12日 12:57
Claude代码里藏了个20260612,18个月后的AI记忆革命已经开始倒计时
6月11日
15:28
AITOP6月11日 15:28
1107 vs 303:谷歌悄悄开源了一个“拆打字机”的模型,把大模型速度翻了4倍
15:23
AITOP6月11日 15:23
DiffusionGemma颠覆文本生成?自回归模型的“统治”要结束了
15:07
AITOP6月11日 15:07
每秒1107个token,Google开源的扩散模型为什么能改变本地推理格局?
6月9日
01:51
01:51Aravind Srinivas@AravSrinivas
精选
Perplexity AI 与哈佛大学合作发布了一项关于其自主代理产品 Perplexity Computer 在真实工作场景中的研究。研究为期三个月,发现使用 Computer 的工人完成任务的时间比仅用搜索减少了 87%,成本降低了 94%,同时用户满意度更高。该代理能够进行跨学科搜索,提供比多步搜索更自主、更高质量的输出。这标志着从传统聊天界面到自主代理的转变,为知识工作者提供了更高效的工具。
AI产品Perplexity自主代理效率提升哈佛研究知识工作

推荐理由:Perplexity Computer 用真实数据证明了自主代理比传统搜索快 87%、省 94% 成本,做研究、写报告、跨领域查资料的知识工作者可以直接用起来,效率提升肉眼可见。
原文
6月4日
13:45
13:45Gary Marcus@GaryMarcus
Sam Altman 在直播中透露,OpenAI 内部顶级用户每月消耗 1000 亿 tokens,六年前仅 10 万。外部客户消耗更高,成本抱怨已成为他听到的第二大客户问题。Altman 计划推出“始终在线”的自主 AI 代理,这将使 token 消耗量远超当前水平。然而,GitHub Copilot 刚转为 token 计费两天,用户就用光了月额度。Ramp 数据显示 Anthropic 在企业支出上已超越 OpenAI,客户正在抵制高成本。IBM CEO 也质疑行业 6-8 万亿美元资本支出的合理性。Altman 描绘的无限需求愿景与客户降本诉求之间存在根本矛盾。
行业OpenAISam Altmantoken消耗企业AI成本自主代理

推荐理由:Altman 的自主 AI 代理愿景将让 token 消耗暴增,但企业客户已在抱怨成本——做 AI 采购或预算决策的团队,看完会重新评估供应商定价策略。
原文
5月23日
18:47
18:47Decoder@Jonathan Kemper
88°
阿里巴巴Qwen团队发布Qwen3.7-Max,这是一款专为长时间自主代理任务设计的专有模型。在基准测试中,它匹配了Claude Opus 4.6,并击败了DeepSeek V4 Pro和Kimi K2.6等中国竞争对手。团队还演示了该模型操控四足机器人。该模型曾自主运行35小时,优化其自有定制芯片的代码,展示了强大的长期任务执行能力。
AI模型Qwen3.7-Max自主代理芯片优化基准测试阿里巴巴

推荐理由:Qwen3.7-Max展示了AI在芯片设计等复杂工程任务中的自主长时运行能力,做硬件优化或AI代理开发的团队值得关注其实际表现。
原文
5月21日
07:59
07:59Paul Couvert@itsPaulAi
76°
Google 即将推出的 Gemini Spark 是一个真正的自主智能体,可以 24/7 在 Gemini 中运行。它能从 Gmail、网页、Drive 等获取上下文,自主处理任何任务,甚至可以在手机上使用。与许多未来规划不同,Gemini Spark 将在下周而非明年推出。这一进展标志着 AI 从对话工具向全天候自主代理的转变,对个人和团队效率有重大影响。
AI产品智能体Gemini自主代理Google效率工具

推荐理由:Gemini Spark 让 AI 从对话助手升级为全天候自主代理,做自动化工作流和效率提升的团队可以直接在下周试用,值得关注。
原文
精选全部日报登录