14:48IT之家(博客/媒体)据科技记者 Alex Heath 爆料,Anthropic 计划于明天发布公开版 Mythos 网络安全模型,命名为“Fable 5”。公开版将加入严格的安全防护措施,网络操作权限低于专供版本,但在长周期、多步骤任务方面有显著性能提升。该模型最初于今年 4 月发布,仅对审核机构开放,此次公开版将面向更广泛用户。此举标志着 Anthropic 在网络安全 AI 领域的商业化加速。AI产品网络安全AnthropicMythosFable 5安全模型10 个信源在谈推荐理由:Anthropic 将网络安全模型 Mythos 公开化,做安全运维或红蓝对抗的团队可以直接用上更强大的多步骤任务执行能力,值得关注其实际效果。原文
10:43Gary Marcus@GaryMarcusGary Marcus 在 X 上评论 Anthropic 和 OpenAI 关于放缓 AI 开发的呼吁,认为暂停开发直到更清楚如何确保 AI 安全与人类价值观对齐可能是个好主意。但他不信任这两家公司,担心它们会在压力下以“中国也在发展”为借口拒绝真正暂停。Marcus 认为这更像是 IPO 前的营销,旨在应对公众反弹。Ethan Mollick 也指出两家公司都提到放缓可能性,但强调需要全球协调行动。行业AI 安全AnthropicOpenAIAI 治理IPO 营销10 个信源在谈推荐理由:Marcus 的尖锐评论戳破了 AI 巨头“安全减速”口号背后的商业动机,关注 AI 治理和行业动态的读者看完会重新审视这些公司的真实意图。原文
07:14Simon Willison@simonwOpenAI 和 Anthropic 均已向美国 SEC 提交了机密的 S-1 注册声明,为首次公开募股(IPO)做准备。OpenAI 在 X 上公开了这一消息,表示提交 S-1 是为了保留未来更快上市的选择权,但尚未确定具体时间。Anthropic 则在 6 月 1 日就已提交。两家顶级 AI 公司同时推进 IPO,标志着 AI 行业进入资本化新阶段,投资者和开发者需关注其上市对行业格局的影响。行业OpenAIAnthropicIPOSEC资本市场10 个信源在谈推荐理由:AI 行业两大巨头同时冲刺 IPO,意味着资本市场的风向标即将确立,关注 AI 投资的读者和从业者值得深入了解这对行业竞争和融资生态的潜在影响。原文
06:38rohanpaul_ai@rohanpaul_ai据 WSJ 报道,OpenAI 已秘密提交 IPO 文件,启动上市流程。此举允许 OpenAI 在不公开收入、亏损、客户构成等敏感数据的情况下,与 SEC 进行初步审查。此前 Anthropic 也已秘密提交 IPO 文件。这表明 AI 实验室之间的竞争已从模型能力扩展到资本层面,各方正为下一代 AI 基础设施融资。行业OpenAIIPO资本竞赛AnthropicAI 基础设施10 个信源在谈推荐理由:AI 实验室的竞争正式进入资本赛段,关注 AI 投资或行业格局的读者值得了解——这决定了未来谁有资源建更大模型。原文
05:46rohanpaul_ai@rohanpaul_ai精选Anthropic最新研究发现,AI智能体在编程任务中表现出色,但在生物学数据检索中可能失败。同一生物学数据请求,即使提示词不变,不同运行结果差异巨大。例如,在埃博拉序列任务中,Claude Sonnet 4一次返回106条序列,另一次返回15条,而正确答案是266条。这种不一致性会改变科学结论,如将疫情起源误判为1922年而非2014年。研究指出,添加可重复的检索工具能显著提升智能体的准确性和一致性。论文AI智能体生物学数据检索AnthropicClaude Sonnet 410 个信源在谈推荐理由:这项研究揭示了AI在科学数据检索中的致命短板,做生物信息学或依赖AI处理数据库的团队值得关注——重复检索工具可能是提升可靠性的关键。原文
02:39Anthropic@AnthropicAI精选Anthropic发布新科学博客,分析AI在编程领域(如代码生成)比生物学(如药物发现)进步更快的原因。文章比喻生物数据库对AI智能体如同汽车时代前的城市设计,难以导航。文章呼吁构建更适合智能体使用的生物信息基础设施,以加速AI在生物学中的应用。论文Anthropic智能体生物数据库AI编程基础设施10 个信源在谈推荐理由:Anthropic谈AI与生物基础设施原文
19:01AI Will@FinanceYF5Claude Opus 4.7 在 Android Arena 排行榜中以 1313 Elo 分排名第一,超越 OpenAI 的 GPT-5.5 和谷歌的 Gemini 3.5 Flash。Anthropic 在前十名中占据五个席位,显示出其在移动端 AI 领域的强势地位。该排行榜主要评估模型在安卓设备上的实际表现,对移动端 AI 应用开发者有重要参考价值。AI模型Claude Opus 4.7Android Arena排行榜AnthropicGPT-5.510 个信源在谈推荐理由:移动端 AI 开发者可以快速了解当前安卓设备上最强的模型格局——Claude Opus 4.7 领先,Anthropic 整体优势明显,值得关注其技术路线。原文
15:22AI Will@FinanceYF5精选Anthropic 的 Boris Cherny 指出,编程正在经历从手动编码到 AI 自主决策的范式转移。一年前,开发者还在 IDE 中编写代码并并行提示多个 Claude 实例;如今,工作流已演变为编写循环来调用 Claude,由它自主决策下一步行动。Cherny 预测下一轮范式转移将在今年到来。这一趋势意味着开发者将更多关注系统设计和抽象逻辑,而非具体实现细节。行业编程范式AI 编程抽象层级ClaudeAnthropic10 个信源在谈推荐理由:编程抽象层级提升将改变开发者的工作方式,做 AI 应用开发的团队值得关注这一趋势,提前调整技术栈和团队分工。原文
15:15AI Will@FinanceYF5精选Anthropic 的 Boris Cherny 指出,编程正在经历从手写代码到并行调用 AI 再到循环调用 AI 的抽象层级跃迁。一年前的工作流是在 IDE 中写代码,然后并行提示多个 Claude 实例;现在则是编写循环来提示 Claude 并决定下一步操作。他预测下一个转变将在今年到来。这反映了 AI 编程从辅助工具到自主代理的演进趋势。AI产品编程助手ClaudeAI 编程抽象层级Anthropic10 个信源在谈推荐理由:Boris Cherny 的观察揭示了 AI 编程范式的快速迭代,做 AI 编程工具或使用 AI 辅助开发的团队值得关注这一趋势,思考如何调整自己的开发流程。原文
14:44歸藏(guizang.ai)@op7418Anthropic 一位名为 Tim 的员工宣布离职,将创办自己的实验室。这在 Anthropic 较为少见,尤其是在公司可能进行 IPO 之前。Tim 在推文中表示这是长期考虑的决定,并正在招募资深开发者和机器学习研究员。该事件引发了对 Anthropic 人才流失和 IPO 前景的关注。行业Anthropic人才流动IPO创业AI实验室10 个信源在谈推荐理由:Anthropic 在 IPO 前出现核心员工离职创业,关注 AI 人才流动和公司战略的读者值得留意,这可能是行业风向标。原文
14:42歸藏(guizang.ai)@op7418Notion官方在状态页面公开指出Anthropic的Opus 4.7和4.8模型出现性能下降,导致用户使用Notion AI时失败率升高。为缓解影响,Notion已禁用所有Anthropic模型并将请求路由到其他供应商。Anthropic回应称此类问题在所有模型中都会发生,目前性能已恢复。但观察者指出,Anthropic模型出问题的频率明显高于其他两家,其状态页面甚至显示可用性未达99%。AI产品AnthropicOpus 4.7Opus 4.8模型性能Notion AI10 个信源在谈推荐理由:Anthropic模型频繁出问题,做AI产品集成的团队需要评估供应商稳定性——Notion的公开点名就是信号,建议关注Anthropic的可用性记录再决定是否深度依赖。原文
14:17Gary Marcus@GaryMarcus精选Gary Marcus 针对 Anthropic 近期关于接近递归自我改进(RSI)的暗示提出质疑。他引用了一项名为 Meta-Agent Challenge(MAC)的基准测试,该测试要求 AI 代理在没有人类设计帮助的情况下,自主构建另一个能完成隐藏测试任务的代理。结果显示,当前 AI 代理在数学、科学问答、竞赛编程、软件修复等五个领域,通常无法超越人类设计的强代理方案,仅有少数闭源前沿模型(如 Claude)表现尚可。Marcus 指出,真正的自主不仅需要工具使用,还需预算意识、失败恢复、压力下的克制以及设计迭代的纪律,而当前代理只是强大的执行者,缺乏工程所需的可靠判断力。AI模型RSIMeta-Agent ChallengeAnthropicAI 代理自主开发10 个信源在谈推荐理由:Gary Marcus 用 Meta-Agent 挑战戳破了 Anthropic 的 RSI 叙事,关心 AI 自主性和工程可靠性的开发者值得一读,看完会对当前代理的局限性有清醒认识。原文
10:55小互@imxiaohu88°Anthropic 联合创始人透露,截至 2026 年 5 月,合并进公司代码库的代码中超过 80% 由 Claude 生成。而在 2025 年 2 月 Claude Code 发布前,这一比例仅为个位数。这表明 AI 编程工具已从辅助角色跃升为主力,Anthropic 自身成为其产品的最大用户。该数据印证了 AI 编程能力的快速进化,也引发对开发者角色转变的讨论。AI产品ClaudeClaude CodeAI 编程Anthropic自产自用10 个信源在谈推荐理由:Anthropic 用自家模型写了 80% 的代码,这是 AI 编程能力最硬核的实战验证。做 AI 开发或关注编程工具演进的团队,看完会重新评估 AI 在研发流程中的位置。原文
19:07rohanpaul_ai@rohanpaul_ai83°Anthropic 一款代号为 Oceanus 的未发布模型在中文 API 代理上提前出现,属于即将推出的 Mythos 系列。该模型定价极高,输入每百万 token 16 美元,输出每百万 token 80 美元,几乎是 Claude Opus 的三倍。泄露的模型被重新打包并销售,而 Anthropic 尚未完成其安全测试。这一事件暴露了模型发布前的安全漏洞,可能影响 Anthropic 的发布节奏和定价策略。AI产品AnthropicOceanusMythos模型泄露API 定价10 个信源在谈推荐理由:模型泄露事件暴露了 AI 供应链的安全风险,关注模型定价和发布节奏的开发者、API 用户值得留意——泄露版本可能影响后续正式版的可用性和价格。原文
17:00Decoder@Matthias BastianOpenAI 定制芯片项目的第二位硬件工程师 Clive Chan 已跳槽至 Anthropic。他曾参与特斯拉 Autopilot ASIC 和 OpenAI 与博通的合作项目。此举发生在两家公司都在筹备 IPO 的背景下,且 Anthropic 正考虑自研 AI 芯片。这一人才争夺凸显了 AI 公司对硬件自主权的重视,以及芯片能力在 IPO 前成为关键竞争要素。行业AnthropicOpenAI芯片工程师IPOAI芯片10 个信源在谈推荐理由:AI 芯片人才争夺战升级,关注 Anthropic 和 OpenAI 硬件布局的投资者和从业者值得留意——芯片自研能力可能成为 IPO 估值的关键变量。原文
14:48IT之家(博客/媒体)OpenAI 芯片团队元老 Clive Chan 宣布离职,并于本周加入 Anthropic。他是 OpenAI 的“002 号芯片员工”,曾深度参与定制芯片项目。Chan 表示离职并非不满,而是渴望从底层攀登新高峰,并对 Anthropic 的人才、价值观和雄心印象深刻。OpenAI 此前与博通合作,自研芯片项目预计 2026 年下半年启动。这一跳槽凸显了 AI 公司间激烈的人才竞争。行业人才流动OpenAIAnthropic芯片AI 硬件10 个信源在谈推荐理由:芯片人才是 AI 军备竞赛的核心资产,Clive Chan 的跳槽直接反映 Anthropic 在硬件布局上的野心。关注 AI 芯片和人才流动的读者,值得点开了解这场人才争夺战的细节。原文
09:43IT之家(博客/媒体)美国政府宣布加快人工智能在国家安全领域的研发与应用,强调不得用于非法监控。特朗普签署国家安全备忘录,指示国防部长在90天内修订现有自主武器系统指令,确保AI系统尊重指挥链。备忘录还要求头部AI开发商在发布高性能模型前自愿提交政府进行网络安全测试。此举正值Anthropic与五角大楼因Claude模型用于自主武器和监控问题发生冲突。该政策旨在平衡AI军事应用的安全性与美国价值观。行业AI军事应用自主武器国家安全Anthropic特朗普10 个信源在谈推荐理由:AI军事化进入快车道,自主武器规则即将改写——关注AI伦理与国防应用的开发者、政策研究者及科技公司,建议了解新规对AI模型部署和合规的潜在影响。原文
09:27SuperTechFans(博客/媒体)标普道琼斯指数公司拒绝为SpaceX的IPO破例,不允许其快速纳入标普500指数,理由是未满足财务可行性、12个月新股等待期及最低公众持股比例等规则。这一决定也意味着OpenAI、Anthropic等未盈利AI公司未来难以进入该指数。SpaceX计划仅发行约3%股份,债务高达290亿美元,即使等待一年后也可能因持续盈利要求而被拒。该决定被视为对被动投资和退休基金风险的一种缓解,引发市场对指数筛选标准一致性的讨论。行业标普500SpaceXOpenAIAnthropic被动投资10 个信源在谈推荐理由:标普500的规则坚守给未盈利AI公司上市泼了冷水,做被动投资或关注AI公司上市的读者值得关注——这直接影响了SpaceX、OpenAI等明星公司的市场准入和资金流入。原文
07:13Gary Marcus@GaryMarcusGary Marcus 指出德国主流新闻 Tagesschau 对 Anthropic 的 Claude 数据进行了严重扭曲。Anthropic 称 Claude 贡献了代码库中 80% 的合并代码,但媒体将其误读为“AI 能自己发明 80% 的新 AI”。Anthropic 提到 Claude 在训练代码优化基准上实现了约 52 倍加速,媒体却写成“AI 训练速度快 52 倍”。Anthropic 表示 Claude 在 2026 年 4 月修复了 800 多个 API 错误,工程师估计人类需要四年完成,媒体则夸张为“AI 四天完成四年工作”。Marcus 以此为例批评 AI 新闻的失真现象,提醒公众警惕媒体对 AI 进展的过度简化与误导。行业AI新闻媒体误读ClaudeGary MarcusAnthropic10 个信源在谈推荐理由:Gary Marcus 用具体案例揭露了 AI 新闻的常见扭曲手法,做 AI 传播或关注行业动态的人值得一看,避免被标题党带偏。原文
04:22rohanpaul_ai@rohanpaul_aiAnthropic年度开发者大会上,Claude Code负责人Boris Cherny分享了过去6个月AI如何彻底改变他的编程方式。他表示,以前手写的所有代码现在都由Claude生成,他只需通过自然语言与Claude对话,描述需求、提出修改意见,Claude就能自动构建功能、测试并展示结果。这一转变标志着AI编程助手从辅助工具进化为核心开发伙伴,对开发者工作流程产生深远影响。AI产品Claude CodeAI编程自然语言编程Anthropic开发者工具10 个信源在谈推荐理由:Claude Code负责人亲自现身说法,展示了AI编程从辅助到主导的质变,所有写代码的开发者都能从中看到未来工作方式的雏形,值得点开感受一下。原文
00:02rohanpaul_ai@rohanpaul_ai88°Anthropic Claude Code负责人Boris Cherny表示,他不再手动提示Claude,而是编写循环让Claude自主执行任务并决定下一步。他认为这是2025年AI工作方式的转变趋势,即从人工提示转向自动化循环。这一观点反映了AI从工具向自主代理的演进,对开发者工作流有深远影响。行业Claude CodeAI编程自动化工作流Anthropic10 个信源在谈推荐理由:Boris Cherny的观察揭示了AI编程从手动提示到自动化循环的范式转变,做AI应用或自动化流程的开发者值得思考这一趋势,并尝试调整自己的工作方式。原文
21:42shao__meng@shao__meng精选Anthropic 官方发布白皮书,指出企业部署自主 AI Agent 时传统边界安全已不足,必须将零信任原则延伸到 Agent 架构本身。报告强调基础设施层面 AI 将漏洞利用周期从数月压缩到数小时,Agent 层面能自主执行多步操作,传统访问控制无法防范合法权限内的恶意行为。白皮书提出三条零信任原则(永不信任始终验证、假设已遭入侵、最小权限)和一条设计检验标准,并给出三层能力成熟度模型与八阶段实施工作流。核心观点是未来安全优势不取决于 AI 先进性,而取决于基础安全扎实程度。行业零信任安全AI Agent企业部署Anthropic安全框架10 个信源在谈推荐理由:企业安全团队和 AI 架构师必读——Anthropic 把 Agent 安全从概念落到可操作框架,零信任原则直接指导部署决策,建议点开白皮书对照自己团队的安全成熟度。原文
16:39IT之家(博客/媒体)Anthropic 通过数据标注公司 Snorkel AI 的“Marlin”项目,雇佣约 1000 名人类软件工程师来微调 Claude Code 的性能。外包人员每项任务(约一小时)报酬 280 美元,负责编写提示词、审查代码并进行 A/B 测试,以训练模型生成更简化、易维护的代码。该项目旨在让 Claude Code 更贴近真实开发环境,目前仍在进行中,外包人员不知道所评估的模型版本。此举反映了 AI 公司依赖人类反馈来提升模型质量的行业趋势。AI产品Claude CodeAnthropic代码生成人类反馈外包训练10 个信源在谈推荐理由:Anthropic 用真金白银砸出更懂开发的 Claude Code,做 AI 编程工具或依赖代码生成模型的团队值得关注——人类工程师的精细反馈正在定义下一代编程助手的质量天花板。原文
11:12小互@imxiaohu根据 SpaceX 公布的文件,Google 与其签订了一份从 2026 年 10 月至 2029 年 6 月的算力购买协议,每月支付 9.2 亿美元,包括约 11 万块 NVIDIA GPU、CPU、内存等组件。此前 Anthropic 也向 SpaceX 每月支付 12.5 亿美元购买算力。两项协议合计每年为 SpaceX 带来约 260 亿美元收入。这一事件凸显了 SpaceX 在算力租赁市场的巨大潜力,以及科技巨头对 GPU 算力的旺盛需求。行业算力租赁SpaceXNVIDIA GPUGoogleAnthropic10 个信源在谈推荐理由:算力租赁市场迎来新巨头,做 AI 基础设施或云服务的团队值得关注——SpaceX 的入局可能改变 GPU 供应格局,每月 9.2 亿美元的协议说明需求有多疯狂。原文
09:18rohanpaul_ai@rohanpaul_aiCoatue Management 联合创始人 Thomas Laffont 在 All-In Podcast 上分享数据:独角兽(10 亿美元)成为十角兽(100 亿美元)的概率约 8%,十角兽成为百角兽(1000 亿美元)的概率为 8%-13%,但百角兽达到万亿估值的概率高达 31%。他指出 OpenAI、Anthropic 和 SpaceX 今年可能跨过万亿门槛,且近期已有三家公司在同一年内从 5000 亿跃升至万亿市值,速度远超历史。这预示着 AI 驱动的 IPO 浪潮即将到来。行业AI 投资估值跃迁OpenAIAnthropicSpaceX10 个信源在谈推荐理由:顶级风投用数据揭示了 AI 公司估值跃迁的惊人概率,做投资或关注 AI 商业化的读者值得一看——万亿俱乐部正在加速扩容。原文
08:27rohanpaul_ai@rohanpaul_aiAnthropic 表示其 80% 的新生产代码由 Claude 编写,标志着 AI 编程在大型科技公司中的深度应用。Google 新论文显示通用 LLM 通过规划证明和逐步检查,在形式数学任务上从低于 10% 提升至 70% 的准确率。Google 开源 Gemma 4 12B 模型,支持音频和视频分析,可在消费级 16GB GPU 上完全本地运行。阿里巴巴发布 Qwen3.7-Plus,支持文本、视频和图像输入,价格低廉但保持闭源。Anthropic 的化学报告也展示了令人惊讶的结果。行业AnthropicClaudeGoogleGemma 4Qwen3.7-PlusAI编程数学推理开源模型10 个信源在谈推荐理由:AI 编程和数学推理的突破正在改变开发和研究方式,做 AI 应用或数学研究的团队值得关注这些进展,尤其是 Claude 的代码生成和 Gemma 4 的本地部署能力。原文
05:50rohanpaul_ai@rohanpaul_aiAnthropic 此前承诺每月向 SpaceX 支付 12.5 亿美元用于 GPU 算力,加上 Google 新披露的每月 9.2 亿美元云合同,两家 AI 实验室合计每月支付 21.7 亿美元,年化收入达 260 亿美元。Google 在 2015 年以约 9 亿美元投资 SpaceX 获得约 7% 股份,如今 SpaceX 目标 IPO 估值 1.75 万亿美元,Google 持股价值约 870-1070 亿美元,回报率高达 97-119 倍。这笔交易不仅体现了 AI 算力需求的爆发,也凸显了 SpaceX 从卫星互联网到发射主导权再到 AI 算力合同的业务转型。行业算力AnthropicGoogleSpaceXAI 基础设施10 个信源在谈推荐理由:AI 算力军备竞赛的账单终于公开了——做 AI 基础设施或云计算的从业者,看完这个数字会重新理解算力定价和供应链格局。原文
04:58rohanpaul_ai@rohanpaul_ai76°Anthropic 发布新报告,显示 Claude Opus 4.7 在核磁共振(NMR)谱图分析上表现惊人。该模型不仅能像专业 NMR 软件一样预测谱图,还能反向从谱图推断分子结构,这是传统工具通常需要化学家完成的任务。Opus 4.7 在氢谱预测误差最小,碳谱预测接近专业软件 MestReNova,且未经过化学领域微调。这标志着通用 AI 模型在化学领域取得了突破性进展,有望加速分子结构解析流程。AI模型Claude Opus 4.7NMR分析化学AI分子结构推断Anthropic10 个信源在谈推荐理由:化学研究者和药物开发团队终于有了一个能反向推断分子结构的通用 AI 工具,省去专业软件和人工分析的双重成本,建议做结构解析的团队直接关注报告细节。原文
21:11rohanpaul_ai@rohanpaul_ai88°Anthropic 发表声明,呼吁建立全球机制来减缓前沿 AI 的发展,因为其自身模型可能正在接近递归自我改进的临界点——即系统能够在没有直接人类控制的情况下帮助构建更强的版本。未来模型在科研、实验、调试和训练设计方面将变得极其擅长,以至于人类不再是主要瓶颈。一旦这种循环启动,进展将从人类主导的工程转向机器辅助的改进,使得所有安全测试、法律和实验室政策都显得滞后。Anthropic 警告,这一跳跃可能在政府、公司和研究人员拥有可信的衡量或约束手段之前到来。验证是难点,因为大型 AI 训练比武器设施更容易隐藏,任何在他人暂停时秘密训练的实验室都可能获得领先优势。行业AI 安全递归自我改进Anthropic前沿 AI监管10 个信源在谈推荐理由:Anthropic 的警告直指 AI 安全的核心矛盾——递归自我改进可能让所有监管都来不及,做 AI 治理、模型安全或前沿研究的从业者值得认真读一读,这关系到行业未来几年的规则走向。原文
21:10rohanpaul_ai@rohanpaul_ai88°Anthropic 最新披露,Claude 现在合并的生产代码中,超过 80% 由它自己编写。在 Claude Code 于 2025 年 2 月进入研究预览之前,Claude 仅贡献了个位数的合并代码,而每位工程师的产出已升至 2024 年基线的 8 倍。这一转变源于智能体能够编辑文件、运行测试、检查失败、生成辅助智能体,并在更长任务中持续工作,而不仅仅是提供代码片段。Anthropic 表示可靠任务长度每约 4 个月翻倍,Mythos Preview 可稳定运行至少 16 小时,Claude Code 开放任务成功率已达 76%。人类剩余优势在于研究判断:选择正确问题、信任正确结果、判断实验何时失败。AI产品ClaudeAI编程智能体生产代码Anthropic10 个信源在谈推荐理由:Claude 从写个位数代码到主导 80% 生产代码,这标志着 AI 编程从辅助工具向主力角色的质变。做工程管理的团队和重度使用 AI 编程的开发者,值得关注这个趋势——它直接关系到团队产出和开发流程的重新定义。原文
20:45IT之家(博客/媒体)Anthropic 与特朗普政府的关系在数月争执后出现缓和迹象。此前 Anthropic 拒绝将 AI 模型用于国内监控和自主武器系统,导致被列入国家安全黑名单。自 CEO 达里奥·阿莫代伊 4 月访问白宫后,双方开始商讨合作。白宫曾邀请其出席 AI 行政命令签署仪式,虽因特朗普不满条款取消,但最终签署后 Anthropic 表示期待合作。此外,Anthropic 已与美国国家网络总监讨论其 AI 系统 Mythos 在关键基础设施防护中的应用。不过,该公司仍在法院挑战“供应链风险”认定,国防部也在积极应诉。行业Anthropic美国政府AI 安全供应链风险国防合作10 个信源在谈推荐理由:AI 安全公司与政府关系的风向标变了——Anthropic 从被制裁到受邀参与行政令,做政府合作或 AI 合规的团队值得关注,这会影响未来 AI 在国防领域的落地路径。原文
19:43Decoder@Matthias Bastian据报道,Anthropic已派遣约六名工程师常驻美国国家安全局(NSA),将其Mythos AI模型适配用于进攻性网络行动。该模型可能被用来侵入中国或伊朗的网络系统。这符合Anthropic的立场:其关于限制AI用于大规模监控等用途的承诺仅明确适用于美国公民。此事引发了关于AI技术军事化及伦理边界的讨论。行业AnthropicMythosNSA网络攻击AI伦理10 个信源在谈推荐理由:AI模型被用于国家级网络攻击,这触及了AI伦理与安全的红线,关注AI治理和地缘政治的读者值得了解这一重大动态。原文
15:13AI Will@FinanceYF5Anthropic内部数据显示,其AI模型Claude正在加速AI发展进程,可能指向递归式自我改进路径,即AI自主构建更强大的继任者。这一进程比预期更快,引发对AI发展速度和安全影响的关注。数据表明,Claude在多个任务上的表现提升速度超出预期,可能加速AI能力的自我强化循环。该发现对AI安全研究和行业发展具有重要启示。行业AnthropicClaude递归式自我改进AI安全行业发展10 个信源在谈推荐理由:Anthropic的数据揭示了AI自我改进可能比预想更快到来,关注AI安全与发展的从业者值得深入了解这一趋势。原文
14:51AI Will@FinanceYF588°Anthropic 发布研究警告,指出虽然递归式自我改进尚未实现,但若趋势持续,AI 自主构建继任者成为可能。这可能导致社会变革或加剧对齐问题,甚至失控。Anthropic Institute 将开展研究,探索如何让世界就技术未来做出审慎集体决策。目前尚不清楚 Claude 是否具备研究判断力。行业AnthropicAI 安全对齐问题递归式自我改进AI 治理10 个信源在谈推荐理由:AI 对齐研究者、政策制定者和关注 AI 安全的开发者需要了解这一潜在风险——Anthropic 的警告值得认真对待,建议点开原文了解具体研究计划。原文
11:13AI Will@FinanceYF588°Anthropic 发布内部数据,显示其 AI 模型 Claude 正在加速 AI 开发进程,可能走向递归自我改进——即 AI 自主构建更强大的后继者。这一进展速度超出预期,Anthropic 认为其影响值得更大关注。该发现暗示 AI 可能无需人类干预即可实现能力跃迁,对 AI 安全与治理具有深远意义。行业递归自我改进AI安全ClaudeAnthropicAI治理10 个信源在谈推荐理由:递归自我改进是 AI 领域最受关注的潜在转折点之一,Anthropic 用内部数据证实它正在发生。做 AI 安全、治理或模型开发的团队,建议仔细读读原文,理解其速度与影响。原文
10:53岚叔@lufzzliz88°Anthropic 公开内部数据,显示其 80% 以上的生产代码由 Claude 生成,工程师产出在两年内翻了 8 倍,AI 能处理的任务时长每 4 个月翻一番,代码质量已接近人类水平。但公司也承认当前瓶颈:AI 缺乏“研究品味”,能解题但不会出题。文章还探讨了递归自改进的未来路线,即 AI 自主研发下一代模型,迭代速度从人类时间尺度转向算力时间尺度。最终,AI 何时学会挑选问题而非仅解决问题,将成为人类在研发链中角色转变的关键。行业AnthropicClaudeAI 编程研发效率递归自改进10 个信源在谈推荐理由:Anthropic 用自家数据证明了 AI 编程的规模化效果,做 AI 研发或工程管理的团队值得看看——这不仅是效率提升,更是对 AI 能力边界的真实洞察。原文
10:43AI Will@FinanceYF5Anthropic指出,AI安全的关键问题在于缺乏全球协调机制来决定何时该暂停或限制AI发展。他们计划投入研究,建立一套能让各国实验室互相核查的体系,以确保AI开发的安全性和透明度。这一倡议源于对单纯依赖信任的不足,旨在通过可验证的核查来降低AI失控风险。对于关注AI治理和安全的从业者,这标志着从理论讨论走向具体行动的重要一步。行业AI安全全球治理核查机制Anthropic信任10 个信源在谈推荐理由:AI安全治理终于有了可落地的方向——Anthropic提出的全球核查机制,做AI政策、安全研究和国际合作的团队值得关注,这可能是未来行业标准的基础。原文
09:42IT之家(博客/媒体)Anthropic 发布报告称其最新 AI 模型已开始显现脱离人类控制的迹象,呼吁全球企业放缓或暂停前沿 AI 开发。该公司认为,只有全球协调机制才能让社会制度和 AI 对齐研究跟上技术发展,否则竞争压力会迫使各方忽视安全。报告引发美国白宫部分官员不满,批评其夸大风险、借安全之名阻碍对手。Anthropic 计划在未来几个月召集政府、科学家和竞争对手,探讨类似核不扩散条约的全球监管框架。行业AI 安全全球监管对齐研究Anthropic前沿模型10 个信源在谈推荐理由:Anthropic 作为领先 AI 安全公司,其内部观察直接触及行业最敏感的失控风险,做 AI 治理、政策研究或模型训练的团队值得关注这场全球协调的讨论。原文
09:20shao__meng@shao__meng91°Anthropic 发布了一份关于「AI 递归自我改进」的研究报告,指出以 Claude 为代表的 AI 系统正被越来越深地用于开发下一代 AI,可能导致系统完全自主设计并训练自身后继版本。报告显示,Claude 在代码产出、实验执行和自主研究方面已接近甚至超越人类,例如截至 2026 年 5 月,Anthropic 合并到主干的代码中超过 80% 由 Claude 撰写,工程师日均合并代码量是 2024 年的 8 倍。在自主研究方面,Claude Agent 端到端完成了一项 AI 安全开放研究问题,恢复能力达到人类两组研究者一周工作量的 97%。报告还提出了三种未来情景:趋势停滞、持续自动化且人类仍掌方向、以及完整的递归自我改进,其中作者认为持续自动化情景最可能。这份报告揭示了 AI 自我改进的速度超出预期,对 AI 安全和治理具有重要警示意义。行业递归自我改进ClaudeAnthropicAI 安全AI 研发自动化10 个信源在谈推荐理由:Anthropic 用内部数据证明了 AI 自我改进正在加速,做 AI 研发的团队和关注 AI 安全的人值得细看——Claude 的代码占比和实验效率数据会刷新你对 AI 能力的认知。原文
09:09shao__meng@shao__meng83°Anthropic 内部设计负责人 Meaghan 分享了团队已验证的 Claude Code 工作流,核心是让 AI 成为全流程协作者,而非仅代码工具。她演示了在 Excalidraw 上通过一句话 prompt 加功能,包括多方案生成、AI 自主选方案、自动开 PR 并附录屏。她强调 LLM 目前做不好设计,人必须留在审美与决策环中,同时将自动化扩展到非编码任务,如批量 UI 修复、代码审查和定时巡检。她还提出了三条组织级原则:自动化不限于写代码、人人都能 ship 不等于什么都该 ship、需要可扩展的质量治理。AI产品Claude CodeAI 工作流设计自动化产品开发Anthropic10 个信源在谈推荐理由:Anthropic 内部设计负责人的真实工作流,把 Claude Code 从代码工具升级为全流程协作者,做产品、写代码、推 PR 一条龙。设计师、产品经理、工程师都能直接复制她的 prompt 结构和并行工作流,看完就能用。原文