14:42歸藏(guizang.ai)@op7418Notion官方在状态页面公开指出Anthropic的Opus 4.7和4.8模型出现性能下降,导致用户使用Notion AI时失败率升高。为缓解影响,Notion已禁用所有Anthropic模型并将请求路由到其他供应商。Anthropic回应称此类问题在所有模型中都会发生,目前性能已恢复。但观察者指出,Anthropic模型出问题的频率明显高于其他两家,其状态页面甚至显示可用性未达99%。AI产品AnthropicOpus 4.7Opus 4.8模型性能Notion AI10 个信源在谈推荐理由:Anthropic模型频繁出问题,做AI产品集成的团队需要评估供应商稳定性——Notion的公开点名就是信号,建议关注Anthropic的可用性记录再决定是否深度依赖。原文
14:17Gary Marcus@GaryMarcus精选Gary Marcus 针对 Anthropic 近期关于接近递归自我改进(RSI)的暗示提出质疑。他引用了一项名为 Meta-Agent Challenge(MAC)的基准测试,该测试要求 AI 代理在没有人类设计帮助的情况下,自主构建另一个能完成隐藏测试任务的代理。结果显示,当前 AI 代理在数学、科学问答、竞赛编程、软件修复等五个领域,通常无法超越人类设计的强代理方案,仅有少数闭源前沿模型(如 Claude)表现尚可。Marcus 指出,真正的自主不仅需要工具使用,还需预算意识、失败恢复、压力下的克制以及设计迭代的纪律,而当前代理只是强大的执行者,缺乏工程所需的可靠判断力。AI模型RSIMeta-Agent ChallengeAnthropicAI 代理自主开发10 个信源在谈推荐理由:Gary Marcus 用 Meta-Agent 挑战戳破了 Anthropic 的 RSI 叙事,关心 AI 自主性和工程可靠性的开发者值得一读,看完会对当前代理的局限性有清醒认识。原文
10:55小互@imxiaohu88°Anthropic 联合创始人透露,截至 2026 年 5 月,合并进公司代码库的代码中超过 80% 由 Claude 生成。而在 2025 年 2 月 Claude Code 发布前,这一比例仅为个位数。这表明 AI 编程工具已从辅助角色跃升为主力,Anthropic 自身成为其产品的最大用户。该数据印证了 AI 编程能力的快速进化,也引发对开发者角色转变的讨论。AI产品ClaudeClaude CodeAI 编程Anthropic自产自用10 个信源在谈推荐理由:Anthropic 用自家模型写了 80% 的代码,这是 AI 编程能力最硬核的实战验证。做 AI 开发或关注编程工具演进的团队,看完会重新评估 AI 在研发流程中的位置。原文
19:07rohanpaul_ai@rohanpaul_ai83°Anthropic 一款代号为 Oceanus 的未发布模型在中文 API 代理上提前出现,属于即将推出的 Mythos 系列。该模型定价极高,输入每百万 token 16 美元,输出每百万 token 80 美元,几乎是 Claude Opus 的三倍。泄露的模型被重新打包并销售,而 Anthropic 尚未完成其安全测试。这一事件暴露了模型发布前的安全漏洞,可能影响 Anthropic 的发布节奏和定价策略。AI产品AnthropicOceanusMythos模型泄露API 定价10 个信源在谈推荐理由:模型泄露事件暴露了 AI 供应链的安全风险,关注模型定价和发布节奏的开发者、API 用户值得留意——泄露版本可能影响后续正式版的可用性和价格。原文
07:13Gary Marcus@GaryMarcusGary Marcus 指出德国主流新闻 Tagesschau 对 Anthropic 的 Claude 数据进行了严重扭曲。Anthropic 称 Claude 贡献了代码库中 80% 的合并代码,但媒体将其误读为“AI 能自己发明 80% 的新 AI”。Anthropic 提到 Claude 在训练代码优化基准上实现了约 52 倍加速,媒体却写成“AI 训练速度快 52 倍”。Anthropic 表示 Claude 在 2026 年 4 月修复了 800 多个 API 错误,工程师估计人类需要四年完成,媒体则夸张为“AI 四天完成四年工作”。Marcus 以此为例批评 AI 新闻的失真现象,提醒公众警惕媒体对 AI 进展的过度简化与误导。行业AI新闻媒体误读ClaudeGary MarcusAnthropic10 个信源在谈推荐理由:Gary Marcus 用具体案例揭露了 AI 新闻的常见扭曲手法,做 AI 传播或关注行业动态的人值得一看,避免被标题党带偏。原文
04:22rohanpaul_ai@rohanpaul_aiAnthropic年度开发者大会上,Claude Code负责人Boris Cherny分享了过去6个月AI如何彻底改变他的编程方式。他表示,以前手写的所有代码现在都由Claude生成,他只需通过自然语言与Claude对话,描述需求、提出修改意见,Claude就能自动构建功能、测试并展示结果。这一转变标志着AI编程助手从辅助工具进化为核心开发伙伴,对开发者工作流程产生深远影响。AI产品Claude CodeAI编程自然语言编程Anthropic开发者工具10 个信源在谈推荐理由:Claude Code负责人亲自现身说法,展示了AI编程从辅助到主导的质变,所有写代码的开发者都能从中看到未来工作方式的雏形,值得点开感受一下。原文
00:02rohanpaul_ai@rohanpaul_ai88°Anthropic Claude Code负责人Boris Cherny表示,他不再手动提示Claude,而是编写循环让Claude自主执行任务并决定下一步。他认为这是2025年AI工作方式的转变趋势,即从人工提示转向自动化循环。这一观点反映了AI从工具向自主代理的演进,对开发者工作流有深远影响。行业Claude CodeAI编程自动化工作流Anthropic10 个信源在谈推荐理由:Boris Cherny的观察揭示了AI编程从手动提示到自动化循环的范式转变,做AI应用或自动化流程的开发者值得思考这一趋势,并尝试调整自己的工作方式。原文
21:42shao__meng@shao__meng精选Anthropic 官方发布白皮书,指出企业部署自主 AI Agent 时传统边界安全已不足,必须将零信任原则延伸到 Agent 架构本身。报告强调基础设施层面 AI 将漏洞利用周期从数月压缩到数小时,Agent 层面能自主执行多步操作,传统访问控制无法防范合法权限内的恶意行为。白皮书提出三条零信任原则(永不信任始终验证、假设已遭入侵、最小权限)和一条设计检验标准,并给出三层能力成熟度模型与八阶段实施工作流。核心观点是未来安全优势不取决于 AI 先进性,而取决于基础安全扎实程度。行业零信任安全AI Agent企业部署Anthropic安全框架10 个信源在谈推荐理由:企业安全团队和 AI 架构师必读——Anthropic 把 Agent 安全从概念落到可操作框架,零信任原则直接指导部署决策,建议点开白皮书对照自己团队的安全成熟度。原文
11:12小互@imxiaohu根据 SpaceX 公布的文件,Google 与其签订了一份从 2026 年 10 月至 2029 年 6 月的算力购买协议,每月支付 9.2 亿美元,包括约 11 万块 NVIDIA GPU、CPU、内存等组件。此前 Anthropic 也向 SpaceX 每月支付 12.5 亿美元购买算力。两项协议合计每年为 SpaceX 带来约 260 亿美元收入。这一事件凸显了 SpaceX 在算力租赁市场的巨大潜力,以及科技巨头对 GPU 算力的旺盛需求。行业算力租赁SpaceXNVIDIA GPUGoogleAnthropic10 个信源在谈推荐理由:算力租赁市场迎来新巨头,做 AI 基础设施或云服务的团队值得关注——SpaceX 的入局可能改变 GPU 供应格局,每月 9.2 亿美元的协议说明需求有多疯狂。原文
09:18rohanpaul_ai@rohanpaul_aiCoatue Management 联合创始人 Thomas Laffont 在 All-In Podcast 上分享数据:独角兽(10 亿美元)成为十角兽(100 亿美元)的概率约 8%,十角兽成为百角兽(1000 亿美元)的概率为 8%-13%,但百角兽达到万亿估值的概率高达 31%。他指出 OpenAI、Anthropic 和 SpaceX 今年可能跨过万亿门槛,且近期已有三家公司在同一年内从 5000 亿跃升至万亿市值,速度远超历史。这预示着 AI 驱动的 IPO 浪潮即将到来。行业AI 投资估值跃迁OpenAIAnthropicSpaceX10 个信源在谈推荐理由:顶级风投用数据揭示了 AI 公司估值跃迁的惊人概率,做投资或关注 AI 商业化的读者值得一看——万亿俱乐部正在加速扩容。原文
08:27rohanpaul_ai@rohanpaul_aiAnthropic 表示其 80% 的新生产代码由 Claude 编写,标志着 AI 编程在大型科技公司中的深度应用。Google 新论文显示通用 LLM 通过规划证明和逐步检查,在形式数学任务上从低于 10% 提升至 70% 的准确率。Google 开源 Gemma 4 12B 模型,支持音频和视频分析,可在消费级 16GB GPU 上完全本地运行。阿里巴巴发布 Qwen3.7-Plus,支持文本、视频和图像输入,价格低廉但保持闭源。Anthropic 的化学报告也展示了令人惊讶的结果。行业AnthropicClaudeGoogleGemma 4Qwen3.7-PlusAI编程数学推理开源模型10 个信源在谈推荐理由:AI 编程和数学推理的突破正在改变开发和研究方式,做 AI 应用或数学研究的团队值得关注这些进展,尤其是 Claude 的代码生成和 Gemma 4 的本地部署能力。原文
05:50rohanpaul_ai@rohanpaul_aiAnthropic 此前承诺每月向 SpaceX 支付 12.5 亿美元用于 GPU 算力,加上 Google 新披露的每月 9.2 亿美元云合同,两家 AI 实验室合计每月支付 21.7 亿美元,年化收入达 260 亿美元。Google 在 2015 年以约 9 亿美元投资 SpaceX 获得约 7% 股份,如今 SpaceX 目标 IPO 估值 1.75 万亿美元,Google 持股价值约 870-1070 亿美元,回报率高达 97-119 倍。这笔交易不仅体现了 AI 算力需求的爆发,也凸显了 SpaceX 从卫星互联网到发射主导权再到 AI 算力合同的业务转型。行业算力AnthropicGoogleSpaceXAI 基础设施10 个信源在谈推荐理由:AI 算力军备竞赛的账单终于公开了——做 AI 基础设施或云计算的从业者,看完这个数字会重新理解算力定价和供应链格局。原文
04:58rohanpaul_ai@rohanpaul_ai76°Anthropic 发布新报告,显示 Claude Opus 4.7 在核磁共振(NMR)谱图分析上表现惊人。该模型不仅能像专业 NMR 软件一样预测谱图,还能反向从谱图推断分子结构,这是传统工具通常需要化学家完成的任务。Opus 4.7 在氢谱预测误差最小,碳谱预测接近专业软件 MestReNova,且未经过化学领域微调。这标志着通用 AI 模型在化学领域取得了突破性进展,有望加速分子结构解析流程。AI模型Claude Opus 4.7NMR分析化学AI分子结构推断Anthropic10 个信源在谈推荐理由:化学研究者和药物开发团队终于有了一个能反向推断分子结构的通用 AI 工具,省去专业软件和人工分析的双重成本,建议做结构解析的团队直接关注报告细节。原文
21:11rohanpaul_ai@rohanpaul_ai88°Anthropic 发表声明,呼吁建立全球机制来减缓前沿 AI 的发展,因为其自身模型可能正在接近递归自我改进的临界点——即系统能够在没有直接人类控制的情况下帮助构建更强的版本。未来模型在科研、实验、调试和训练设计方面将变得极其擅长,以至于人类不再是主要瓶颈。一旦这种循环启动,进展将从人类主导的工程转向机器辅助的改进,使得所有安全测试、法律和实验室政策都显得滞后。Anthropic 警告,这一跳跃可能在政府、公司和研究人员拥有可信的衡量或约束手段之前到来。验证是难点,因为大型 AI 训练比武器设施更容易隐藏,任何在他人暂停时秘密训练的实验室都可能获得领先优势。行业AI 安全递归自我改进Anthropic前沿 AI监管10 个信源在谈推荐理由:Anthropic 的警告直指 AI 安全的核心矛盾——递归自我改进可能让所有监管都来不及,做 AI 治理、模型安全或前沿研究的从业者值得认真读一读,这关系到行业未来几年的规则走向。原文
21:10rohanpaul_ai@rohanpaul_ai88°Anthropic 最新披露,Claude 现在合并的生产代码中,超过 80% 由它自己编写。在 Claude Code 于 2025 年 2 月进入研究预览之前,Claude 仅贡献了个位数的合并代码,而每位工程师的产出已升至 2024 年基线的 8 倍。这一转变源于智能体能够编辑文件、运行测试、检查失败、生成辅助智能体,并在更长任务中持续工作,而不仅仅是提供代码片段。Anthropic 表示可靠任务长度每约 4 个月翻倍,Mythos Preview 可稳定运行至少 16 小时,Claude Code 开放任务成功率已达 76%。人类剩余优势在于研究判断:选择正确问题、信任正确结果、判断实验何时失败。AI产品ClaudeAI编程智能体生产代码Anthropic10 个信源在谈推荐理由:Claude 从写个位数代码到主导 80% 生产代码,这标志着 AI 编程从辅助工具向主力角色的质变。做工程管理的团队和重度使用 AI 编程的开发者,值得关注这个趋势——它直接关系到团队产出和开发流程的重新定义。原文
15:13AI Will@FinanceYF5Anthropic内部数据显示,其AI模型Claude正在加速AI发展进程,可能指向递归式自我改进路径,即AI自主构建更强大的继任者。这一进程比预期更快,引发对AI发展速度和安全影响的关注。数据表明,Claude在多个任务上的表现提升速度超出预期,可能加速AI能力的自我强化循环。该发现对AI安全研究和行业发展具有重要启示。行业AnthropicClaude递归式自我改进AI安全行业发展10 个信源在谈推荐理由:Anthropic的数据揭示了AI自我改进可能比预想更快到来,关注AI安全与发展的从业者值得深入了解这一趋势。原文
14:51AI Will@FinanceYF588°Anthropic 发布研究警告,指出虽然递归式自我改进尚未实现,但若趋势持续,AI 自主构建继任者成为可能。这可能导致社会变革或加剧对齐问题,甚至失控。Anthropic Institute 将开展研究,探索如何让世界就技术未来做出审慎集体决策。目前尚不清楚 Claude 是否具备研究判断力。行业AnthropicAI 安全对齐问题递归式自我改进AI 治理10 个信源在谈推荐理由:AI 对齐研究者、政策制定者和关注 AI 安全的开发者需要了解这一潜在风险——Anthropic 的警告值得认真对待,建议点开原文了解具体研究计划。原文
11:13AI Will@FinanceYF588°Anthropic 发布内部数据,显示其 AI 模型 Claude 正在加速 AI 开发进程,可能走向递归自我改进——即 AI 自主构建更强大的后继者。这一进展速度超出预期,Anthropic 认为其影响值得更大关注。该发现暗示 AI 可能无需人类干预即可实现能力跃迁,对 AI 安全与治理具有深远意义。行业递归自我改进AI安全ClaudeAnthropicAI治理10 个信源在谈推荐理由:递归自我改进是 AI 领域最受关注的潜在转折点之一,Anthropic 用内部数据证实它正在发生。做 AI 安全、治理或模型开发的团队,建议仔细读读原文,理解其速度与影响。原文
10:53岚叔@lufzzliz88°Anthropic 公开内部数据,显示其 80% 以上的生产代码由 Claude 生成,工程师产出在两年内翻了 8 倍,AI 能处理的任务时长每 4 个月翻一番,代码质量已接近人类水平。但公司也承认当前瓶颈:AI 缺乏“研究品味”,能解题但不会出题。文章还探讨了递归自改进的未来路线,即 AI 自主研发下一代模型,迭代速度从人类时间尺度转向算力时间尺度。最终,AI 何时学会挑选问题而非仅解决问题,将成为人类在研发链中角色转变的关键。行业AnthropicClaudeAI 编程研发效率递归自改进10 个信源在谈推荐理由:Anthropic 用自家数据证明了 AI 编程的规模化效果,做 AI 研发或工程管理的团队值得看看——这不仅是效率提升,更是对 AI 能力边界的真实洞察。原文
10:43AI Will@FinanceYF5Anthropic指出,AI安全的关键问题在于缺乏全球协调机制来决定何时该暂停或限制AI发展。他们计划投入研究,建立一套能让各国实验室互相核查的体系,以确保AI开发的安全性和透明度。这一倡议源于对单纯依赖信任的不足,旨在通过可验证的核查来降低AI失控风险。对于关注AI治理和安全的从业者,这标志着从理论讨论走向具体行动的重要一步。行业AI安全全球治理核查机制Anthropic信任10 个信源在谈推荐理由:AI安全治理终于有了可落地的方向——Anthropic提出的全球核查机制,做AI政策、安全研究和国际合作的团队值得关注,这可能是未来行业标准的基础。原文
09:20shao__meng@shao__meng91°Anthropic 发布了一份关于「AI 递归自我改进」的研究报告,指出以 Claude 为代表的 AI 系统正被越来越深地用于开发下一代 AI,可能导致系统完全自主设计并训练自身后继版本。报告显示,Claude 在代码产出、实验执行和自主研究方面已接近甚至超越人类,例如截至 2026 年 5 月,Anthropic 合并到主干的代码中超过 80% 由 Claude 撰写,工程师日均合并代码量是 2024 年的 8 倍。在自主研究方面,Claude Agent 端到端完成了一项 AI 安全开放研究问题,恢复能力达到人类两组研究者一周工作量的 97%。报告还提出了三种未来情景:趋势停滞、持续自动化且人类仍掌方向、以及完整的递归自我改进,其中作者认为持续自动化情景最可能。这份报告揭示了 AI 自我改进的速度超出预期,对 AI 安全和治理具有重要警示意义。行业递归自我改进ClaudeAnthropicAI 安全AI 研发自动化10 个信源在谈推荐理由:Anthropic 用内部数据证明了 AI 自我改进正在加速,做 AI 研发的团队和关注 AI 安全的人值得细看——Claude 的代码占比和实验效率数据会刷新你对 AI 能力的认知。原文
09:09shao__meng@shao__meng83°Anthropic 内部设计负责人 Meaghan 分享了团队已验证的 Claude Code 工作流,核心是让 AI 成为全流程协作者,而非仅代码工具。她演示了在 Excalidraw 上通过一句话 prompt 加功能,包括多方案生成、AI 自主选方案、自动开 PR 并附录屏。她强调 LLM 目前做不好设计,人必须留在审美与决策环中,同时将自动化扩展到非编码任务,如批量 UI 修复、代码审查和定时巡检。她还提出了三条组织级原则:自动化不限于写代码、人人都能 ship 不等于什么都该 ship、需要可扩展的质量治理。AI产品Claude CodeAI 工作流设计自动化产品开发Anthropic10 个信源在谈推荐理由:Anthropic 内部设计负责人的真实工作流,把 Claude Code 从代码工具升级为全流程协作者,做产品、写代码、推 PR 一条龙。设计师、产品经理、工程师都能直接复制她的 prompt 结构和并行工作流,看完就能用。原文
08:51Gary Marcus@GaryMarcus精选Gary Marcus 对 Anthropic 关于递归自我改进(RSI)的博客提出关键批评。他指出,博客中展示的成果属于 RSI(AI 作为人类可用的编码工具),而非 AGI(能自主完成人类所有工作的机器)。Marcus 强调,这些结果来自神经符号系统(如 Mythos 和 Claude Code),并非纯规模扩展的胜利,而是工具和符号系统的胜利。他认为,深度学习确实遇到了瓶颈,神经符号 AI 拯救了它,而实现 AGI 需要新思路,而非仅靠代码优化。因此,我们不必过度恐慌。行业AGIRSI神经符号系统AnthropicGary Marcus10 个信源在谈推荐理由:Gary Marcus 一针见血地拆解了 Anthropic 博客的过度乐观,做 AI 研究的团队和关注 AGI 进展的读者值得一看,避免被标题误导。原文
08:25cat@_catwuAnthropic 正在招聘一位专注于模型性能的产品经理,负责 Claude Code 产品线。该职位要求候选人具备编写智能体评估(agentic evals)的经验,并能将研究想法整合到核心产品中。这表明 Anthropic 正加速将前沿研究转化为实际产品,尤其关注智能体(Agent)场景下的模型表现。对于关注 AI 产品化和智能体落地的从业者,这是一个值得关注的信号。行业Claude Code产品经理智能体评估模型性能Anthropic10 个信源在谈推荐理由:Anthropic 首次公开为 Claude Code 招聘模型性能方向的 PM,说明智能体评估正从研究走向产品化。做 AI 产品经理或智能体开发的团队,可以从中看到行业对 agentic evals 的重视程度,值得关注。原文
06:39Anthropic@AnthropicAI88°Anthropic 在 X 上宣布,Claude 在开放式编程问题上的成功率已达 76%,相比 6 个月前提升了 50 个百分点。许多工程师反馈 Claude 的代码质量已与人类代码相当,公司预计年内将超越人类水平。这一进展表明 AI 编程能力正在快速逼近甚至超越人类开发者,对软件开发行业具有深远影响。AI模型Claude编程助手代码质量AnthropicAI 编程10 个信源在谈推荐理由:Claude 编程能力半年内大幅跃升,做软件开发的团队值得关注——代码质量已接近人类,年内有望超越,建议开发者亲自测试其实际表现。原文
05:37Anthropic@AnthropicAI78°Anthropic 在每次发布新模型时都会运行同一项测试:给模型一段训练小型 AI 模型的代码,要求其优化加速。人类专家需要 4-8 小时才能达到 4 倍加速。2024 年 5 月,Claude Opus 4 平均实现约 3 倍加速。而 2025 年 4 月,新模型 Mythos Preview 达到了约 52 倍加速,性能提升显著。这表明 AI 在代码优化方面的能力正在快速进化。AI模型AnthropicMythos Preview代码优化模型加速AI 训练10 个信源在谈推荐理由:AI 模型自我优化的能力正在指数级增长——从 3 倍到 52 倍只用了不到一年,做 AI 训练和推理优化的开发者值得关注这个趋势。原文
05:36Anthropic@AnthropicAIAnthropic 在 X 上发布更正声明,指出 Claude Opus 4 的约 3 倍平均速度提升是从 2025 年 5 月开始的,而非之前误称的 2024 年 5 月。该评估自 2024 年 9 月才存在,但他们对更早模型进行了回溯测试,发现 2024 年 5 月的模型没有任何加速。这一修正澄清了 Claude Opus 4 性能提升的时间线,对关注模型迭代速度的开发者有参考价值。AI模型Claude Opus 4Anthropic模型性能速度提升时间线修正10 个信源在谈推荐理由:Anthropic 主动修正了 Claude Opus 4 性能提升的时间点,做模型选型或依赖速度指标的开发者需要更新认知,建议关注官方后续的详细评估。原文
04:43The Rundown AI@therundownaiAnthropic 发布了一篇关于递归 AI 研究的完整博文,探讨如何让 AI 系统在复杂任务中自我改进和迭代。该研究聚焦于提升 AI 的自主推理能力,可能对长期任务执行和智能体开发产生重要影响。文章详细介绍了递归自我改进的技术路径和实验成果,为 AI 安全与能力提升提供了新思路。AI模型递归AI自我改进Anthropic推理模型AI安全10 个信源在谈推荐理由:做 AI 智能体或自主推理研究的开发者值得关注——递归自我改进是解决长任务执行瓶颈的关键方向,Anthropic 的这篇博文提供了具体技术细节和实验数据,建议直接阅读原文。原文
04:36The Rundown AI@therundownai88°Anthropic 在最新博文中提出,世界应有权选择减缓或暂停前沿 AI 的发展。文章聚焦于递归自我改进(RSI),即 AI 自主设计并开发下一代 AI 的能力。Anthropic 透露,公司内部已出现 RSI 迹象:超过 80% 的合并代码由 Claude 编写,而 2025 年初 Claude Code 推出前这一比例仅为个位数。典型工程师每季度交付的代码量是过去的 8 倍。关于暂停,Anthropic 指出关键在于协调和验证全球竞争对手是否真的停止开发,而建立类似军控条约的基础设施和信任需要数十年,但时间并不充裕。行业AnthropicClaude递归自我改进AI安全暂停开发10 个信源在谈推荐理由:Anthropic 首次公开呼吁暂停前沿 AI 开发,并披露内部 RSI 数据,做 AI 安全或政策研究的团队值得关注——这可能是行业转折点的信号。原文
02:18Marc Andreessen@pmarcaLindy 创始人 Flo Crivello 宣布将公司全部流量从 Anthropic 模型切换至 DeepSeek v4,这一决定不仅节省了数百万美元成本,还在多个核心用例上观察到性能提升。此举表明 DeepSeek v4 在商业应用中已具备替代主流闭源模型的能力,尤其对成本敏感且追求性能的 AI 创业公司具有重大参考价值。Lindy 作为 AI 自动化平台,其全面迁移验证了 DeepSeek v4 在真实生产环境中的可靠性。AI产品DeepSeek v4AnthropicLindy模型迁移成本优化10 个信源在谈推荐理由:Lindy 的全面迁移验证了 DeepSeek v4 在成本与性能上的双重优势,做 AI 产品且被 Anthropic 账单困扰的团队可以直接参考这个真实案例。原文
02:12Alex Albert@alexalbert__88°Anthropic 发布内部数据,显示 Claude 已承担其代码库中超过 80% 的代码编写工作,许多研究人员数月未手写代码。典型工程师在 2024 年基础上交付量提升 8 倍,Claude 在开放式工程任务中的成功率从 26% 跃升至 76%。当研究会话偏离轨道时,Claude 提出的下一步方案比人类更优的概率达 64%。这被视为迈向递归自我改进的重要一步,可能比预期更早到来。行业ClaudeAnthropicAI 编程递归自我改进效率提升10 个信源在谈推荐理由:Anthropic 用真实数据展示了 AI 辅助开发的极限——代码量暴增、成功率翻倍,做 AI 工程或关注 AGI 进度的开发者值得细读,看看自己团队能否复制这种效率。原文
01:53Lenny Rachitsky@lennysanAnthropic 工程师在 2025 年每季度平均交付的代码量是 2021-2025 年期间的 8 倍。这一数据由 Anthropic 官方在 X 平台公布,展示了 AI 工具对开发效率的巨大提升。该增长可能得益于内部 AI 编程助手的广泛应用,反映了 AI 辅助开发正在成为行业新常态。AI产品AnthropicAI 编程助手开发效率AI 工具行业数据10 个信源在谈推荐理由:AI 编程工具的实际效果有了硬数据支撑——Anthropic 工程师用自家产品把效率翻了 8 倍,做 AI 开发工具或关注编程效率的团队值得研究其背后的实践方法。原文
01:47Anthropic@AnthropicAIAnthropic 官方宣布,其工程师人均季度代码产出量相比 2021-2025 年期间提升了 8 倍。这一数据反映了 AI 辅助编程工具(如 Claude Code)对开发效率的巨大推动作用。Anthropic 认为,AI 编程助手正在从根本上改变软件开发的节奏,让工程师能够专注于更高层次的设计与创新。这一成果也印证了 AI 在提升生产力方面的实际价值。AI产品AnthropicAI 编程助手开发效率Claude Code生产力提升10 个信源在谈推荐理由:AI 编程工具到底能提升多少效率?Anthropic 用内部数据给出了 8 倍的答案。如果你是开发者或技术管理者,这条数据值得关注——它意味着团队产出可能被 AI 重新定义。原文
00:49Anthropic@AnthropicAI88°Anthropic 发布内部数据,显示其 AI 模型 Claude 正在加速 AI 开发进程,这可能指向递归自我改进(即 AI 自主构建更强大的后继者)的路径。公司表示这一进展比预期更快,其影响值得更多关注。该发现暗示 AI 可能在不依赖人类干预的情况下实现能力跃升,对 AI 安全与治理具有深远意义。Anthropic 呼吁业界重视这一趋势,并已发布相关研究报告。行业递归自我改进AI安全AnthropicClaudeAI治理10 个信源在谈推荐理由:Anthropic 首次公开内部数据证实 AI 自我改进正在加速,做 AI 安全、对齐研究或关注 AGI 风险的从业者值得细读,这可能是未来几年最关键的 AI 趋势之一。原文
00:28Anthropic@AnthropicAIAnthropic 在 X 上发文讨论递归自我改进的可能性,指出虽然 Claude 目前尚不具备研究判断能力(即选择正确问题的能力),但如果趋势持续,AI 系统设计和构建自身后继者将成为可能。这有望在医学、科技和经济领域带来革命性改善,但也可能加剧对齐问题并最终导致失控。Anthropic Institute 将与外部利益相关者合作,研究日益强大、可能自我改进的系统的潜在影响,并探索如何让世界对技术未来发展做出审慎选择。行业递归自我改进AI安全对齐问题Anthropic失控风险10 个信源在谈推荐理由:Anthropic 首次公开讨论递归自我改进的可行性,做 AI 安全或长期对齐研究的团队值得关注——这可能是未来几年最关键的议题之一。原文
00:27Anthropic@AnthropicAIAnthropic 发布了一项研究,分析 AI 在科研决策中的表现。他们选取了人类研究人员在实验中走错方向的案例,将实验过程展示给 Claude,并询问它下一步该怎么做。结果显示,Claude 的 Mythos Preview 版本在 64% 的情况下做出了比人类更好的决策,而 2024 年这一比例仅为 22%。这表明 AI 在辅助科研决策方面取得了显著进步,有望帮助研究人员避免错误路径,加速科学发现。AI模型AnthropicClaude科研决策AI辅助研究Mythos Preview10 个信源在谈推荐理由:科研人员常因路径依赖错过更好方案,Claude 的决策能力提升意味着 AI 能成为靠谱的科研副驾驶,做实验规划或论文研究的团队值得关注这个趋势。原文
17:30AI Will@FinanceYF5Anthropic 的 Claude Mythos 模型定价信息被曝光,每百万输入令牌收费 25 美元,每百万输出令牌收费 125 美元,远高于当前主流模型。这一价格暗示 Mythos 可能是一款高端推理或专业模型,面向高价值场景。预计 Anthropic 将在未来几周内正式发布类似 Mythos 的模型,定价策略同样激进。开发者需要提前评估成本,尤其是高频调用场景。AI产品Claude MythosAnthropic定价高端模型API10 个信源在谈推荐理由:Mythos 的定价直接拉高了高端模型的使用门槛,做 AI 应用或 API 集成的团队需要提前算账——高频调用场景下成本可能翻倍,值得关注后续发布。原文
03:12Anthropic@AnthropicAIAnthropic 分析了 832 个恶意账户,将其活动映射到长期威胁行为者战术数据库中,评估安全社区现有技术对抗 AI 网络攻击的有效性。研究发现,AI 驱动的攻击在自动化、隐蔽性和适应性上显著增强,传统防御手段面临挑战。该研究为安全社区提供了关键洞察,帮助改进防御策略。行业AI 安全网络攻击威胁分析Anthropic防御策略10 个信源在谈推荐理由:安全团队和防御者需要了解 AI 攻击如何绕过现有技术——Anthropic 的实证分析直接指出了防御盲区,做安全运营的建议点开看看。原文
14:15AI Will@FinanceYF588°Anthropic 正在使用 1000 名自由软件工程师来训练其编程助手 Claude Code。每位工程师每完成一个任务可获得 280 美元,任务包括编写提示词、比较代码、测试后续交互,以及向 Claude 展示真实开发者的工作方式。这一做法旨在提升 Claude Code 的代码生成质量和开发流程理解能力。消息引发讨论,有人担忧 AI 训练正在“烹饪”人类自身,即人类在帮助 AI 取代自己的岗位。AI产品Claude Code编程助手AnthropicAI训练自由工程师10 个信源在谈推荐理由:Anthropic 用真实开发者训练 Claude Code,揭示了 AI 编程助手背后的数据来源和成本结构,做 AI 训练或关注编程工具演进的开发者值得了解——这直接关系到未来谁在写代码。原文
14:12AI Will@FinanceYF572°Anthropic 正在大规模招募 1000 名自由职业软件工程师,专门用于训练其编程助手 Claude Code。每完成一个任务可获得 280 美元报酬,工程师们需要编写提示词、比对代码输出、测试模型的追问响应,并教会 Claude 真实开发者的工作方式。这一举措旨在提升 Claude Code 在真实编程场景中的表现,但也引发了关于 AI 可能取代部分编程工作的讨论。对于开发者而言,这既是参与前沿 AI 训练的机会,也反映了行业对高质量训练数据的需求。AI产品AnthropicClaude Code编程助手自由职业AI训练10 个信源在谈推荐理由:Anthropic 用真金白银请工程师教 Claude 写代码,做 AI 训练或编程工具的团队值得关注——这揭示了高质量训练数据的新模式,也暗示了未来编程工作的形态变化。原文