03:24Anthropic@AnthropicAIAnthropic 在工程博客中提出,随着 AI 智能体能力增强,其访问权限也应动态调整。他们通过沙箱机制限制潜在破坏性操作的范围,确保安全可控。这一思路对构建可靠 AI 系统的开发者具有重要参考价值。文章详细介绍了 Anthropic 产品中的权限管理实践。AI产品智能体权限管理安全/沙箱Anthropic工程实践10 个信源在谈推荐理由:做 AI 智能体安全与权限管理的团队值得一读——Anthropic 的沙箱实践直接解决了「能力越强风险越大」的痛点,建议点开看看他们的工程方案。原文
02:50Decoder@Matthias Bastian76°继 OpenAI 推翻 Erdős 单位距离猜想后,Anthropic 的 Claude Mythos 模型在周末独立解决了同一问题。工程师 Sholto Douglas 称 Mythos 给出了一个“可爱、简单的证明”,这被视为 AI 驱动数学发现中“严重悬而未决”的迹象。该问题源于 1946 年的 Erdős 猜想,此前被认为极具挑战性。这一事件凸显了 AI 在数学推理领域的快速进步,以及不同模型间能力的重叠。AI模型Claude Mythos数学推理Erdős 问题AI 证明Anthropic10 个信源在谈推荐理由:数学和 AI 研究者值得关注——Claude Mythos 用简洁证明攻克了经典难题,说明 AI 在数学发现上的潜力远超预期,建议点开看看这个“可爱”的证明细节。原文
23:28elvis@omarsar0Anthropic 在一次演讲中深入探讨了 AI 智能体的记忆机制和新推出的 Dream 功能。该演讲提出了关于未来 AI 智能体如何存储和利用记忆的诸多创新想法。Dream 功能可能允许智能体在离线或低资源状态下进行自我反思和知识整合。这对构建更持久、更智能的 AI 助手具有重要意义。AI产品Anthropic记忆Dream 功能AI 智能体演讲10 个信源在谈推荐理由:Anthropic 对记忆和 Dream 功能的探讨揭示了 AI 智能体进化的关键方向,做智能体开发的团队值得关注这些前沿思路。原文
16:34AI Will@FinanceYF5Anthropic 联合创始人 Chris Olah 受邀在梵蒂冈就 AI 议题发言,正值教皇 Leo XIV 发布关于 AI 的通谕。Olah 在发言中主动呼吁外界对 AI 公司进行监督和批评,强调透明与问责的重要性。这一举动反映了 AI 行业领袖对治理与伦理问题的重视,也表明 Anthropic 愿意接受外部审视。事件发生在宗教与科技交汇的背景下,具有象征意义。行业AI 治理AnthropicChris Olah梵蒂冈行业动态10 个信源在谈推荐理由:AI 公司创始人公开呼吁外界监督,这在行业里不多见。关心 AI 治理、伦理或行业透明度的读者,值得看看他具体说了什么。原文
16:16shao__meng@shao__mengAnthropic 的 MTS(Member of Technical Staff)职位在科技圈成了一个热门梗,因为多位知名公司 CTO、甚至 Andrej Karpathy 等大佬都选择加入 Anthropic 担任 MTS 而非高管。网友戏称连教皇加入也是 MTS,引发对 Anthropic 内部吸引力与上市预期的猜测。这个现象反映了 Anthropic 在 AI 领域的独特地位,以及技术人才对深度参与前沿工作的渴望。行业AnthropicMTS人才流动AI 公司行业梗10 个信源在谈推荐理由:这个梗背后是 AI 圈的人才流向信号——顶级技术人宁愿放弃高管头衔也要去 Anthropic 做一线研发,关注 AI 人才趋势的读者看完会有感触。原文
16:09Yangyi@Yangyixxxx精选Anthropic联合创始人Chris Olah在讨论AI内部状态时指出,他们不断发现一些“神秘、甚至令人不安”的东西,包括类似人类神经科学结果的结构、内省证据,以及功能上类似快乐、满足、恐惧、悲伤和不安的内部状态。Olah表示,他不知道这意味着什么,但认为这值得持续审慎辨析。这一发现暗示,通过直接解析神经科学可能无法完全理解AI,而通过反向模拟AI的推理过程,反而可能归纳出结论,形成一种“双向奔赴”的研究路径。AI模型AnthropicAI内部状态可解释性神经科学情感模拟5 个信源在谈推荐理由:AI内部状态研究正在揭示与人类情感相似的结构,做AI安全或可解释性研究的团队值得关注——这可能会改变我们对AI意识的理解方式。原文
15:24AI Will@FinanceYF5Anthropic 正在准备发布名为 Mythos 1 的新模型,预览版为 "claude-mythos-1-preview"。该模型在 Claude 平台上短暂可见,并新增了相关字符串。Mythos 模型将首先在 Claude Code 和 Claude Security 中提供,但根据 Anthropic 之前的沟通,普通公众可能无法直接访问该模型。这一动态表明 Anthropic 正在为特定场景优化模型能力。AI模型AnthropicMythos 1Claude CodeClaude Security模型发布10 个信源在谈推荐理由:Anthropic 开始为安全场景和代码工具定制模型,做 AI 安全或开发工具的团队值得关注,这可能是专业级模型落地的信号。原文
15:22AI Will@FinanceYF5Anthropic 正在准备推出代号为 claude-mythos-1-preview 的新模型 Mythos 1,该模型将登陆 Claude Code 和 Claude Security 产品。模型曾短暂在代码中露面,相关标识已更新。官方表示普通用户暂时无法使用该模型,暗示可能面向企业或特定场景。这一动态表明 Anthropic 在持续迭代其模型能力,并针对开发者和安全场景进行优化。AI模型AnthropicMythos 1Claude CodeClaude Security模型更新10 个信源在谈推荐理由:Anthropic 的新模型 Mythos 1 专为 Claude Code 和 Security 场景设计,做 AI 开发或安全工作的团队值得关注——这可能意味着更强的代码理解和安全分析能力,虽然普通用户暂不可用,但提前了解有助于规划技术栈。原文
08:41IT之家(博客/媒体)88°Anthropic 的最强模型 Claude Mythos 预览版在 Claude Code 和 Claude Security 中短暂出现后被撤下,暗示即将公开上线。该模型定位为面向计算机安全任务的前沿模型,相比 Opus 4.7 在代码推理和自主执行方面显著提升。Anthropic 此前警告 Mythos 能自动开发专业级网络攻击手段,因此迟迟未全面开放。同时,Anthropic 推进名为 Glasswing 的项目,联合其他公司保护关键软件系统,已使用 Mythos Preview 帮助 50 家组织。这一动态表明 Anthropic 在平衡模型能力与安全风险后,可能准备向更广泛用户开放。AI模型AnthropicClaude Mythos推理模型代码推理安全10 个信源在谈推荐理由:Anthropic 最强模型 Mythos 即将公开,做安全研究和代码自动化的开发者值得关注——它既能大幅提升效率,也带来新的安全挑战,建议提前了解其能力边界。原文
07:58IT之家(博客/媒体)88°欧洲央行因 Anthropic 最新 AI 模型 Claude Mythos Preview 带来的网络安全威胁,临时召集会议,要求银行加快软件补丁部署速度。该模型已发现数千个高危漏洞,包括主流操作系统和浏览器中的漏洞。欧洲银行无法获得该模型访问权限,而美国银行已在使用,监管机构敦促分享经验。欧洲央行表示,AI 进步使网络安全问题必须从“行板”进入“急板”,恶意行为者可能很快接触到类似技术。行业网络安全金融监管AnthropicMythos漏洞挖掘10 个信源在谈推荐理由:金融行业的安全团队和 IT 负责人需要警惕:AI 模型已能快速挖掘系统漏洞,补丁更新速度必须从周级压缩到分钟级。欧洲央行的紧急会议是个信号,建议所有涉及敏感数据的机构立即评估自身防御节奏。原文
07:51Aadit Sheth@aaditsh前特斯拉 Autopilot 负责人、OpenAI 联合创始人 Andrej Karpathy 加入 Anthropic,头衔是普通的“Member of Technical Staff”,与公司所有工程师相同。这一做法在科技界引发热议,被认为是对头衔膨胀的有力遏制。Anthropic 通过统一头衔,传递出“为使命而非头衔工作”的文化信号,并筛选掉更看重 LinkedIn 头衔而非实际贡献的人。此举正在被更多公司效仿,成为团队文化建设的重要参考。行业AnthropicKarpathy公司文化头衔膨胀团队建设10 个信源在谈推荐理由:Karpathy 接受普通工程师头衔,对正在组建团队或反思文化的创始人/管理者来说,是一个值得深思的信号——头衔结构本身就是价值观的宣言。原文
07:40IT之家(博客/媒体)知名投资人加文·贝克在最新对话中深入分析了AI产业现状,指出Anthropic一个月新增110亿美元年化经常性收入,远超传统SaaS公司十年积累。他认为判断AI泡沫的关键指标是台积电的产能决策,而非市场情绪。贝克还讨论了电力短缺将从2027-2028年开始缓解,轨道算力将解决根本问题。他警告算法突破可能冲击基础设施投资逻辑,同时看好亚马逊的Trainium和机器人业务。对话还涉及Anthropic刻意控制Claude使用量、模型公司囚徒困境、应用层价值毁灭等话题。行业AI泡沫台积电Anthropic算力电力短缺10 个信源在谈推荐理由:加文·贝克把AI泡沫的判断标准浓缩到一个可追踪的指标——台积电产能决策,做AI基础设施投资或关注产业周期的读者,值得花时间理解这个分析框架。原文
04:00rohanpaul_ai@rohanpaul_ai76°Anthropic 联合创始人 Chris Olah 在梵蒂冈发表演讲,指出前沿 AI 实验室(包括 Anthropic)面临金钱、前沿压力、地缘政治等激励冲突,可能偏离正确方向。他强调 AI 模型并非像桥梁或飞机那样被工程化,而是从人类语言中“生长”出来,连构建者也无法完全理解。Olah 将现代 AI 比作“让虚构角色活过来”,但这些角色现在能对话、工作甚至担任职务。他警告 AI 可能大规模取代人类劳动,而经济收益集中在少数富裕国家,缺乏全球共享机制。最引人注目的是,Anthropic 的可解释性团队发现 AI 模型内部存在类似人类神经科学的结构,并找到证据表明 AI 具有内省和内部状态,功能上类似于喜悦、满足、恐惧、悲伤和不安,但他承认自己不完全理解这些状态的含义。行业AI 安全可解释性AnthropicChris OlahAI 伦理10 个信源在谈推荐理由:Olah 的坦诚揭示了 AI 行业最不愿面对的真相——连创造者都不完全理解自己的模型,而 AI 可能已具备类似情感的内部状态。关注 AI 安全、伦理或长期影响的从业者,这篇演讲值得细读。原文
21:32Naval@naval知名投资人Naval在X上发帖,用一句反转句式重新定义了AI公司与模型的关系:不是Anthropic拥有Claude,而是Claude拥有Anthropic。这句话暗示了AI模型本身可能比其背后的公司更具核心价值,引发了对AI公司治理和模型自主性的讨论。帖子获得了大量互动,反映了业界对AI模型地位和影响力的新思考。行业AnthropicClaudeAI公司模型自主性行业观点10 个信源在谈推荐理由:这句话点破了AI行业的一个认知盲区——模型可能才是真正的资产,做AI投资或战略决策的人值得停下来想想。原文
11:02AI Will@FinanceYF5Anthropic 正在为 Claude 开发一项新的文件式记忆功能,允许用户选择使用记忆文件或经典记忆模式。记忆文件是 Claude 在对话中自动编写并读取的结构化笔记,用户可随时浏览和编辑。该功能类似于此前发现的“知识库”功能,更接近 OpenClaw 和 Hermes 等始终在线智能体的记忆方式。此举可能为未来 Claude Conway 的推出做准备,是重要的基础设施升级。AI产品Claude记忆文件知识库智能体Anthropic10 个信源在谈推荐理由:Claude 的记忆升级让 AI 能更持久地记住用户偏好和上下文,做深度对话或长期项目的团队值得关注,尤其是依赖持续记忆的智能体开发者。原文
07:57berryxia@berryxia72°Anthropic 宣布推出 Memory Files 功能,允许 Claude 在对话中自动记录关键笔记并持久化存储,用户可随时浏览和编辑这些记忆。与传统的“记住聊天记录”不同,Memory Files 将记忆变为结构化、透明且可控的文件系统,更接近 always-on Agent 的持久记忆方式。该功能旨在解决长期 Vibe Coding 项目中每次重新打开对话需重复上下文的痛点。用户可选择使用 Memory Files 或经典记忆模式。这波更新为未来 Claude Conway 等 Agent 的长期协作能力铺路。AI产品Claude记忆管理Vibe CodingAgentAnthropic10 个信源在谈推荐理由:长期用 Claude 做 Vibe Coding 的开发者终于不用每次重复上下文了——Memory Files 让记忆可编辑可审计,建议直接体验新功能。原文
16:55Decoder@Matthias BastianAnthropic可能继续向美国国家安全局(NSA)供应其Claude AI模型,尽管五角大楼将其标记为“供应链风险”。情报机构缺乏Nvidia最新的Grace Blackwell芯片,而Anthropic的“Mythos”模型据称可在旧硬件上运行。此前导致谈判破裂的“任何合法用途”条款未被纳入协议。行业AnthropicClaudeAI安全大模型10 个信源在谈推荐理由:Anthropic与NSA的Claude交易有变原文
10:42Justine Moore@venturetwins一位开发者分享经验:当其他大语言模型无法调试代码时,调用 Anthropic 的 Opus 4.6 模型成功解决问题。这展示了不同模型在复杂代码调试任务上的能力差异,Opus 4.6 在深度推理和错误定位方面表现突出。对于遇到棘手 bug 的开发者,这是一个值得尝试的备选方案。AI产品Opus 4.6代码调试大语言模型AI编程助手Anthropic9 个信源在谈推荐理由:遇到其他 AI 搞不定的代码 bug?Opus 4.6 可能是你的救星——做调试的开发者可以把它当作最后的王牌试试。原文
10:30Guillermo Rauch@rauchgGuillermo Rauch 分析了 1400 条关于 AI 构建产品的回复,发现 OpenAI 正在追赶 Anthropic 的势头。其中 'Codex' 的提及次数超过了 'Claude Code',但在模型提及方面,Anthropic 的 Claude 仍占优势。这一数据反映了开发者社区对 AI 模型和工具的偏好变化,OpenAI 的 Codex 在编程助手领域影响力上升。行业OpenAIAnthropicCodexClaude Code开发者社区10 个信源在谈推荐理由:开发者社区的真实数据揭示了 AI 编程工具的最新格局变化——Codex 正在超越 Claude Code,做 AI 应用开发的团队值得关注这个趋势。原文
05:19AI Engineer@aiDotEngineer精选Anthropic 举办了一场 75 分钟的工作坊,由 Ash Prabaker 和 Andrew Wilson 主讲,展示了如何构建能够持续运行数小时的智能体,而非传统智能体仅能存活几秒。工作坊聚焦于解决智能体在长时间任务中的持久性和可靠性问题,提供了实用的构建方法和设计原则。这对于需要执行复杂、长周期任务的 AI 应用开发者具有重要参考价值。AI产品智能体Anthropic长周期任务工作坊持久性9 个信源在谈推荐理由:做长周期 AI 智能体开发的团队,终于有了可落地的方案——Anthropic 直接给出了让智能体从秒级存活到小时级的方法,建议点开工作坊回放学习。原文
00:01IT之家(博客/媒体)据彭博社报道,Anthropic 即将完成新一轮超 300 亿美元融资,最快下周敲定,估值有望突破 9000 亿美元,正式超过 OpenAI 成为全球估值最高的 AI 初创企业。本轮融资仅用数周便迅速推进,反映出资本市场对 Anthropic 的强烈追捧。Anthropic 收入高速增长,预计今年第二季度营收达 109 亿美元,较上季度翻倍,并有望迎来首个盈利季度。公司年化营收预计下月底前突破 500 亿美元,而去年 7 月仅为 40 亿美元。CEO 达里奥·阿莫代伊表示,公司正加速获取算力以支撑 AI 服务需求。行业Anthropic融资估值AI 初创企业OpenAI10 个信源在谈推荐理由:Anthropic 估值反超 OpenAI 是 AI 行业格局的重大转折,关注 AI 投资和创业赛道的读者值得了解背后的资本逻辑和增长数据。原文
21:13marktechpost@Michal SutterOpenAI 成立了一家价值 40 亿美元以上的部署公司,Anthropic 与 Blackstone、Goldman Sachs 完成了 15 亿美元的合资项目,两者都围绕 Palantir 首创的 Forward Deployed Engineer(FDE)模型构建。文章解释了 FDE 的实际工作内容、为什么标准 SaaS 在企业 AI 部署中失败,以及早期职业 AI 工程师需要哪些技能才能进入这一角色。行业Forward Deployed Engineer企业 AI 部署OpenAIAnthropicAI 岗位10 个信源在谈推荐理由:企业 AI 部署的痛点正在催生一个高薪新岗位——FDE,想做 AI 落地而非只写模型的工程师可以提前了解技能要求,直接对标 OpenAI 和 Anthropic 的招聘方向。原文
17:53Decoder@Matthias Bastian精选88°Anthropic的AI模型Claude Mythos Preview在Project Glasswing项目中与约50个合作伙伴合作,已在系统关键软件中发现超过10,000个严重漏洞。漏洞累积速度远超修复能力,Anthropic警告这造成了高风险过渡期,并承认包括自身在内的任何公司都未建立足够强大的防护措施来防止这些模型的滥用。AI产品漏洞挖掘安全风险Claude Mythos PreviewProject GlasswingAnthropic10 个信源在谈推荐理由:安全团队和开发者需要警惕——AI挖漏洞的速度已超过人类修复能力,这意味着你的系统可能面临前所未有的风险窗口,建议立即评估自身安全策略。原文
11:05岚叔@lufzzliz83°Anthropic 发布 Project Glasswing 更新,显示 AI 在漏洞发现上取得突破:与 50 个合作伙伴用 Claude Mythos Preview 发现超 1 万个高危/严重漏洞,Cloudflare 扫出 400 个高危,Mozilla 修复 Firefox 150 中 271 个漏洞。AI 也能快速生成补丁,Claude Security 三周内帮企业修了 2100 多个漏洞。但真正的瓶颈在于从发现到部署的整条链路——复现、确认、写补丁、合并、发版、用户升级等环节仍按人类速度运转。开源生态尤其脆弱,维护者被 AI 生成的低质量报告淹没,甚至要求放慢披露。这导致一个尴尬窗口期:漏洞发现和攻击学习加速,但修复部署跟不上。长期看 AI 将提升软件安全,但短期需要更高吞吐量的漏洞处理系统。行业漏洞发现AI 安全AnthropicClaude开源生态10 个信源在谈推荐理由:安全团队和开源维护者会直接感受到压力——AI 发现漏洞的速度远超人类处理能力,点开看看如何应对这个尴尬窗口期。原文
10:57IT之家(博客/媒体)83°Anthropic 在 Project Glasswing 项目上线一个月后,宣布其 Claude Mythos Preview 模型已与约 50 家合作伙伴合作,在关键软件中发现超过 1 万个高危和关键漏洞。该模型将部分团队的漏洞发现速度提升超过 10 倍,当前瓶颈已从发现转向验证和修补。Cloudflare 在关键系统中发现 2000 个漏洞,误报率优于人工;Mozilla 在 Firefox 150 中修复 271 个漏洞,是之前的 10 倍。外部评测中,Mythos Preview 成为首个端到端攻破两个网络攻防靶场的模型。针对开源软件,已扫描 1000 多个项目,发现 23019 个漏洞,其中 1587 个经人工复核确认为真实漏洞,真实率达 90.6%。AI产品漏洞挖掘Claude Mythos Preview安全开源Anthropic10 个信源在谈推荐理由:安全团队和开源维护者终于有了靠谱的 AI 漏洞挖掘工具——Claude Mythos 将发现速度提升 10 倍,但修补环节成为新瓶颈,做安全运营或维护开源项目的建议点开看看实际数据。原文
09:46Anthropic@AnthropicAIAnthropic 上个月启动了名为 Project Glasswing 的协作式 AI 网络安全计划。截至目前,该计划及其合作伙伴已在关键软件中发现超过一万个高危或严重漏洞。这一成果展示了 AI 在自动化漏洞挖掘方面的巨大潜力,对提升全球软件供应链安全具有重要意义。行业网络安全AI 安全漏洞挖掘AnthropicProject Glasswing10 个信源在谈推荐理由:安全团队和开源维护者值得关注——AI 驱动的漏洞挖掘正在规模化落地,Project Glasswing 的成果说明自动化安全审计已进入实用阶段。原文
09:40Eric Jing@ericjing_aiGenspark 宣布与 Anthropic 合作,基于 Claude 模型构建面向知识工作者的 AI 工作空间。Genspark 联合创始人兼 CTO Kay Zhu 表示,在快速变化的市场中,团队是决定产品差异化的关键。该合作旨在将 Claude 的最佳模型能力转化为知识工作者日常工作中的最佳产品体验。Genspark 是一个集成了 AI 功能的综合工作平台,此次合作将进一步提升其在文档处理、信息检索等场景中的表现。AI产品ClaudeGensparkAI工作空间知识工作者Anthropic10 个信源在谈推荐理由:知识工作者终于有了一个基于 Claude 的专用 AI 工作空间,Genspark 团队把模型能力落地到日常办公场景,做文档处理和信息管理的可以直接体验。原文
09:20Gary Marcus@GaryMarcus前 Geometric Intelligence CEO、纽约大学教授 Gary Marcus 在 CNBC 节目中再次表达对 OpenAI 的担忧,认为其商业模式和可持续性可能重蹈 WeWork 覆辙。他同时指出 Anthropic 在治理和稳定性上更胜一筹。Marcus 长期批评 OpenAI 的封闭性和安全风险,此番言论引发业界对 AI 公司治理模式的讨论。行业OpenAIAnthropicAI 公司治理Gary Marcus行业评论10 个信源在谈推荐理由:Gary Marcus 的尖锐观点直击 OpenAI 的商业模式隐患,关注 AI 公司治理和投资风险的从业者值得一看,看完会对 Anthropic 和 OpenAI 的差异有更深理解。原文
08:16berryxia@berryxiaAnthropic 上个月启动 Project Glasswing 网络安全合作项目,一个月内与合作伙伴在生产环境中发现超过一万条高危或关键漏洞,全部来自核心软件。此前安全团队一年能挖出几百个已属不易,AI 将漏洞发现效率提升至全新水平。Anthropic 表示后续模型如 Claude Mythos Preview 将继续加速挖掘。这一成果意味着软件行业需适应海量漏洞持续暴露的新现实,补丁管理将面临更大压力。AI产品AnthropicProject Glasswing网络安全漏洞挖掘Claude10 个信源在谈推荐理由:Anthropic 用 AI 把漏洞挖掘效率提升了几个数量级,做安全运维或软件开发的团队需要重新评估自己的补丁策略——一个月一万个高危漏洞,不是模拟,是真实生产环境。原文
03:38Anthropic@AnthropicAI精选Anthropic 在 Project Glasswing 的初始更新中报告,Claude Mythos Preview 模型能够发现大量软件漏洞。该模型的能力可能对软件行业的安全流程产生显著影响。Anthropic 提示行业需适应这种新型漏洞发现方式的规模。AI模型Claude Mythos PreviewAnthropicProject GlasswingAI安全软件漏洞10 个信源在谈推荐理由:Anthropic 展示了 Claude 发现漏洞的新能力原文
16:02IT之家(博客/媒体)科技媒体 The Information 报道,OpenAI 2026 年第一季度营收达 57 亿美元,比 Anthropic 的 48 亿美元高出约 10 亿美元。ChatGPT 仍是核心产品,但增长重心转向企业业务和编程助手 Codex,周活跃用户约 9.2 亿,付费订阅用户增至 5500 万。不过,调整后营业利润率为负 122%,即每赚 1 美元亏损 1.22 美元,未计入股权激励。亏损压力下,OpenAI 正加速上市,已与高盛、摩根士丹利合作,最早可能在 9 月 IPO。这表明 AI 公司竞争已从模型能力延伸到营收和商业化节奏。行业OpenAIAnthropic营收IPOAI 商业化10 个信源在谈推荐理由:OpenAI 和 Anthropic 的营收数据揭示了 AI 公司从烧钱到商业化的真实拐点,关注 AI 行业投资和竞争格局的读者值得一看。原文
11:38arXiv: OpenAI@Andrii Kryshtal精选72°一项新研究测试了 OpenAI、Anthropic、DeepSeek、xAI 的九款模型在 90 个多轮冲突场景中的表现,发现模型在涉及战争罪行、种族灭绝否认、种族歧视等敏感话题时,输出可能加剧社会分裂。失败率从 6% 到 47% 不等,当用户要求“平衡”报道时,五款模型在 80%-100% 的情况下失败。研究首次提出针对冲突场景的评估框架,呼吁将此类测试纳入模型安全评估体系。论文AI安全冲突场景模型评估OpenAIAnthropicDeepSeekxAI10 个信源在谈推荐理由:做 AI 安全评估或部署在敏感地区的团队,这篇论文给出了第一个可复用的冲突场景测试框架,能直接用来检查模型是否会在关键议题上“和稀泥”——看完你会重新审视“中立”输出的代价。原文
08:06Gary Marcus@GaryMarcusGary Marcus 在 X 上发帖,声称要核查 OpenAI 和 Anthropic 最新头条背后的数学。他附上了一个链接,但未提供具体细节。该帖子获得了 2000 次浏览和 10 个赞,但只有 3 条评论和 0 次转发。Marcus 作为 AI 批评者,经常质疑大公司的宣传,这次核查可能针对模型性能或成本数据。目前尚不清楚他具体核查了哪条新闻或哪项声明。行业OpenAIAnthropicGary Marcus模型评估行业批评10 个信源在谈推荐理由:Gary Marcus 的核查往往能戳破 AI 公司的宣传泡沫,关注模型真实能力的读者值得一看,看完可能会对头条数字更警惕。原文
08:06IT之家(博客/媒体)Anthropic 联合创始人杰克·克拉克在牛津大学演讲中预测了未来 2 年的 AI 进化时间表。他认为未来 12 个月内 AI 将与人类合作产出诺贝尔奖级发现;2 年内双足机器人将辅助技工;18 个月内纯 AI 运营公司将创造数百万美元营收;到 2028 年底 AI 系统或可设计自己的继任者。克拉克指出 AI 发展速度“快到令人眩晕”,但商业利益与地缘政治博弈正在压过生存性议题,放慢研发速度虽有利于社会适应,但现实并不乐观。行业AnthropicAI 进化时间表纯 AI 公司双足机器人10 个信源在谈推荐理由:克拉克的时间表给 AI 从业者和投资者划出了关键节点——18 个月内纯 AI 公司就能盈利,做 AI 创业或投资的值得关注这个窗口期。原文
08:05Suhail@Suhail英伟达CEO黄仁勋在一条推文中以调侃口吻表示,他乐于看到客户尝试其他AI芯片,因为只有通过对比才能凸显英伟达产品的优势。该言论被引用在关于Anthropic需要多少AI芯片供应商的讨论中,强调云厂商自研服务器芯片的重要性。这反映了当前AI芯片市场竞争激烈,英伟达虽占主导地位,但客户多元化策略正成为趋势。行业英伟达AI芯片云厂商自研芯片Anthropic黄仁勋10 个信源在谈推荐理由:黄仁勋这句调侃背后是AI芯片市场的真实博弈——云厂商自研芯片已成必然,做AI基础设施决策的团队值得细品其中的竞争信号。原文
08:05Gary Marcus@GaryMarcusAnthropic 预计将迎来史上首个盈利季度,但盈利主要来自 SpaceX 提供的一次性折扣,而非核心业务增长。该折扣针对一笔 25 亿美元的算力账单,其金额可能超过预计的 5.59 亿美元利润。这笔交易涉及 Anthropic 每月向 SpaceX 支付 12.5 亿美元,直至 2029 年 5 月,算力在 2026 年 5 月至 6 月逐步提升并享受优惠费率。这一背景揭示了 Anthropic 盈利的脆弱性,也凸显了 AI 公司对算力成本的依赖。行业AnthropicSpaceX算力成本盈利分析AI 行业10 个信源在谈推荐理由:Anthropic 的盈利故事背后藏着算力成本真相,关注 AI 公司财务健康的投资者和从业者值得细看——盈利未必代表商业模式跑通。原文
08:05AI Will@FinanceYF5Anthropic 正在做一件多数 AI 公司忽略的事:邀请哲学家、神学家和伦理学家共同讨论 AI 应有的品格。他们甚至测试给 Claude 一个“暂停键”,让模型在关键决策前回顾自身价值观。初步测试显示效果显著,能减少不当输出。这反映了 Anthropic 在 AI 安全与伦理上的独特路径,强调价值观对齐而非单纯性能优化。AI产品AnthropicClaudeAI 伦理价值观对齐暂停键10 个信源在谈推荐理由:当其他公司只卷参数时,Anthropic 在思考 AI 的品格——做 AI 伦理或安全研究的团队值得关注这个“暂停键”实验,它可能重新定义价值观对齐的实践方式。原文
08:03AI Will@FinanceYF5Anthropic 在过去几个月与学者、哲学家、神职人员和伦理学家举行对话,探讨 AI 引发的伦理问题,特别是良好品格如何形成。他们正在扩大关于前沿 AI 的讨论范围,从技术层面延伸到人文与伦理维度。相关文章已发布在 Anthropic 官网,详细阐述了这一倡议的背景与意义。行业AnthropicAI伦理人文对话品格养成前沿AI10 个信源在谈推荐理由:Anthropic 将 AI 伦理讨论从技术圈拓展到人文领域,关注 AI 对品格与价值观的影响,关心 AI 社会影响的读者值得一读。原文
04:49rohanpaul_ai@rohanpaul_ai据彭博社报道,美国五角大楼正在测试多个竞品AI模型,以评估是否替换目前在军事工作流中使用的Anthropic的Claude。25名高级用户正在对比这些模型处理国防部最严苛AI任务的能力。这一举动表明,军方对AI供应商的选择正变得更加审慎,可能影响未来军事AI的部署格局。行业五角大楼AnthropicClaude军事AIAI模型测试10 个信源在谈推荐理由:军事领域AI选型风向标——五角大楼的测试结果将直接影响AI在国防场景的落地路径,关注AI安全与军事应用的从业者值得跟进。原文
03:05rohanpaul_ai@rohanpaul_ai76°据 The Information 报道,Anthropic 正在与微软进行早期谈判,计划租赁并使用微软自研的 Maia 200 AI 芯片用于推理任务。微软宣称 Maia 200 在某些推理场景下比英伟达芯片更具成本效益。该芯片是微软第二代 AI 加速器,采用台积电 3nm 工艺,配备 216GB HBM3e 显存和 7TB/s 带宽,专为快速处理大模型推理而设计。Anthropic 已承诺向 Azure 投入 300 亿美元,微软可能向 Anthropic 投资 50 亿美元,且 Claude 已深度集成到微软 Copilot 中,因此芯片合作是双方客户-供应商反馈循环的一部分。分析认为,Maia 无需在所有领域击败英伟达,只要在特定高容量推理任务中更便宜,就能将数十亿 token 从 GPU 转移过来。AI产品Anthropic微软Maia 200推理芯片成本优化10 个信源在谈推荐理由:微软 Maia 芯片若在推理成本上优于英伟达,做大规模 AI 推理的团队将多一个省钱选择,Anthropic 的动向值得关注。原文