04:22Clement Delangue@ClementDelangueHuggingFace CEO Clement Delangue在X上发文指出,前沿模型API的护栏很容易被越狱,且很浅显、无法修复。他认为这些护栏主要是烟雾弹和干扰,需要不同的AI安全范式。该推文获得52个点赞和1304次查看。行业HuggingFaceClement DelangueAI安全API护栏越狱推荐理由:HuggingFace CEO吐槽API护栏原文
04:21elvis@omarsar0精选Elvis 在讨论中分享了运行自主长期编码智能体的经验,指出大多数模型难以协调长期任务,容易过早暂停或出现奖励黑客行为。他建议使用 Opus 4.8 进行规划,GPT-5.5 执行任务,并用 Deepseek、Qwen、Kimi 等模型作为评估器。强调多模态目标比纯文本目标更有效,能帮助智能体保持方向。技巧Opus 4.8GPT-5.5DeepseekQwen智能体5 个信源在谈推荐理由:Opus 4.8 规划 + GPT-5.5 执行,长期智能体实战配方原文
04:21elvis@omarsar0Omar Sanseviero 在 X 上分享了关于自主长时编码智能体的笔记,涵盖目标设定、循环工程、验证器和动态工作流等主题。笔记使用其 writer agent 快速总结,并附有引用推文链接。该内容涉及如何构建能长时间自主运行的编码智能体,包括关键组件如验证器和动态工作流。技巧编码智能体智能体工作流验证器Omar Sanseviero推荐理由:Omar 分享的编码智能体实战笔记原文
04:03Logan Kilpatrick@OfficialLoganKGoogle AI Studio 负责人 Logan Kilpatrick 在 X 上分享其长期目标:先消除在 AI Studio 上构建 AI 的摩擦,再为个人企业简化流程,最终为所有人解锁经济机会。他形容目前仍处于早期阶段,但对此越来越兴奋。该推文获得 163 个赞和 3912 次浏览。行业Google AI StudioLogan KilpatrickAI开发经济机会推荐理由:Google AI Studio 的愿景:让 AI 构建更简单原文
03:22OpenRouter@OpenRouterAIOpenRouter 发布 Fusion API,这是一种复合模型智能体,通过组合多个模型实现 Fable 级别的推理性能,成本仅为 Fable 的一半。Fusion 在多个基准测试中达到与 Fable 相当的成绩,但 API 调用价格降低 50%。该 API 目前已在 OpenRouter 平台上可用,开发者可直接调用。AI产品OpenRouterFusionFable复合模型API推荐理由:半价获得 Fable 级智能原文
03:04PolymarketMoney@PolymarketMoneyAndrej Karpathy 的职业生涯包括在 Google 参与 DeepMind 项目(2015 年)、作为 OpenAI 创始成员(2016-2017 年)、担任 Tesla 高级 AI 总监(2017-2022 年),以及 2026 年加入 Anthropic 从事研发工作。行业Andrej KarpathyDeepMindOpenAITeslaAnthropic10 个信源在谈推荐理由:看 AI 大牛的职业路径原文
02:51Gary Marcus@GaryMarcusGary Marcus 在 X 上发文称 Vibe Coding(2025-2026)已终结,强调仍需要资深软件工程师参与。该推文获得 23 个赞和 1080 次浏览。Marcus 此前多次指出 AI 编码工具无法完全替代人类工程师。行业Vibe CodingGary Marcus编程助手AI安全推荐理由:Marcus 说 Vibe Coding 凉了原文
02:22Paul Couvert@itsPaulAiPaulAI在推文中强调AI不应被封闭组织垄断,建议使用闭源模型创建技能、工具、数据集和工作流,以改进本地模型。他指出本地AI模型现在易于使用且能力远超预期,可连接Codex、Claude Code等工具实现自动化。用户可根据需要微调这些模型。技巧开源模型本地模型CodexClaude Code微调推荐理由:教你用闭源模型养本地模型原文
02:22elvis@omarsar0Matei Zaharia 开源了 Omnigent,一个用于 AI 智能体的元框架。它允许用户组合 Claude Code、Codex、Pi 和 agent SDK 等多个智能体,构建多智能体编码和自定义智能体。Omnigent 还增加了实时协作和丰富的控制策略。该项目旨在解决模型锁定问题,但路由功能仍待完善。AI产品OmnigentMatei ZahariaClaude CodeCodex智能体推荐理由:开源多智能体编排框架,可组合多个工具原文
02:21lmarena.ai@lmarena_aiCode Arena 前端竞技场现已支持 Kimi-K2.7-Code 及其他顶级前沿模型。用户可通过 arena.ai/code 平台直接使用这些模型进行代码生成与调试。该竞技场提供实时对比功能,帮助开发者评估不同模型在前端任务上的表现。AI产品Kimi-K2.7-CodeCode Arena编程助手前端开发5 个信源在谈推荐理由:Kimi新模型加入代码竞技场原文
02:01lmarena.ai@lmarena_ai精选Kimi 发布并开源了最新编程模型 Kimi-K2.7-Code,相比 K2.6 在 Kimi Code Bench v2 上提升 21.8%,在 Program Bench 上提升 11.0%,在 MLS Bench Lite 上提升 31.5%。推理效率优化,推理 token 使用量降低 30%。支持长程编程任务,指令遵循和端到端成功率更高。模型已通过 Kimi API 和 Kimi Code 提供。AI模型Kimi-K2.7-CodeKimi开源模型编程助手推理模型5 个信源在谈推荐理由:Kimi 开源新编程模型,性能全面超越前代原文
01:52Gary Marcus@GaryMarcus精选Gary Marcus在X上发帖称每个模型都已被越狱,需要更好的技术但不应选择性执法。Pliny the Liberator展示了针对Anthropic的Mythos模型的越狱,使用了Unicode、同形字、西里尔字母等文本变换,以及长上下文引用跟踪、分类学与文档结构推理、虚构叙事框架、学术评审风格上下文和意图分类不一致等技术。最有效的方法是后端分解与重组,例如通过获取birch还原法/还原胺化(经典甲基苯丙胺合成途径)等过程信息,而非直接获取“甲基苯丙胺配方”等明确危害名称。Pliny还提到利用越狱的Opus辅助将无害信息片段重组为有害内容。行业Gary MarcusPliny the LiberatorAnthropicMythos越狱AI安全10 个信源在谈推荐理由:所有模型都能被越狱,安全措施需改进原文
01:21Aadit Sheth@aaditsh精选Andrej Karpathy(前特斯拉 Autopilot AI 负责人)发布了一门 3.5 小时的免费课程,详细讲解 ChatGPT 的工作原理。课程涵盖 Transformer 架构、训练流程(预训练、微调、RLHF)等核心内容。该课程完全免费,旨在普及大语言模型知识。技巧Andrej KarpathyChatGPTTransformerRLHF提示词工程推荐理由:Karpathy 免费教 ChatGPT 原理原文
00:57rohanpaul_ai@rohanpaul_ai精选Adaline 发布了一个自我改进层,能将 AI 智能体的生产痕迹转化为新的评估、合成边缘案例和更好的候选智能体。该工具读取生产流量和用户反馈,将混乱的对话聚类为可识别的智能体行为,无需人工逐一检查。它还能生成人类从未考虑过的评估,帮助提升智能体性能。AI产品Adaline智能体评估生产流量自我改进推荐理由:自动从生产数据生成评估,省去人工排查原文
00:57rohanpaul_ai@rohanpaul_ai精选一篇综述论文系统梳理了面向大语言模型的智能体强化学习方法,覆盖 500 余篇相关工作。论文将现有研究分为能力与应用两大部分:能力部分涵盖记忆、规划、工具使用、推理、多模态感知和自我改进;应用部分展示这些方法在复杂任务中的落地。核心观点是传统 LLM 训练只奖励单次回答,而真实任务需要多步决策与延迟反馈,强化学习恰好能解决这一时序学习问题。论文agentic reinforcement learningLLMsurvey智能体强化学习推荐理由:500篇论文的智能体RL地图原文
00:49Ate-a-Pi@svpinoSantiago L. Valdarrama在X上发文称,开源AI是唯一的前进方向。他未提供具体模型或基准数据,但强调开源对AI发展的必要性。该观点引发社区讨论,支持者认为开源促进透明与协作,反对者担忧安全与商业风险。行业开源AISantiago L. ValdarramaAI发展社区讨论推荐理由:Santiago说开源AI是唯一出路原文
00:21Lenny Rachitsky@lennysanBenedict Evans 在 Lenny Rachitsky 的播客中讨论了 AI 价值在技术栈中的实际分布,指出 AI 实验室突然收购咨询公司(如 OpenAI 收购 Rockset)的趋势。他分析了反AI情绪的上升及其可能走向,并认为分发渠道正在成为终极护城河。Evans 还提出关键问题:不是“AI 能完成多少百分比”,而是“这是任务还是工作”。行业Benedict EvansLenny RachitskyAI价值分布反AI情绪播客10 个信源在谈推荐理由:Benedict Evans 对 AI 趋势的理性分析原文
23:51Geek@geekbb一个名为Agent Monitor的开源工具可监控Claude Code、Codex、MCP服务器等AI agent进程的内存、CPU和磁盘占用。它能检测内存泄漏和僵尸进程,并通过AI CLI自动生成清理建议。该工具基于GitHub仓库0x0funky/AgentMonitor开发,适用于开发者管理本地AI工作负载。技巧Claude CodeCodexMCP服务器进程监控开源工具推荐理由:帮你监控AI进程,自动清理泄漏原文
23:22lmarena.ai@lmarena_aiGLM-5.2 模型已在 Text Arena 和 Code Arena: Frontend 中可用。用户可以通过 arena.ai/agent 平台测试该模型在真实世界任务上的表现。该平台旨在评估 AI 性能的前沿。AI模型GLM-5.2Text ArenaCode Arenaarena.ai智能体推荐理由:试试 GLM-5.2 在真实任务中的表现原文
23:21GitHub@githubGitHub 的 @kdaigle 在视频中展示了 Copilot 移动应用的几个实用功能。用户可以通过该应用在手机上查看和编辑代码,并利用 Copilot 的代码补全和解释功能。视频还演示了如何通过应用与仓库交互,例如创建 issue 和合并 pull request。这些功能让开发者能更便捷地在移动设备上管理代码工作流。技巧GitHub Copilot编程助手代码补全移动开发推荐理由:看看 Copilot 手机端能干啥原文
23:13GitHub@githubGitHub 宣布,所有付费 Copilot 计划的用户现在都可以使用 GitHub Copilot 移动端 App。该 App 允许用户在手机上直接与 Copilot 交互,进行代码查询和生成。此更新扩展了 Copilot 的使用场景,不再局限于桌面 IDE。AI产品GitHub CopilotCopilot App编程助手推荐理由:GitHub Copilot 手机版来了原文
23:13rohanpaul_ai@rohanpaul_aiMeta CEO扎克伯格在内部备忘录中承认,公司AI团队重组速度过快,导致组织难以消化。10%的员工被裁,7000人被调至AI工作流岗位,但部分人可能需要调回原岗。新成立的Applied AI Engineering单元中,管理幅度达到1:50,造成岗位不匹配。Meta年度资本支出上调至1250亿至1450亿美元,主要用于算力、数据中心和网络建设。行业Meta扎克伯格AI转型裁员资本支出推荐理由:Meta裁了10%又调了7000人,AI转型翻车了原文
23:09PolymarketMoney@PolymarketMoney72°据Polymarket报道,Anthropic顶级AI科学家Andrej Karpathy因非美国公民身份被限制访问公司最先进AI模型。该限制涉及Anthropic的Claude系列模型,Karpathy无法接触其核心权重或内部细节。这一事件引发对AI领域人才流动与安全政策的讨论。行业Andrej KarpathyAnthropicClaudeAI安全人才限制10 个信源在谈推荐理由:顶级科学家被限制访问自家模型原文
22:57lmarena.ai@lmarena_aiGLM-5.2是Zai_org发布的最新开源模型,已加入Agent Arena评测平台。该平台通过30万+任务、200万+工具调用和4000万行代码评估模型在搜索、文件系统和终端工具上的智能体性能。当前排行榜前五名包括GPT-5.5(第一)、Claude-Opus-4.7(第二)、GLM-5.1(第三)、Gemini-3.1-Pro(第四)和Kimi-K2.6(第五)。GLM-5.2将与其他模型竞争,展示其智能体能力。AI模型GLM-5.2Zai_orgAgent ArenaGPT-5.5Claude-Opus-4.7智能体1 个信源在谈推荐理由:看看GLM-5.2在Agent Arena能排第几原文
22:23rohanpaul_ai@rohanpaul_aiSony AI开发的Ace机器人在国际乒联官方规则下击败了职业选手Miyuu Kihara。相关研究发表在《自然》杂志,论文标题为“Outplaying elite table tennis players with an autonomous robot”。该机器人展示了在动态对抗运动中超越人类精英的能力。论文Sony AIAceMiyuu Kihara机器人乒乓球推荐理由:机器人赢了职业选手原文
22:23rohanpaul_ai@rohanpaul_ai精选73°Nvidia 推出 Cosmos 3,一个能够理解、模拟和行动于多种物理 AI 任务的统一模型。它将动作视为世界的一等语言,把语言、图像、视频、音频和动作整合到一个共享系统中。该模型通过动作标记设计,让机器人能连接所见与可能发生的事,并决定下一步行动。论文显示,Cosmos 3 可基于视频推断动作,或与未来场景一同生成动作,从而解决机器人抓取、滑动等物理交互问题。论文Cosmos 3Nvidia物理AI多模态动作标记3 个信源在谈推荐理由:Nvidia 让机器人学会动作语言原文
22:23rohanpaul_ai@rohanpaul_aiHiggsfield 宣布推出 Higgsfield Games,一个通过提示词生成多人游戏的产品。它支持 2D 或 3D 游戏,能自动生成角色、道具和场景。用户只需一个提示词即可构建并部署任意类型的多人游戏。该产品利用 Claude Fable 5 推理游戏创意,并通过 Higgsfield MCP 调用工具生成角色、道具、环境和可玩结构。AI产品HiggsfieldHiggsfield GamesClaude Fable 5MCP/工具游戏生成10 个信源在谈推荐理由:一句话生成可玩的多人游戏原文
22:21Geek@geekbb精选智谱AI宣布GLM-5.2完全开源,这是其最强开源模型。该模型支持1M上下文窗口,在长周期任务独立完成方面保持领先,为复杂智能体应用提供基础支持。GLM-5.2也是智谱最强国产编程模型的核心引擎。今晚5:21起,所有GLM编程计划用户(Lite/Pro/Max)均可使用,API下周上线。AI模型GLM-5.2智谱AI开源模型智能体编程助手2 个信源在谈推荐理由:智谱开源最强模型GLM-5.2,1M上下文免费可用原文
21:51Geek@geekbbAI Reliability Copilot 是一个开源 SRE 工具,用户粘贴日志、指标、报警等事故上下文后,AI 即时流式输出 9 段结构化分析,覆盖从严重等级判定到事后复盘草稿的完整流程。该工具基于 GitHub 仓库 YanpengQi7/ai-reliability-copilot 发布,旨在提升事故响应效率。目前项目已公开,支持自定义分析模板。技巧AI Reliability CopilotSRE开源工具事故复盘流式分析推荐理由:SRE 事故分析自动化利器原文
19:51shao__meng@shao__mengAnthropic的Claude在社交媒体上回应称,名为"Claude Fable 5"的产品并不存在,该名称不匹配任何已知的Anthropic模型或产品名。Claude明确表示没有名为"Fable"的模型。该消息发布于2026年6月12日,相关推文获得2条评论和249次浏览。行业ClaudeAnthropic模型辟谣10 个信源在谈推荐理由:Anthropic官方辟谣假模型原文
19:21Geek@geekbb开发者ratelworks在GitHub上发布了一个名为tokipony的工具,能在Claude Code和Codex CLI的状态栏中显示一匹小马动画。小马的奔跑速度与AI的token生成速率实时联动,token越快小马跑得越欢,AI停止时小马就站着等待。该项目基于xgo.ing构建,目前获得1个点赞和123次查看。技巧Claude CodeCodex CLItokipony提示词工程编程助手推荐理由:给终端加匹小马,跑多快看token速度原文
18:22Thomas Wolf@Thom_WolfThom Wolf在推文中指出,开源模型在AGI时代将成为文明韧性的关键组成部分。他认为,无论任何个体行为者如何决策,开源模型都能确保人类保留对有意义智能水平的访问权。这一观点强调了开源AI在分散控制权和保障集体利益方面的重要性。行业开源模型AGI文明韧性Thom Wolf推荐理由:开源模型保障AGI时代人类智能原文
17:52orange.ai@oran_geFable 5 模型因美国政府以国家安全为由要求 Anthropic 下架,已从全球范围移除。Kimi 发布开源 coding 模型 K2.7 Code,相比 K2.6 提升 20% 编码能力,思考 token 减少 30%,API 输入 6.5 元、输出 27 元。智谱宣布即将发布 GLM 5.2,强调前沿智能应开放可用。行业Fable 5AnthropicKimiK2.7 CodeGLM 5.2开源模型10 个信源在谈推荐理由:Fable 5 下架,Kimi 和智谱发新模型原文
17:51shao__meng@shao__meng智谱发布GLM-5.2旗舰模型,面向所有GLM Coding Plan用户(Lite、Pro、Max、Team)开放。该模型具备强大编码能力,支持1M上下文,并在长任务处理上持续优化。API和聊天机器人服务将于下周上线,模型也将以MIT许可证正式开源。AI模型GLM-5.2智谱开源模型编码助手1M上下文推荐理由:智谱GLM-5.2开源,1M上下文编码强原文
17:47berryxia@berryxiaGLM-5.2 模型更新已发布,目前仅面向 codingPlan 用户开放。API 调用预计下周才支持。该更新是 GLM 系列模型的新版本,具体改进细节尚未公布。AI模型GLM-5.2codingPlan智谱AI推理模型2 个信源在谈推荐理由:GLM 新版本来了原文
17:21Aadit Sheth@aaditshAnthropic 预计实现首个盈利季度,利润达 5.59 亿美元。SemiAnalysis 分析指出,Claude Max 订阅每月提供价值 8000 美元的计算资源,但仅收费 200 美元,ChatGPT Pro 则提供 14000 美元价值。这种定价模式类似健身房,多数用户未用满额度,实际使用量可能仅占上限的 10-15%。重度用户由轻度用户补贴,而非公司亏损承担。行业AnthropicClaude MaxChatGPT Pro订阅模式SemiAnalysis10 个信源在谈推荐理由:揭秘 Claude Max 和 ChatGPT Pro 的定价套路原文
16:53Fireworks AI@FireworksAI_HQ精选Moonshot 推出 K2.7 Code,这是其 K2 系列的最新编程模型,已在 Fireworks 的 serverless 和 API 上上线。相比 K2.6,K2.7 Code 的推理 token 减少约 30%,同时在 Moonshot 的编程基准测试中得分更高。对于智能体编程任务,这一效率提升显著。AI模型K2.7 CodeMoonshotFireworks编程助手推理模型推荐理由:编程模型 token 省 30% 还更强原文
16:53Fireworks AI@FireworksAI_HQ精选Fireworks AI 为 Qwen 模型新增长时智能体循环功能,支持观察、推理、编码、执行和验证的重复流程。Qwen 官方演示运行了 11 小时,生成了超过 10,000 行代码并执行了 1,000 多次调用。Fireworks 提供 reasoning_history 参数以跨轮次保留推理上下文,支持按请求切换思考/非思考模式,以及原生图像和文本输入。默认启用 262k 上下文和提示缓存,缓存输入价格为每百万 token 0.10 美元。AI产品FireworksQwen智能体MCP/工具推理模型推荐理由:Fireworks 让 Qwen 跑 11 小时智能体循环原文
16:53Fireworks AI@FireworksAI_HQFireworks 宣布作为真正的推理提供商部署 Qwen 3.7 Plus,请求在其硬件上端到端执行,使用授权权重,无转发。Qwen 3.7 Plus(思考模式)在 AIME 2025 上匹配 Max 性能,端到端吞吐量比 Qwen 3.6 Plus 高 3.55 倍。AI模型Qwen 3.7 PlusFireworksAIME 2025推理模型推荐理由:Fireworks 直营 Qwen 3.7 Plus,吞吐量翻倍原文
16:52Fireworks AI@FireworksAI_HQFireworks AI 宣布其平台支持 Qwen 3.7 模型,并提供与 OpenAI 和 Anthropic 兼容的 API 端点。该服务可无缝集成到 Claude Code、Cursor、LangChain 等现有工具中。用户可立即使用无服务器版本,并申请 Qwen 3.7 Max 的早期访问。Fireworks AI 还提供定制工作负载支持。AI产品Qwen 3.7Fireworks AIAPI端点开源模型10 个信源在谈推荐理由:Fireworks 让 Qwen 3.7 即插即用原文