全部 AI 动态 · AI 热点

AITOP

6月14日

04:22

Clement Delangue@ClementDelangue

HuggingFace CEO Clement Delangue在X上发文指出，前沿模型API的护栏很容易被越狱，且很浅显、无法修复。他认为这些护栏主要是烟雾弹和干扰，需要不同的AI安全范式。该推文获得52个点赞和1304次查看。

推荐理由：HuggingFace CEO吐槽API护栏

原文

04:21

elvis@omarsar0

精选

Elvis 在讨论中分享了运行自主长期编码智能体的经验，指出大多数模型难以协调长期任务，容易过早暂停或出现奖励黑客行为。他建议使用 Opus 4.8 进行规划，GPT-5.5 执行任务，并用 Deepseek、Qwen、Kimi 等模型作为评估器。强调多模态目标比纯文本目标更有效，能帮助智能体保持方向。

技巧 Opus 4.8 GPT-5.5 Deepseek Qwen 智能体

推荐理由：Opus 4.8 规划 + GPT-5.5 执行，长期智能体实战配方

原文

04:21

elvis@omarsar0

Omar Sanseviero 在 X 上分享了关于自主长时编码智能体的笔记，涵盖目标设定、循环工程、验证器和动态工作流等主题。笔记使用其 writer agent 快速总结，并附有引用推文链接。该内容涉及如何构建能长时间自主运行的编码智能体，包括关键组件如验证器和动态工作流。

技巧编码智能体智能体工作流验证器 Omar Sanseviero

推荐理由：Omar 分享的编码智能体实战笔记

原文

04:03

Logan Kilpatrick@OfficialLoganK

Google AI Studio 负责人 Logan Kilpatrick 在 X 上分享其长期目标：先消除在 AI Studio 上构建 AI 的摩擦，再为个人企业简化流程，最终为所有人解锁经济机会。他形容目前仍处于早期阶段，但对此越来越兴奋。该推文获得 163 个赞和 3912 次浏览。

行业 Google AI Studio Logan Kilpatrick AI开发经济机会

推荐理由：Google AI Studio 的愿景：让 AI 构建更简单

原文

03:22

OpenRouter@OpenRouterAI

OpenRouter 发布 Fusion API，这是一种复合模型智能体，通过组合多个模型实现 Fable 级别的推理性能，成本仅为 Fable 的一半。Fusion 在多个基准测试中达到与 Fable 相当的成绩，但 API 调用价格降低 50%。该 API 目前已在 OpenRouter 平台上可用，开发者可直接调用。

AI产品 OpenRouter Fusion Fable 复合模型 API

推荐理由：半价获得 Fable 级智能

原文

03:04

PolymarketMoney@PolymarketMoney

Andrej Karpathy 的职业生涯包括在 Google 参与 DeepMind 项目（2015 年）、作为 OpenAI 创始成员（2016-2017 年）、担任 Tesla 高级 AI 总监（2017-2022 年），以及 2026 年加入 Anthropic 从事研发工作。

行业 Andrej Karpathy DeepMind OpenAI Tesla Anthropic

推荐理由：看 AI 大牛的职业路径

原文

02:51

Gary Marcus@GaryMarcus

Gary Marcus 在 X 上发文称 Vibe Coding（2025-2026）已终结，强调仍需要资深软件工程师参与。该推文获得 23 个赞和 1080 次浏览。Marcus 此前多次指出 AI 编码工具无法完全替代人类工程师。

行业 Vibe Coding Gary Marcus 编程助手 AI安全

推荐理由：Marcus 说 Vibe Coding 凉了

原文

02:22

Paul Couvert@itsPaulAi

PaulAI在推文中强调AI不应被封闭组织垄断，建议使用闭源模型创建技能、工具、数据集和工作流，以改进本地模型。他指出本地AI模型现在易于使用且能力远超预期，可连接Codex、Claude Code等工具实现自动化。用户可根据需要微调这些模型。

技巧开源模型本地模型 Codex Claude Code 微调

推荐理由：教你用闭源模型养本地模型

原文

02:22

elvis@omarsar0

Matei Zaharia 开源了 Omnigent，一个用于 AI 智能体的元框架。它允许用户组合 Claude Code、Codex、Pi 和 agent SDK 等多个智能体，构建多智能体编码和自定义智能体。Omnigent 还增加了实时协作和丰富的控制策略。该项目旨在解决模型锁定问题，但路由功能仍待完善。

AI产品 Omnigent Matei Zaharia Claude Code Codex 智能体

推荐理由：开源多智能体编排框架，可组合多个工具

原文

02:21

lmarena.ai@lmarena_ai

Code Arena 前端竞技场现已支持 Kimi-K2.7-Code 及其他顶级前沿模型。用户可通过 arena.ai/code 平台直接使用这些模型进行代码生成与调试。该竞技场提供实时对比功能，帮助开发者评估不同模型在前端任务上的表现。

AI产品 Kimi-K2.7-Code Code Arena 编程助手前端开发

推荐理由：Kimi新模型加入代码竞技场

原文

02:01

lmarena.ai@lmarena_ai

精选

AI模型 Kimi-K2.7-Code Kimi 开源模型编程助手推理模型

推荐理由：Kimi 开源新编程模型，性能全面超越前代

原文

01:52

Gary Marcus@GaryMarcus

精选

Gary Marcus在X上发帖称每个模型都已被越狱，需要更好的技术但不应选择性执法。Pliny the Liberator展示了针对Anthropic的Mythos模型的越狱，使用了Unicode、同形字、西里尔字母等文本变换，以及长上下文引用跟踪、分类学与文档结构推理、虚构叙事框架、学术评审风格上下文和意图分类不一致等技术。最有效的方法是后端分解与重组，例如通过获取birch还原法/还原胺化（经典甲基苯丙胺合成途径）等过程信息，而非直接获取“甲基苯丙胺配方”等明确危害名称。Pliny还提到利用越狱的Opus辅助将无害信息片段重组为有害内容。

行业 Gary Marcus Pliny the Liberator Anthropic Mythos 越狱 AI安全

推荐理由：所有模型都能被越狱，安全措施需改进

原文

01:21

Aadit Sheth@aaditsh

精选

Andrej Karpathy（前特斯拉 Autopilot AI 负责人）发布了一门 3.5 小时的免费课程，详细讲解 ChatGPT 的工作原理。课程涵盖 Transformer 架构、训练流程（预训练、微调、RLHF）等核心内容。该课程完全免费，旨在普及大语言模型知识。

技巧 Andrej Karpathy ChatGPT Transformer RLHF 提示词工程

推荐理由：Karpathy 免费教 ChatGPT 原理

原文

00:57

rohanpaul_ai@rohanpaul_ai

精选

Adaline 发布了一个自我改进层，能将 AI 智能体的生产痕迹转化为新的评估、合成边缘案例和更好的候选智能体。该工具读取生产流量和用户反馈，将混乱的对话聚类为可识别的智能体行为，无需人工逐一检查。它还能生成人类从未考虑过的评估，帮助提升智能体性能。

AI产品 Adaline 智能体评估生产流量自我改进

推荐理由：自动从生产数据生成评估，省去人工排查

原文

00:57

rohanpaul_ai@rohanpaul_ai

精选

一篇综述论文系统梳理了面向大语言模型的智能体强化学习方法，覆盖 500 余篇相关工作。论文将现有研究分为能力与应用两大部分：能力部分涵盖记忆、规划、工具使用、推理、多模态感知和自我改进；应用部分展示这些方法在复杂任务中的落地。核心观点是传统 LLM 训练只奖励单次回答，而真实任务需要多步决策与延迟反馈，强化学习恰好能解决这一时序学习问题。

论文 agentic reinforcement learning LLM survey 智能体强化学习

推荐理由：500篇论文的智能体RL地图

原文

00:49

Ate-a-Pi@svpino

Santiago L. Valdarrama在X上发文称，开源AI是唯一的前进方向。他未提供具体模型或基准数据，但强调开源对AI发展的必要性。该观点引发社区讨论，支持者认为开源促进透明与协作，反对者担忧安全与商业风险。

行业开源AI Santiago L. Valdarrama AI发展社区讨论

推荐理由：Santiago说开源AI是唯一出路

原文

00:21

Lenny Rachitsky@lennysan

Benedict Evans 在 Lenny Rachitsky 的播客中讨论了 AI 价值在技术栈中的实际分布，指出 AI 实验室突然收购咨询公司（如 OpenAI 收购 Rockset）的趋势。他分析了反AI情绪的上升及其可能走向，并认为分发渠道正在成为终极护城河。Evans 还提出关键问题：不是“AI 能完成多少百分比”，而是“这是任务还是工作”。

行业 Benedict Evans Lenny Rachitsky AI价值分布反AI情绪播客

推荐理由：Benedict Evans 对 AI 趋势的理性分析

原文

6月13日

23:51

Geek@geekbb

一个名为Agent Monitor的开源工具可监控Claude Code、Codex、MCP服务器等AI agent进程的内存、CPU和磁盘占用。它能检测内存泄漏和僵尸进程，并通过AI CLI自动生成清理建议。该工具基于GitHub仓库0x0funky/AgentMonitor开发，适用于开发者管理本地AI工作负载。

技巧 Claude Code Codex MCP服务器进程监控开源工具

推荐理由：帮你监控AI进程，自动清理泄漏

原文

23:22

lmarena.ai@lmarena_ai

GLM-5.2 模型已在 Text Arena 和 Code Arena: Frontend 中可用。用户可以通过 arena.ai/agent 平台测试该模型在真实世界任务上的表现。该平台旨在评估 AI 性能的前沿。

AI模型 GLM-5.2 Text Arena Code Arena arena.ai 智能体

推荐理由：试试 GLM-5.2 在真实任务中的表现

原文

23:21

GitHub@github

GitHub 的 @kdaigle 在视频中展示了 Copilot 移动应用的几个实用功能。用户可以通过该应用在手机上查看和编辑代码，并利用 Copilot 的代码补全和解释功能。视频还演示了如何通过应用与仓库交互，例如创建 issue 和合并 pull request。这些功能让开发者能更便捷地在移动设备上管理代码工作流。

技巧 GitHub Copilot 编程助手代码补全移动开发

推荐理由：看看 Copilot 手机端能干啥

原文

23:13

GitHub@github

GitHub 宣布，所有付费 Copilot 计划的用户现在都可以使用 GitHub Copilot 移动端 App。该 App 允许用户在手机上直接与 Copilot 交互，进行代码查询和生成。此更新扩展了 Copilot 的使用场景，不再局限于桌面 IDE。

AI产品 GitHub Copilot Copilot App 编程助手

推荐理由：GitHub Copilot 手机版来了

原文

23:13

rohanpaul_ai@rohanpaul_ai

Meta CEO扎克伯格在内部备忘录中承认，公司AI团队重组速度过快，导致组织难以消化。10%的员工被裁，7000人被调至AI工作流岗位，但部分人可能需要调回原岗。新成立的Applied AI Engineering单元中，管理幅度达到1:50，造成岗位不匹配。Meta年度资本支出上调至1250亿至1450亿美元，主要用于算力、数据中心和网络建设。

行业 Meta 扎克伯格 AI转型裁员资本支出

推荐理由：Meta裁了10%又调了7000人，AI转型翻车了

原文

23:09

PolymarketMoney@PolymarketMoney

72°

据Polymarket报道，Anthropic顶级AI科学家Andrej Karpathy因非美国公民身份被限制访问公司最先进AI模型。该限制涉及Anthropic的Claude系列模型，Karpathy无法接触其核心权重或内部细节。这一事件引发对AI领域人才流动与安全政策的讨论。

行业 Andrej Karpathy Anthropic Claude AI安全人才限制

推荐理由：顶级科学家被限制访问自家模型

原文

22:57

lmarena.ai@lmarena_ai

AI模型 GLM-5.2 Zai_org Agent Arena GPT-5.5 Claude-Opus-4.7 智能体

推荐理由：看看GLM-5.2在Agent Arena能排第几

原文

22:23

rohanpaul_ai@rohanpaul_ai

Sony AI开发的Ace机器人在国际乒联官方规则下击败了职业选手Miyuu Kihara。相关研究发表在《自然》杂志，论文标题为“Outplaying elite table tennis players with an autonomous robot”。该机器人展示了在动态对抗运动中超越人类精英的能力。

论文 Sony AI Ace Miyuu Kihara 机器人乒乓球

推荐理由：机器人赢了职业选手

原文

22:23

rohanpaul_ai@rohanpaul_ai

精选73°

Nvidia 推出 Cosmos 3，一个能够理解、模拟和行动于多种物理 AI 任务的统一模型。它将动作视为世界的一等语言，把语言、图像、视频、音频和动作整合到一个共享系统中。该模型通过动作标记设计，让机器人能连接所见与可能发生的事，并决定下一步行动。论文显示，Cosmos 3 可基于视频推断动作，或与未来场景一同生成动作，从而解决机器人抓取、滑动等物理交互问题。

论文 Cosmos 3 Nvidia 物理AI 多模态动作标记

推荐理由：Nvidia 让机器人学会动作语言

原文

22:23

rohanpaul_ai@rohanpaul_ai

Higgsfield 宣布推出 Higgsfield Games，一个通过提示词生成多人游戏的产品。它支持 2D 或 3D 游戏，能自动生成角色、道具和场景。用户只需一个提示词即可构建并部署任意类型的多人游戏。该产品利用 Claude Fable 5 推理游戏创意，并通过 Higgsfield MCP 调用工具生成角色、道具、环境和可玩结构。

AI产品 Higgsfield Higgsfield Games Claude Fable 5 MCP/工具游戏生成

推荐理由：一句话生成可玩的多人游戏

原文

22:21

Geek@geekbb

精选

智谱AI宣布GLM-5.2完全开源，这是其最强开源模型。该模型支持1M上下文窗口，在长周期任务独立完成方面保持领先，为复杂智能体应用提供基础支持。GLM-5.2也是智谱最强国产编程模型的核心引擎。今晚5:21起，所有GLM编程计划用户（Lite/Pro/Max）均可使用，API下周上线。

AI模型 GLM-5.2 智谱AI 开源模型智能体编程助手

推荐理由：智谱开源最强模型GLM-5.2，1M上下文免费可用

原文

21:51

Geek@geekbb

AI Reliability Copilot 是一个开源 SRE 工具，用户粘贴日志、指标、报警等事故上下文后，AI 即时流式输出 9 段结构化分析，覆盖从严重等级判定到事后复盘草稿的完整流程。该工具基于 GitHub 仓库 YanpengQi7/ai-reliability-copilot 发布，旨在提升事故响应效率。目前项目已公开，支持自定义分析模板。

技巧 AI Reliability Copilot SRE 开源工具事故复盘流式分析

推荐理由：SRE 事故分析自动化利器

原文

19:51

shao__meng@shao__meng

Anthropic的Claude在社交媒体上回应称，名为"Claude Fable 5"的产品并不存在，该名称不匹配任何已知的Anthropic模型或产品名。Claude明确表示没有名为"Fable"的模型。该消息发布于2026年6月12日，相关推文获得2条评论和249次浏览。

行业 Claude Anthropic 模型辟谣

推荐理由：Anthropic官方辟谣假模型

原文

19:21

Geek@geekbb

开发者ratelworks在GitHub上发布了一个名为tokipony的工具，能在Claude Code和Codex CLI的状态栏中显示一匹小马动画。小马的奔跑速度与AI的token生成速率实时联动，token越快小马跑得越欢，AI停止时小马就站着等待。该项目基于xgo.ing构建，目前获得1个点赞和123次查看。

技巧 Claude Code Codex CLI tokipony 提示词工程编程助手

推荐理由：给终端加匹小马，跑多快看token速度

原文

18:22

Thomas Wolf@Thom_Wolf

Thom Wolf在推文中指出，开源模型在AGI时代将成为文明韧性的关键组成部分。他认为，无论任何个体行为者如何决策，开源模型都能确保人类保留对有意义智能水平的访问权。这一观点强调了开源AI在分散控制权和保障集体利益方面的重要性。

行业开源模型 AGI 文明韧性 Thom Wolf

推荐理由：开源模型保障AGI时代人类智能

原文

17:52

orange.ai@oran_ge

Fable 5 模型因美国政府以国家安全为由要求 Anthropic 下架，已从全球范围移除。Kimi 发布开源 coding 模型 K2.7 Code，相比 K2.6 提升 20% 编码能力，思考 token 减少 30%，API 输入 6.5 元、输出 27 元。智谱宣布即将发布 GLM 5.2，强调前沿智能应开放可用。

行业 Fable 5 Anthropic Kimi K2.7 Code GLM 5.2 开源模型

推荐理由：Fable 5 下架，Kimi 和智谱发新模型

原文

17:51

shao__meng@shao__meng

智谱发布GLM-5.2旗舰模型，面向所有GLM Coding Plan用户（Lite、Pro、Max、Team）开放。该模型具备强大编码能力，支持1M上下文，并在长任务处理上持续优化。API和聊天机器人服务将于下周上线，模型也将以MIT许可证正式开源。

AI模型 GLM-5.2 智谱开源模型编码助手 1M上下文

推荐理由：智谱GLM-5.2开源，1M上下文编码强

原文

17:47

berryxia@berryxia

GLM-5.2 模型更新已发布，目前仅面向 codingPlan 用户开放。API 调用预计下周才支持。该更新是 GLM 系列模型的新版本，具体改进细节尚未公布。

AI模型 GLM-5.2 codingPlan 智谱AI 推理模型

推荐理由：GLM 新版本来了

原文

17:21

Aadit Sheth@aaditsh

Anthropic 预计实现首个盈利季度，利润达 5.59 亿美元。SemiAnalysis 分析指出，Claude Max 订阅每月提供价值 8000 美元的计算资源，但仅收费 200 美元，ChatGPT Pro 则提供 14000 美元价值。这种定价模式类似健身房，多数用户未用满额度，实际使用量可能仅占上限的 10-15%。重度用户由轻度用户补贴，而非公司亏损承担。

行业 Anthropic Claude Max ChatGPT Pro 订阅模式 SemiAnalysis

推荐理由：揭秘 Claude Max 和 ChatGPT Pro 的定价套路

原文

16:53

Fireworks AI@FireworksAI_HQ

精选

Moonshot 推出 K2.7 Code，这是其 K2 系列的最新编程模型，已在 Fireworks 的 serverless 和 API 上上线。相比 K2.6，K2.7 Code 的推理 token 减少约 30%，同时在 Moonshot 的编程基准测试中得分更高。对于智能体编程任务，这一效率提升显著。

AI模型 K2.7 Code Moonshot Fireworks 编程助手推理模型

推荐理由：编程模型 token 省 30% 还更强

原文

16:53

Fireworks AI@FireworksAI_HQ

精选

Fireworks AI 为 Qwen 模型新增长时智能体循环功能，支持观察、推理、编码、执行和验证的重复流程。Qwen 官方演示运行了 11 小时，生成了超过 10,000 行代码并执行了 1,000 多次调用。Fireworks 提供 reasoning_history 参数以跨轮次保留推理上下文，支持按请求切换思考/非思考模式，以及原生图像和文本输入。默认启用 262k 上下文和提示缓存，缓存输入价格为每百万 token 0.10 美元。

AI产品 Fireworks Qwen 智能体 MCP/工具推理模型

推荐理由：Fireworks 让 Qwen 跑 11 小时智能体循环

原文

16:53

Fireworks AI@FireworksAI_HQ

Fireworks 宣布作为真正的推理提供商部署 Qwen 3.7 Plus，请求在其硬件上端到端执行，使用授权权重，无转发。Qwen 3.7 Plus（思考模式）在 AIME 2025 上匹配 Max 性能，端到端吞吐量比 Qwen 3.6 Plus 高 3.55 倍。

AI模型 Qwen 3.7 Plus Fireworks AIME 2025 推理模型

推荐理由：Fireworks 直营 Qwen 3.7 Plus，吞吐量翻倍

原文

16:52

Fireworks AI@FireworksAI_HQ

Fireworks AI 宣布其平台支持 Qwen 3.7 模型，并提供与 OpenAI 和 Anthropic 兼容的 API 端点。该服务可无缝集成到 Claude Code、Cursor、LangChain 等现有工具中。用户可立即使用无服务器版本，并申请 Qwen 3.7 Max 的早期访问。Fireworks AI 还提供定制工作负载支持。

AI产品 Qwen 3.7 Fireworks AI API端点开源模型

推荐理由：Fireworks 让 Qwen 3.7 即插即用

原文

仅展示最近 2000 条内容。更早的内容请查阅 AI 日报存档（侧边栏 → AI 日报 → 顶部「往期日报」）。