全部 AI 动态 · AI 热点

6月17日

00:28

elvis@omarsar0

mattpocockuk 发布了新技能 /teach skill，功能类似于之前已有的 /learn skill。该技能在 Hermes Agent 的 academy 中免费开放使用，用户可通过 AI agent 进行互动学习。实验室当前保持免费，鼓励用户尝试。

推荐理由：mattpocockuk 推了一个新教学技能，和 /learn skill 很像，在 Hermes Agent 里免费就能玩，试试用 AI 代理学习新东西。

原文

00:25

00:25Simon Willison’s Weblog（博客/媒体）

Georgi Gerganov 在 Hacker News 评论中分享，过去一个半月他几乎每天都用 Qwen3.6-27B 模型处理编码任务，运行在 M2 Ultra 或 RTX 5090 上。他使用轻量级 pi agent（pi -nc --offline）搭配简短系统提示来适配个人编程风格。虽然主要用于 ggml-org 的琐碎维护任务，但认为该模型是高效的辅助工具。

技巧 Qwen3.6-27B Georgi Gerganov pi 本地模型编程助手

推荐理由：Georgi Gerganov 亲测 Qwen3.6-27B 配合 pi agent，日常编程完全够用，本地运行无压力。

原文

6月16日

23:31

23:31IT之家（博客/媒体）

71°

开发者@0x0SojalSec 绕过苹果M4神经网络引擎的软件限制，通过逆向工程使用自定义MIL（模型中间语言）直接与芯片通信，没有调用Core ML、Metal或GPU。训练数据全程放在RAM中运行，不写入NAND闪存，速度更快。解锁后M4在iPad或Mac上可达到15.8TFLOPS的AI处理性能，用于训练模型。目前自定义MIL能否用于更新的Apple Silicon尚不明确。

技巧 M4 Apple Silicon 神经网络引擎模型训练逆向工程

推荐理由：有个开发者自己写了一套代码，把M4芯片的AI训练能力全开出来了，不用苹果官方工具，跑到了15.8TFLOPS。想用iPad或Mac训练模型的人可以看看。

原文

23:05

AlphaSignal@AlphaSignalAI

精选

agentcookie是一个开源工具，解决AI代理在第二台Mac上需要手动登录每个网站的问题。它通过单向加密传输，自动同步cookies、bearer tokens和API密钥到代理机器。代理读取这些未修改的凭证后即可在网页和终端中自动认证，无需反复手动登录。该工具仅允许登录信息单向流动，并通过私有网络加密，确保安全。

技巧 agentcookie 登录同步开源工具 Mac AI代理

推荐理由：不用再手动给AI代理的机器一个个登录了，agentcookie自动同步你的所有账号凭证，安全又省事。

原文

21:34

LangChain@LangChainAI

LangChain 在推文中指出，agent 可能调用错误工具、跳过审批步骤、使用错误上下文或生成看似正确但实际错误的答案，即使返回“成功”响应任务也可能失败。因此生产环境中的 agent 团队不能只依赖 uptime、延迟和错误率指标。他们需要监控 agent 的完整执行轨迹，才能定位真正的问题。

技巧 LangChain agent 智能体监控生产环境

推荐理由：生产环境跑 agent 只看成功率不够，LangChain 提示要关注 agent 实际做了什么，推荐做完整轨迹追踪避免翻车。

原文

21:34

LangChain@LangChainAI

精选

LangChain 推出 Traces 功能，可记录 inputs、model calls、tool calls、outputs 和 final action。Evals 将这些学习转化为测试，用于验证下一版本是否更优。团队可借此从手动调试转向持续改进循环。LangChain 创始人 Harrison Chase 将于 6 月 24 日举办深入研讨会。

技巧 LangChain trace eval 智能体调试

推荐理由：想从手动调 bug 升级到自动化评估？LangChain 的 traces 和 evals 帮你把每次运行变成可测指标，持续优化 agent。

原文

20:28

Tri Dao (FlashAttention)@tri_dao

精选

在运行大规模上下文智能体时，Qwen 3.5和Nemotron Ultra等混合模型面临Gated-DeltaNet/Mamba状态的瓶颈。一个简单洞察是加载状态并计算但不存储，可使速度提升2倍。该重计算技巧最终解锁了状态空间模型（SSM）的推测解码（spec decoding）功能。

技巧 Qwen 3.5 Nemotron Ultra Mamba SSM 推测解码

推荐理由：不用存状态，算完就扔，SSM推理直接快一倍，Qwen 3.5和Nemotron Ultra用户试试这个技巧。

原文

20:16

vLLM@vllm_project

精选

Anyscale团队发布报告，介绍如何用Ray Serve和vLLM实现PD Disaggregation。该技术在AMD MI325X GPU上通过了压力测试，验证了实际性能提升。报告强调正确配置是发挥优势的关键。

技巧 vLLM Ray Serve Anyscale AMD MI325X 推理优化

推荐理由：vLLM推荐了Anyscale的这篇实战文章，讲清楚了PD Disagg在Ray Serve加vLLM上的做法，还在AMD MI325X上测过，值得搞推理部署的人看看。

原文

18:57

Patrick Loeber@patloeber

@SmithaKolan 发布了一个AI agents教程，并提供了配套的代码资源。教程内容涵盖如何构建和部署AI agents。代码资源支持实战学习，适合开发者快速上手。

技巧 SmithaKolan AI agents 智能体教程

推荐理由：SmithaKolan 的AI agents教程带代码，手把手教你搭建智能体，适合想实操的开发者。

原文

16:59

AI Will@FinanceYF5

有人让一个Fable 5智能体连续运行6天、无人干预，发现90%的用户只用了其10%的能力。Fable 5设计初衷是长时间持续运行，但多数人只把它当成快速聊天框。该实验揭示了Fable 5实际潜力远超常见用法。

技巧 Fable 5 智能体使用经验

推荐理由：别只把Fable 5当聊天框使！有人让它连续跑了6天，才发现它隐藏的本事，赶紧试试让Fable 5帮你跑长期任务。

原文

16:40

coderabbitai@coderabbitai

CodeRabbit AI在推文中指出，AI代码审查的真正难点不在于检查PR #4306中改了哪些代码，而在于检查所有因为这次改动而间接受影响的部分。这种全局视角能发现隐藏的依赖问题和潜在回归。相比只关注变更本身，全面的影响分析更能保证代码质量。

技巧 CodeRabbit 代码审查 AI辅助开发 PR 连锁影响

推荐理由：CodeRabbit AI提了个很实在的点：别光看改了啥，还得看连带影响了啥，做代码审查的人会懂。

原文

16:28

宝玉@dotey

用户使用Claude Code的dynamic workflows功能完成一个简单任务，几分钟内生成了31个Agents，消耗了1.3M Tokens。该用户Pro套餐的周Token用量从11%跳升至20%（对应20倍倍率）。用户表示成本过高，希望恢复慢速但更经济的模式。

技巧 Claude Code dynamic workflows Agents Token消耗编程助手

推荐理由：Claude Code的dynamic workflows容易烧Token，一个简单任务就干掉1.3M Tokens，Pro用户周用量从11%涨到20%，用之前最好算算账。

原文

15:29

marktechpost@Sana Hassan

精选

本教程基于Docling Parse工具，演示了如何从PDF文档中提取布局感知的结构化数据。首先设置Python环境并解决Colab依赖问题，生成包含文本、列、表格、矢量和嵌入图片的多页PDF。然后提取单词、字符、行及其页面坐标，渲染可视化覆盖层。最终将结果保存为JSON和CSV格式，支持阅读顺序重建和检索准备。

技巧 Docling Parse PDF解析布局感知结构化提取文档智能

推荐理由：手把手教你用Docling Parse从PDF里提取布局信息，生成带坐标的结构化数据，适合做文档智能和RAG。

原文

15:01

Ate-a-Pi@svpino

Google免费发布了一个完整的AI Agent示例，用于模拟新员工入职流程。该Agent支持长时间运行，可自主暂停与恢复，且不丢失上下文。示例中详细介绍了三种架构模式，帮助开发者构建持久化的AI Agent。

技巧 Google 智能体架构模式上下文保持

推荐理由：Google开了个好头，这个示例手把手教你做长时间运行的AI Agent，能暂停恢复不丢上下文，学三招架构模式，直接上手。

原文

14:11

Harrison Chase@hwchase17

精选

开发者 Saurabh 强调，Agent 必须有可观测性。他用 LangGraph 做编排，LangSmith 做追踪、评估和回归测试。如果无法解释 Agent 为何给出某个回答，那就只是 demo 而非架构。他建议通过 tracing 捕获 prompt 和工具调用的全部上下文。

技巧 LangGraph LangSmith Agent 可观测性智能体

推荐理由：如果你在用 LangGraph 做 agent，这招能帮你从 demo 变成可交付的系统——关键是 LangSmith 的 trace 和 eval。

原文

13:37

elvis@omarsar0

该推文建议当微调模型资源消耗过大时，改用验证器（verifiers）作为替代方案。同样，LLM-as-a-Judge系统也值得尝试。通过验证器可评估微调专用模型的价值，降低训练成本。

技巧微调验证器 LLM-as-a-Judge 模型评估

推荐理由：觉得微调太烧钱？试试验证器吧，还能顺带评估LLM-as-a-Judge的效果。

原文

13:35

宝玉@dotey

宝玉(@dotey)介绍了其日常整理AI资讯的Skill「info-digest」，该Skill基于Claude网页版+Opus 4.6生成初稿，再人工校验微调后发布到X和微博。提示词设计要点包括：从读者关心角度写作、联网检索做事实核查、交代背景信息、生成格式适配平台（纯文本、短小精炼）。完整Skill提示词开源于GitHub仓库JimLiu/Illustrated-Agent-Skill。

技巧 Claude Opus GitHub 提示词工程写作技巧

推荐理由：宝玉分享了他写AI资讯的Skill，提示词设计思路很实用——怎么让AI生成读者想看的内容、怎么联网查证避坑。

原文

13:28

宝玉@dotey

baoyu-design skill 近期更新，支持在本地运行 Claude Design 的功能。用户可以借助 Cursor 或 Codex 内置浏览器预览 PPT，按 F 键全屏播放，并能导出为可编辑的 PPTX 文件。新版本还支持导入 Figma 本地 .fig 文件，根据设计系统在本地重建，效果与 Claude Design 在线版一致。作者指出该功能复杂，没有 Claude Fable 5 难以实现，且 token 消耗较大。

技巧 baoyu-design Claude Design Figma 设计系统 Cursor

推荐理由：宝玉这个 Skill 更新很实用，本地就能跑 Claude Design，还能导入 Figma 做设计系统，用 Cursor 预览 PPT，导出 PPTX，赶紧试试。

原文

13:24

@TrenchersAI@TrenchersAI

推特用户@TrenchersAI分享其快速配置终端的经验，仅需观看3个教程即可完成设置，总耗时45分钟。过程中经历一次怒退（ragequit）后即可在喝杯咖啡的时间内让终端上线运行。

技巧 TrenchersAI 教程快速部署终端怒退

推荐理由：如果你不想花几小时慢慢折腾，跟着这3个教程45分钟就能搞定，一次怒退换来永久省心。

原文

13:17

@zarazhangrui@zarazhangrui

你无法通过直接编写技能描述来得到一个好技能。正确的做法是先手动执行任务20次，不断修复问题，优化流程。然后再把这些经验打包告诉AI，让它学会你的做法。

技巧提示词工程工作流 AI技能迭代

推荐理由：别傻写描述了，先手动做20遍，再教AI，效果完全不同。

原文

13:16

@zarazhangrui@zarazhangrui

该演讲详细展示了 Zara Zhang 的 vibe coding 流程，包括她如何从零获取产品创意、如何与 coding agents 有效对话以提升效率，以及如何通过设计准则避免生成“AI slop”（低质量 AI 输出）。演讲时长 45 分钟，目前已上传至 YouTube（链接在评论区）。

技巧 vibe coding coding agents 提示词工程编程助手 AI slop

推荐理由：教你用 vibe coding 和 coding agents 干活的全流程，从想点子到防 AI 垃圾设计，全是实操干货。

原文

13:11

@zarazhangrui@zarazhangrui

一位AI专家建议，跨职能团队应为彼此构建专属智能体/技能，例如设计团队可为营销团队创建一个基于品牌指南和设计模式的设计智能体。这样营销团队能自主产出符合品牌规范的素材，无需频繁打扰设计师。这种模式适用于任何紧密协作且相互抱怨资源有限的团队，帮助团队转向“循环”而非“职能”的组织方式。

技巧智能体跨职能团队设计系统自动化效率提升

推荐理由：设计师可以给营销团队建个智能体，把品牌规范喂进去，他们就能自己出图不用老来喊你。

原文

12:50

@zarazhangrui@zarazhangrui

作者指出，非技术人员使用编程助手的真正障碍不是聊天界面本身，而是空白输入框假设用户已经知道可以问什么。大多数人并不清楚编程助手能做什么。Town 这款产品通过主动建议工作流程和可代办事项的引导流程，解决了用户不知道该问什么的问题，降低了使用门槛。

技巧 Town 编程助手智能体工作流

推荐理由：Town 的引导流程很聪明，主动告诉你它能做什么，而不是让你对着空白框发呆，推荐非技术人员试试。

原文

12:49

@zarazhangrui@zarazhangrui

Zara Zhang 将在本周五举办虚拟讲座，分享其 vibe coding 流程。作为非技术人员，她在 GitHub 上获得了 3 万星。演讲内容包括如何获取产品创意、与 coding agents 协作、设计非 AI 垃圾内容，以及为何将代码视为叙事媒介。可使用优惠码 PREMIUMPASS 免费参加。

技巧 vibe coding GitHub coding agents 编程助手经验分享

推荐理由：Zara 会讲非技术人怎么用编码代理搞出 3 万星项目，干货满满，适合想入门 vibe coding 的朋友。

原文

12:47

@zarazhangrui@zarazhangrui

Paul David在1990年《The Dynamo and the Computer》中指出，工厂初用电时仅将蒸汽机换为电动机，未改变机器布局与工作流，生产率未提升。直到每台机器配备独立电机，工厂围绕工作流重新布局，才实现生产力飞跃。作者类比：企业若只在旧流程上“嫁接”AI而不同时重构工作本身，同样难获增益。

技巧 AI落地工作流重新设计技术采用 Paul David The Dynamo and the Computer

推荐理由：别以为把AI塞进现有流程就完事了。这篇文章用历史实例解释为什么很多公司用了AI却没效果——核心是要重新思考工作方式本身。

原文

12:33

elvis@omarsar0

用户omar sar开源了一个名为/learn的技能，可安装后与任意AI代理交互来学习任何主题。它能生成可视化的交互式HTML工件，如测验等知识检查工具。该技能面向DAIR Academy Pro会员，可在AI Builder中使用。代码托管在github.com/dair-ai/dair-a…，立即访问academy.dair.ai体验。

技巧 DAIR Academy AI Builder artifacts 智能体学习

推荐理由：想用AI代理系统化学习新知识？这个开源技能直接帮你生成互动课件和测验，跟玩一样学东西。

原文

12:08

shao__meng@shao__meng

Matt Pocock提出的AI驱动开发七阶段包括：Grill（将模糊想法转化为共享理解，产出问题陈述）、Research（缓存外部信息，产出research.md）、Prototype（验证设计，产出可丢弃原型）、PRD（描述终点，产出需求文档）、Issues（拆分为垂直切片，产出工单DAG）、Implement（Agent执行TDD，产出可运行代码）、Review（人工QA，产出新工单）。其中/grill-with-docs升级版支持代码库场景，引入CONTEXT.md术语表和ADR决策记录。

技巧 AI驱动开发工作流编程助手 grill-with-docs 七阶段

推荐理由：Matt Pocock总结了一套AI开发工作流，从想法到代码有七步，还给出了/grill-with-docs工具，适合想用AI系统化编程的人参考。

原文

10:30

shao__meng@shao__meng

73°

Faros AI、CodeRabbit、GitClear、GitHub 四份数据一致显示：AI 生成代码使代码产出约 4 倍，但交付价值仅 +10%，代码 churn 增长 861%、缺陷率从 9% 升至 54%。零 review 合并的 PR 增加 31%，review 时长上升 441%。Addy Osmani 提出以爆炸半径、代码寿命、理解者数量三个变量决定 review 策略。实证 146 个 PR 中，93.4% 的问题位置只被单一工具发现，四个工具从未同时标记同一行。人的角色应从逐行审查变为 triage 与 merge 决策，按风险分层、upfront triage、小 PR、先读 test diff 等六条可执行规则构成新体系。

技巧 Agentic Code Review Addy Osmani 代码审查智能体

推荐理由：Addy Osmani 用四份硬数据和实战框架告诉你，AI 生成代码后怎么审才靠谱——不是跑一个工具，而是跑几个不同性格的，人只做最终裁决。

原文

10:11

shao__meng@shao__meng

Lovable的Felix Haas提出AI时代绩效公式从技能驱动转向心智驱动，核心特质包括责任、好奇、谦逊、在意、速度。他归纳了7条原则，例如按态度招人而非技能、先发布再改进、杀ego保进度等。这些原则强调ownership、学习速率和迭代速度，认为高动机的人加AI可超过小团队。文章还给出客观补充，如对人机协作高风险领域的限制条件。

技巧 Lovable Felix Haas AI团队心智模式七条原则

推荐理由：Felix Haas从Lovable实战中总结7条原则，核心是心态比技能更重要，特别适合用AI做事但总感觉团队卡壳的人翻看。

原文

09:58

Amjad Masad@amasad

Replit CEO Amasad 发推称赞其领域特定 agent。其中增长 agent 能自动发现 SEO 问题，安全 agent 可检测代码中的潜在漏洞。用户只需全选代码，Agent 即可自动完成修复。这种工作流大幅提升了开发效率。

技巧 Replit growth agent security agent 智能体编程助手

推荐理由：Replit 的 CEO 亲自安利，增长和安全两个 Agent 能自动找问题再帮你一键修，不用手动折腾。

原文

09:28

GitHub Blog@Natalie Guevara

GitHub 官方博客发布了一篇面向初学者的教程，介绍如何使用 GitHub Copilot CLI 的斜杠命令（如 `/explain`、`/fix`、`/tests`）在终端中控制 AI 代理。教程演示了如何通过自然语言让 Copilot 解释代码、自动修复错误、生成测试用例等。文章列出了 6 个核心斜杠命令及其用法，帮助开发者无需离开终端即可完成常见开发任务。

技巧 GitHub Copilot CLI 斜杠命令终端教程编程助手

推荐理由：GitHub 官方出了个新手教程，教你用 Copilot CLI 的斜杠命令直接在终端修 bug、写测试，省得来回切窗口。

原文

09:07

elvis@omarsar0

一条推特指出，Verifiers（验证器）是 Agent 系统的关键组件。如果没有好的 Verifiers，/goal 和 /loop 等指令会频繁出错。当 LLM 遇到分布外（out of distribution）场景时，Agent 难以正确完成验证工作。建议开发者自行调优 Verifiers，并将其与现有 Agent 进行对接。

技巧验证器智能体工作流

推荐理由：跟你讲个 Agent 开发中的坑：没好的验证器，跑起来全是 bug。自己调一个连上去，稳很多。

原文

09:05

Notion@NotionHQ

Notion 产品布道师 Ian McClanlan 使用 Notion 的 Custom Agents 和 Notion Workers 构建了一个自动更新的个人仪表盘。他从 WHOOP 和 Strava 同步健康数据，通过 AI 自动填入健康数据库；从 Plaid 同步交易记录到 Notion 数据库，用 AI 自动分类并展示支出对比；还将所有想法通过 Agent 自动归档到对应数据库。这一系统已运行 6 年，他称其为“最有价值的人生信息集合”。

技巧 Notion 智能体自动化工作流 WHOOP Strava

推荐理由：Notion 的产品布道师 Ian 分享了三个具体玩法：用 Custom Agents 把 WHOOP、Strava、Plaid 数据自动更新到仪表盘，还帮你自动整理想法——比手动折腾省事多了。

原文

03:15

AlphaSignal@AlphaSignalAI

精选

Anthropic发布的Claude Fable 5官方提示词指南指出，过去为旧模型编写的提示词会降低Fable 5的输出质量。需要删除的要素包括：分步指令列表、"展示推理过程"（现在会触发拒绝）、剩余token倒计时、枚举边界案例列表。新增的要素包括：任务投入程度、验证子智能体、边界块、记忆文件、请求背后的原因。指南强调一个目标、上下文、边界以及验证自身工作的方式。

技巧 Claude Fable 5 Anthropic 提示词工程智能体

推荐理由：Anthropic官方出了Claude Fable 5的提示词指南，之前那套写法得改了。删掉分步指令和“展示推理”之类的，加上目标、边界和验证子智能体，效果更好。

原文

02:31

eric zakariasson@ericzakariasson

Eric Zakariasson 认为 MCP 和 CLI 服务于不同目的。CLI 适合模型已知的命令如 git、gh、npm、docker、file ops，基于 man pages 训练，几乎不消耗上下文。MCP 适合集成 Slack、Notion、Linear、Twitter 等服务，提供统一协议和 OAuth 认证。在 Cursor 中 MCP 体验更佳，有丰富图标和可追踪操作。作者建议个人用 CLI，团队用 MCP。

技巧 MCP CLI Cursor 编程助手智能体

推荐理由：想了解 MCP 和 CLI 到底怎么选？Eric 分享了他每天用两者的实战经验，帮你理清场景。

原文

02:13

AWS Machine Learning Blog@Po-Shin Chen

精选

AWS博客介绍了Strands Evals工具，用于检测AI Agent执行中的失败并定位根因。调用detector函数后，输出包含分类失败类型与置信度分数、从根因到下游症状的因果链，以及修复建议（指定修改系统提示还是工具定义）。该工具可集成到评估流程中，实现每个测试运行的自动诊断。

技巧 Strands Evals AWS 智能体故障诊断评测

推荐理由：AWS教你用Strands Evals自动揪出AI Agent的失败根因，还告诉你该改提示词还是工具定义，比盲猜管用多了。

原文

02:05

elvis@omarsar0

Elvis Saravia在推文中强调，AI工程师应掌握自己的智能决策。该推文获得2148次浏览和11次点赞。Fireworks使个人开发者更容易拥有和控制自己的AI系统。

技巧 Fireworks Lin Qiao Elvis Saravia AI所有权

推荐理由：Elvis Saravia用数据说话，告诉你别把AI决策权外包。Fireworks让你也能轻松掌控模型。

原文

01:05

向阳乔木@vista8

Suno音乐生成工具最近上新了几首风格特别的歌曲，包括《Ghostty》《We Flow》《Neon Son》等。这些歌曲通过组合不同风格元素，创造出新的听觉体验。作品展示了Suno在音乐风格融合和创意生成方面的能力。

技巧 Suno AI音乐音乐生成风格融合

推荐理由：Suno又整新活了，这几首风格混搭的歌听着挺新鲜，想试试AI音乐创作可以听听看。

原文

01:01

elvis@omarsar0

一名用户将AI员工添加到Slack工作区，并让它在Slack内运行本周DAIR Academy任务。AI自动完成了全部工作并准备发布，整个过程无需人工干预。该AI被描述为“至今最强大的AI”，能够理解真实工作任务并自主执行。

技巧 Slack DAIR Academy 智能体工作流

推荐理由：有人把AI员工拉进Slack，让它干DAIR Academy的活，结果它自己干完了。想知道怎么做到的？看这条。

原文

01:01

Geek@geekbb

该开源书稿名为XQuant，发布于GitHub，面向零基础读者。它教用户用自然语言描述量化交易策略，并让AI自动生成对应代码。目标是帮助读者从零搭建一个完整、可迭代的量化交易系统。书稿全程不需要读者编写代码，只需理解策略思路。

技巧 XQuant 量化交易开源书稿自然语言编程

推荐理由：想学量化但不会写代码？这个开源书稿让你用自然语言描述策略，AI帮你写代码，零基础也能上手。

原文