全部 AI 动态 · AI 热点

6月30日

10:43

Ate-a-Pi@svpino

精选

建议用“value per token dollar”指标评估智能体：将智能体产生的价值除以消耗的token成本。比值低于1表示成本大于回报；等于1表示收支平衡；高于1则可用该智能体构建业务。不同智能体即使使用相同模型和token数，创造的价值也可能完全不同。@matrix_build 团队首次采用这一指标。

推荐理由：别再纠结智能体能不能干了，试试用“值多少token”来算账，看投入产出比高不高。

原文

6月29日

23:12

berryxia@berryxia

Margot Van Laar在Code with Claude大会上分享提示词工程实战，核心观点是生产提示词调试维护比从零写更重要。她展示客服机器人场景：团队发现旧模型遗留的'禁止列表'指令导致新模型过度拟合，以及'请仔细计算'无效需提供计算器工具。在零售排班Agent场景中，她将复杂提示词拆成三个简单提示词（生成、评估、修复）组成循环，比单一大提示词更稳定。她强调可用Opus等更强推理模型加自适应思考来简化提示词，并务必建立量化评估基准验证改动效果。

技巧 Anthropic Claude 提示词工程评估提示词维护

推荐理由：Anthropic工程师手把手教你维护生产提示词，从客服机器人到排班Agent，拆成小提示词更靠谱，还有评估妙招。

原文

23:10

berryxia@berryxia

精选

Anthropic工程师Margot Van Laar在Code with Claude分享提示词工程最佳实践，强调通过评估（Eval）而非直接修改提示词来优化。她用客服机器人和零售排班两个案例演示：使用XML标签结构化提示词、移除旧模型遗留的禁止列表（如Claude 3 Opus）、用工具替代指令处理计算任务。拆解复杂任务为生成-评估-修复循环，并建议用更强推理模型（如Opus）加自适应思考替代小模型复杂提示词。

技巧提示词工程 Claude 评估 Claude Opus 工作流

推荐理由：Anthropic工程师手把手教你怎么调客服提示词和搭Agent，用Opus加循环拆解比堆复杂指令更管用，核心就一句话：先搞评估

原文

20:05

@zarazhangrui@zarazhangrui

一位创业者分享经验：每花1小时构建产品，应投入2小时用于解释、演示、销售和教学。这一比例强调产品需要持续向外界传达并基于用户反馈迭代。指出将时间优先花在传播和沟通上，是产品成功的关键。该观点源自与现实的接触和不断打磨。

技巧产品开发推广技巧创业经验时间管理

推荐理由：别只顾码代码，花两倍时间去推销和教学，这才是让产品落地的硬道理。

原文

18:57

vLLM@vllm_project

精选

NVIDIA 与 vLLM 合作发布 step-by-step 指南，教你用四台 DGX Spark 盒子组建私有集群，自托管 550B 参数的 Nemotron-3-Ultra 模型。指南基于 vLLM 官方容器，可提供兼容 OpenAI 的端点。无需数据中心，适合构建私有 agent 工作流。

技巧 Nemotron-3-Ultra NVIDIA DGX Spark vLLM 自托管

推荐理由：想不依赖数据中心自己跑 550B 模型？NVIDIA 出了详细教程，四台 DGX Spark 就能拼出 OpenAI 兼容的端点。

原文

14:55

宝玉@dotey

有用户发现，在 Codex 应用中将模型选为 GPT-5.5 并设置推理为 xhigh 后，运行 Juice 测试 Prompt 若返回 128 则实际使用的是 GPT 5.6 Sol，否则返回 768 就是 GPT 5.5。该 Prompt 要求模型输出 Juice 数除以2乘10再除以5的结果。目前测试仍返回 768，说明多数用户尚未灰度到 GPT 5.6 Sol。

技巧 GPT 5.6 Sol GPT 5.5 提示词工程推理模型

推荐理由：想提前知道自己的 GPT 5.5 是不是偷偷升级了？用这个 Juice 测试 Prompt 一试便知，很简单。

原文

13:58

Ate-a-Pi@svpino

这个开源项目允许你录制浏览器操作，系统会自动清理录制内容，移除重试、死路和页面特定细节。然后它只保留任务逻辑而非具体点击，将其转化为可复用的技能。最后这些技能被组织成技能图谱，智能体可检索用于相关新任务。整个过程完全开源。

技巧开源浏览器自动化智能体技能图谱工作流

推荐理由：有个开源项目能录制你在浏览器里做的事，自动变成可复用的技能，还能让智能体直接调用，省去重复劳动。

原文

13:52

EleutherAI@AiEleuther

EleutherAI在ICML 2024会议上发布了参会指南。指南包含了他们在会议期间的展位和演讲安排。参会者可通过链接获取详细位置信息。

技巧 EleutherAI ICML 开源模型活动指南

推荐理由：EleutherAI发了他们在ICML的定位指南，想去现场找他们的可以看看，免得错过。

原文

13:51

Together AI@togethercompute

Together AI 工程师将在 AI Engineer World’s Fair 举办 hands-on workshop，讨论 Agentic Coding 如何改变推理引擎需求。workshop 将讲解推理引擎的工作原理及服务生产级 agentic workloads 的要点。活动时间为6月29日上午9-11点，地点在 Room 2020。

技巧 Together AI AI Engineer World’s Fair agentic coding 推理引擎智能体

推荐理由：想了解 agentic coding 对推理引擎的新要求？Together AI 的这个实操 workshop 直接带你上手，时间是6月29日上午。

原文

13:51

Jasper AI@heyjasperai

Jasper将Hugging Face基础设施用于其MONET系统的数据创建和存储。该方法针对随时间更新的大型训练数据集进行了优化。Jasper团队通过HF实现了更高效的数据管道管理。这一案例展示了HF在训练数据工作流中的实际应用。

技巧 Jasper Hugging Face MONET 数据管道模型训练

推荐理由：看看Jasper怎么用Hugging Face当MONET的数据后台，对做大模型训练数据管道的团队很有启发。

原文

13:50

François Chollet@fchollet

François Chollet（Keras创建者）在推文中指出编程不是关于代码，而是通过抽象层管理复杂性的艺术。他认为编程的核心在于构建函数、类等抽象层来降低认知负荷。AI在这一框架下仅是一种新的抽象工具，不应被过度神化。这一观点提醒程序员更关注架构设计而非语法细节。

技巧 François Chollet Keras 抽象层编程思想

推荐理由：Chollet一句话点醒你：编程不是写代码，是搭抽象层。别把AI太当回事。

原文

13:50

François Chollet@fchollet

精选

François Chollet 指出，智能体编程（Agentic coding）迫使开发者设计清晰的 API 接口并编写完整的文档字符串。AI 代理无法阅读团队内部的隐式心理模型，只能依赖显式的 API 合约和 docstring。这要求接口规范必须精确、无歧义，文档覆盖所有输入/输出场景。对工程团队而言，这意味着需要投入更多时间在接口形式化设计上。

技巧 Agentic coding API设计文档字符串智能体编程助手

推荐理由：François Chollet 说得很实在：想用AI代笔写代码，接口就得干净、文档得详细，别指望它懂你没写出来的默契。

原文

13:50

阿里云 Alibaba Cloud@alibaba_cloud

阿里巴巴云Qwen团队将于2026年6月30日举办Qwen Live第一集直播，主题为Agent-First。Qwen云负责人Linlin Kong与产品经理Pan Gu、Xijue将分享从零构建智能体云平台的经验。直播将重新定义面向非人类用户的开发者体验，并探讨大规模人机协作的新范式。

技巧 Qwen 阿里云智能体云平台开发者体验

推荐理由：想搞智能体云平台？Qwen这期直播讲从零搭建、非人类用户开发体验，做agent的开发者别错过。

原文

13:50

阶跃星辰 Stepfun@Stepfun_AI

Step Plan 专为 Agent 工作流设计，用户只需连接一次即可持续构建和实验。它在 Claude Code 中集成了 Step 3.7 Flash 模型，大幅降低每次 API 调用的管理成本。开发者 @codedailyML 用 Step Plan 制作了 Tarot 生成器 demo，验证了工作流的便捷性。

技巧 Step Plan StepFun Claude Code Step 3.7 Flash 智能体

推荐理由：StepFun 的 Step Plan 让你在 Claude Code 里连一次就能持续调模型，不用反复写 API，看那个 Tarot 生成器 demo 就知道了。

原文

13:49

Ethan Mollick@emollick

Ethan Mollick 指出，所有模型路由器（model routers）在处理非数学/编程任务时，普遍低估任务难度并分配过少的智能资源。他建议，对于不可验证的任务（如创新、营销、定性分析），使用更智能的模型往往能带来更大收益。这一观点源于他对多种路由器实际表现的经验观察。

技巧 model routers 任务分配推理模型非数学任务

推荐理由：Ethan Mollick 分享了一个容易被忽视的问题：模型路由器的任务分配不够智能，尤其对创意和分析类任务。如果你也发现一些任务结果不好，可能不是模型不行，是路由器给它派了太弱的模型。

原文

13:48

岚叔@lufzzliz

文章指出长期依赖AI生成代码会削弱工程师的沉浸式创造能力和职业满足感。作者用历史小说家批量生产而非亲自研究写书的类比，说明类似问题。他自述使用Claude和Codex几个月后，写代码变得懒散迟钝，遇到复杂问题第一反应是让AI找bug或写修复。文章警告AI批量产生的代码如同“数字塑料垃圾”，便宜但长期污染软件生态。

技巧 Claude Codex 编程助手软件工程

推荐理由：这篇很真实，说透了AI用得越多，自己越容易变懒，得先自己思考再让AI动手。

原文

13:48

Ethan Mollick@emollick

技巧 GLM-5.2 Opus 4.8 提示词工程推理模型

推荐理由：想看看AI怎么思考？让GLM-5.2或Opus 4.8帮你选诗，能看到它的推理过程，挺有意思的。

原文

13:48

岚叔@lufzzliz

在世界杯小组赛预测中，GLM-5.2在比分榜综合最强，GPT-5.5在胜负榜综合最强且命中率达70%。淘汰赛阶段取消24小时限制，可一次性预测16场比赛。作者分享了提示词示例："继续预测，可以提交淘汰赛16场的比赛，你需要仔细分析给出你的答案、并提交"。同时附带了opus-4.8和deepseekv4-pro的预测结果。

技巧 GLM-5.2 GPT-5.5 提示词工程智能体世界杯

推荐理由：作者用GLM-5.2和GPT-5.5预测世界杯，GPT-5.5命中率70%，还给了淘汰赛提示词，试试用自己的agent玩。

原文

13:48

岚叔@lufzzliz

精选

LufzzLiz基于Andrej Karpathy的LLM Wiki gist衍生出两套模板：个人知识库schema（五层目录）和代码仓库wiki schema（三层目录+双层导览）。附带实践案例Hermes-wiki和wiki-web，后者支持关系图和脑图。模板可直接用于构建结构化个人知识库或项目文档。

技巧 Karpathy 知识库模板笔记技巧工作流

推荐理由：如果你嫌搭建知识库太麻烦，试试这套基于Karpathy思路的模板，五层目录帮你把笔记理得清清楚楚，还有实际案例参考。

原文

12:48

Geek@geekbb

GitHub上Pluviobyte/video-skill仓库将AI视频制作流程拆解为多个可安装的skill模块，涵盖视频创作、复刻、动效、片头包装、质检等环节。每个skill独立可用，降低视频制作门槛。项目长期维护，持续更新。

技巧 video-skill Pluviobyte 视频制作工作流开源项目

推荐理由：这个仓库把视频创作、动效、包装等技能打包成模块，装一个就能用，做视频更轻松。

原文

01:45

AI产品黄叔@PMbackttfuture

用户使用Hermes生成手机壁纸，并将微信Agent入口交回Hermes，同时接入flomo MCP实现记忆同步。每次手动触发“保存到flomo”时，内容会同步到flomo，并立即触发即时增强功能，从flomo/Hermes记忆中检索相关知识点推送笔记。这为知识工作者提供了利用AI助手整理灵感和长期记忆的工作流。

技巧 Hermes flomo MCP/工具工作流智能体

推荐理由：教你给AI设个微信入口，用Hermes做壁纸，还能自动同步到flomo，随时调取记忆，挺实用的。

原文

01:42

OpenRouter@OpenRouterAI

OpenRouter 持续对大多数开源权重模型运行 GPQA 与 TAU-Bench 两个基准，并将结果公开。这些成绩被用于其 AutoExacto 元基准，后者是路由工具调用的默认依据。当前 Parasail 和 Zai 在排行榜上位列第一。

技巧 OpenRouter GPQA TAU-Bench AutoExacto 基准测试

推荐理由：选模型路由工具前，看看 OpenRouter 定期跑的 GPQA 和 TAU-Bench 排名，现在 Parasail 和 Zai 排第一，挺有参考价值。

原文

00:01

Clement Delangue@ClementDelangue

Brian Armstrong在推文中分享了Coinbase控制AI成本的实践。他提到，通过将默认模型切换到开源模型如GLM 5.2和Kimi 2.7，91%的员工从未触及使用上限。通过改进缓存，LibreChat的缓存命中率从5%提升到60%。这些措施使AI支出减少近一半，同时token用量仍在增长。他还强调路由优化和精简上下文的重要性。

技巧 Hugging Face GLM 5.2 Kimi 2.7 成本优化缓存

推荐理由：Coinbase创始人Brian Armstrong分享了一套实际操作方案：用更便宜的默认模型、优化缓存和路由，能把AI成本砍半。开源模型GLM 5.2和Kimi 2.7是主角，缓存命中率从5%跳到60%。

原文

6月28日

16:18

Geek@geekbb

精选

网友分享的 Gentle-AI 配置串联 11 个不同职能的智能体，使用低成本 Flash 模型处理大部分上下文，仅在设计（Qwen）和编码（Kimi Code）等关键环节调用高性能模型。每日成本控制在 4~7 美元，并通过多智能体对齐审查显著降低幻觉率。该 per-phase model routing 策略可适配 15 种 AI 编程工具。

技巧 Gentle-AI Qwen Kimi Code 智能体模型路由

推荐理由：挺实用的配置：11个智能体分工，Flash模型省成本，Qwen和Kimi Code干重活，每天才4-7美元，还降幻觉。

原文

11:19

AI产品黄叔@PMbackttfuture

精选

黄叔分享了flomo Agent的10点使用心得，核心是降低记录前0.5秒的摩擦。他通过微信入口和Hermes Agent，并接入flomo MCP，将Hermes长期记忆同步到flomo。同时手动触发“保存到flomo”的内容，即时使用增强功能从flomo/Hermes记忆里检索相关笔记以帮助思考。他认为DeepSeek V4和王登科推动了flomo的发展，且Agent功能少反而更可信。最后提出flomo Agent+Codex/Hermes可形成“记忆-行动”双系统。

技巧 flomo Agent 知识管理 MCP/工具 Hermes

推荐理由：黄叔总结了flomo Agent的10条理解，比如用微信入口降低摩擦、打通记忆和行动，还提到了DeepSeek V4的作用。想用好flomo的可以看看。

原文

11:19

AI产品黄叔@PMbackttfuture

黄叔总结了自己重度使用flomo Agent的10点理解，核心是降低记录前0.5秒的摩擦。他认为flomo Agent对手不是Notion或Obsidian，而是微信文件传输助手。该工具通过接入flomo MCP与Hermes，将对话长期记忆同步保存到flomo，并即时触发增强功能，从记忆中提取相关笔记辅助思考。黄叔还指出，DeepSeek V4和王登科推动了flomo发展，Agent功能少反而更可信，付费理由是“一个可信的记忆容器”。

技巧 flomo 智能体 Hermes MCP 知识管理

推荐理由：黄叔分享了10条实际使用flomo Agent的心得，比如对手是微信文件传输助手、AI洞察是卡片结构的迟到红利，挺有启发。

原文

11:10

Yangyi@Yangyixxxx

宝玉分享 Codex/Claude Code 的实用工作流：fork 功能可从某节点创建分支，保留历史让上下文更纯粹。/btw 或 /side 命令可在当前会话中提问与主任务无关的问题，不污染上下文。上下文压缩配合 Prompt Caching 降低持续对话成本，一个 Session 内连续完成任务更可行。plan 模式中可用 /btw 请求详细解释选项含义。

技巧 Codex Claude Code fork /btw 提示词工程

推荐理由：宝玉分享了两个超实用的技巧：fork分支对话和/btw侧边提问，让Codex和Claude Code用得更顺，强烈建议试试。

原文

07:19

Suhail@Suhail

Suhail分享了在过去一周中，使用某个工具或方法快速验证新建立的训练后基础设施的经验。该方法不仅超越了简单的Hello World强化学习运行，还能帮助发现并修复rollout过程中的瓶颈。这是一个实用的快速配方，确保各组件正常运转。

技巧训练基础设施强化学习 rollout 验证技巧

推荐理由：Suhail分享了一个实用方法，能快速验证RL训练基础设施，避开常见瓶颈。

原文

04:31

Harrison Chase@hwchase17

社区成员推出3小时深度课程，系统讲解Deep Agents构建。课程覆盖任务规划模块、文件系统用于上下文管理、子代理生成机制以及长期记忆实现。适合想深入掌握Agent开发流程的学习者。

技巧 Deep Agents 智能体任务规划上下文管理子代理

推荐理由：想学Deep Agents实战吗？3小时从任务规划讲到长期记忆，社区大神亲自带，比硬啃文档快多了。

原文

04:19

elvis@omarsar0

该推文指出，循环工程（loop engineering）本质上是提示工程（prompt engineering）与良好系统设计的结合。这条观点来自社交媒体，获得了8条评论、1次转发和21个点赞。它强调在构建AI应用时，需要把提示工程与系统架构整合，而非单独优化提示词。

技巧 loop engineering 提示词工程系统设计

推荐理由：有人一句话点醒我：循环工程其实就是提示工程搭上系统设计，做AI应用的朋友可以想想你的架构对不对。

原文

03:19

Suhail@Suhail

用户Suhail分享了两个提示词版本："read-quick-dont-validate"用于快速阅读论文，要求AI一步步拆解并一次性输出章节式解释；"validate-my-understanding-and-teach-me"则需提供5-10个参考链接，要求AI逐步教学并验证理解。第二个版本可耗时数周但学习更深入。两条提示词分别适用于不同学习场景。

技巧提示词工程论文阅读学习技巧 ChatGPT 教学方法

推荐理由：想用AI读论文又怕浅尝辄止？试试这两个具体写法，一个快速扫读，一个深度教学，亲测有效。

原文

03:19

Suhail@Suhail

该指令用于自动启动并监控AI模型训练运行。它在4个节点上运行完整训练，持续记录实验文档、超参数、配置以及定期评估结果。系统还会分析训练稳定性和性能，并在训练崩溃时从最新可靠检查点恢复。整个流程大幅减少了人工监视和干预的需求。

技巧训练自动化多节点训练实验记录检查点恢复

推荐理由：这个指令能自动帮你记实验日志、处理崩溃恢复，省去一直盯着的麻烦。

原文

03:19

Suhail@Suhail

博主分享了一种异步学习工作流：将博客、推文、arxiv论文等全部用特定提示词让AI生成教学版，不立刻读而是排队等待。等到有空时（乘车、睡前等）再去阅读AI生成的易读版本，并追问问题。这样比直接存链接好，因为AI能适应读者的经验水平并重写内容。作者称这种学习速度远超以往。

技巧学习工作流异步学习 AI教学提示词技巧阅读理解

推荐理由：把想读的文章丢给AI，让它先教你一遍，等你回头读的时候效率翻倍，还能追问。

原文

02:10

berryxia@berryxia

一位老师通过生动的例子讲解大语言模型的原理，涵盖Transformer架构和注意力机制。适合AI初学者快速理解核心概念。

技巧大语言模型教程入门

推荐理由：这个老师的讲解很接地气，没基础也能听懂，推荐给想入门LLM的朋友。

原文

01:49

Jerry Liu@jerryjliu0

Jerry Liu（LlamaIndex创始人）在推文中指出，手动构建工作流（代码、拖拽或提示）的需求正在减少，更优方式是指定目标让模型智能规划步骤。对于重复性任务，可收集带真实标签的数据集进行爬山优化，以平衡成本与准确率。他认为行业正从提示工程迈向目标和评估工程。拥有642次浏览、5个点赞。

技巧 Jerry Liu LlamaIndex 工作流智能体提示词工程

推荐理由：Jerry Liu说的这个趋势很实在：别再手动搭工作流了，直接给目标让模型自己想办法。重复任务还能录数据集优化，省心省钱。

原文

01:25

宝玉@dotey

精选

Codex 和 Claude Code 的上下文压缩功能结合 Prompt Caching，使得在单个 Session 内持续对话的成本压力显著降低。用户可以通过 fork 功能从对话的某个位置创建分支，只保留之前的历史记录，使上下文更纯粹。/btw 或 /side 命令允许在不影响当前任务上下文的情况下提问，例如在 plan 模式下用 /btw 详细解释选项含义。VB 提到自 GPT 5.3 Codex 以来，他不再担心上下文问题，且 Codex 的支线线程功能非常出色。

技巧 Codex Claude Code Prompt Caching 上下文压缩编程助手

推荐理由：如果你用 Codex 或 Claude Code 做长任务，这个技巧能省下不少 token 费用，fork 和 /btw 命令特别实用。

原文

01:19

AI产品黄叔@PMbackttfuture

一位博主分享经历：一名大三学生在完成初稿后，收稿费仍继续优化方案。学生清晰解释如何用多个Agent各自发挥特长协同完成任务。博主称赞其思路，并表示学生希望暑假来实习。

技巧 Agent 协作案例分享实习生

推荐理由：看一个大三学生怎么用多个Agent分工协作，还主动给你优化方案，这思路值得学。

原文

00:56

berryxia@berryxia

76°

Anthropic的Lamis在2026年AI DevCon上分享了上下文工程实践，从Claude MD文件起步，发现其效果出奇地好（unreasonably effective）。第二步引入记忆工具，让Agent自主读写，效果优于人类。第三步Skills采用渐进式披露，类似书架取书。第四步文件系统用bash和grep搜索，不需要向量数据库。生产环境面临多Agent并发写入等问题，Anthropic提出版本控制、并发控制等四个原则。最后介绍“做梦”机制：异步批量分析会话记录，识别模式并调整上下文，已在生产中运行，降低token成本。

技巧 Anthropic Claude 上下文工程智能体记忆管理

推荐理由：Anthropic工程师手把手教你上下文管理套路，从最基础的文件到高级的“做梦”架构，半小时就能上手实操。

原文

00:56

berryxia@berryxia

精选

Anthropic应用AI负责人Lamis在2026年AI DevCon上分享了Agent记忆系统的四层架构。起点是CLAUDE.md文件，效果超过复杂Prompt工程。第二层是记忆工具，让Agent自主读写更新，判断力比人强。第三层Skills实现渐进式披露，类似从书架抽词典。第四层把记忆建模为文件系统，用bash/grep，无需向量数据库。还引入"做梦"（带外异步处理）分析跨会话模式，已在生产中提升任务效率并降低成本。

技巧 Claude Code 记忆管理智能体 Anthropic 提示词工程

推荐理由：Anthropic官方分享了他们怎么让Agent记住东西：从Markdown文件到做梦机制，很实用的四层方法论，看完可以少走弯路。

原文

00:01

MIT CSAIL@MIT_CSAIL

一份由Anatoli Kopadze整理的18步Claude使用教程发布。教程涵盖从基础提示到高级工作流的技巧，共18个步骤。每个步骤针对Claude交互中的具体场景提供指导。用户可系统提升与Claude的协作效率。

技巧 Claude Anthropic 提示词工程教程

推荐理由：想用好Claude？这有18个实用步骤，从提示词到工作流全涵盖，练完你就是高手。

原文

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

6月12日

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？