23:12berryxia@berryxiaMargot Van Laar在Code with Claude大会上分享提示词工程实战,核心观点是生产提示词调试维护比从零写更重要。她展示客服机器人场景:团队发现旧模型遗留的'禁止列表'指令导致新模型过度拟合,以及'请仔细计算'无效需提供计算器工具。在零售排班Agent场景中,她将复杂提示词拆成三个简单提示词(生成、评估、修复)组成循环,比单一大提示词更稳定。她强调可用Opus等更强推理模型加自适应思考来简化提示词,并务必建立量化评估基准验证改动效果。技巧AnthropicClaude提示词工程评估提示词维护9 个信源在谈推荐理由:Anthropic工程师手把手教你维护生产提示词,从客服机器人到排班Agent,拆成小提示词更靠谱,还有评估妙招。原文
23:10berryxia@berryxia精选Anthropic工程师Margot Van Laar在Code with Claude分享提示词工程最佳实践,强调通过评估(Eval)而非直接修改提示词来优化。她用客服机器人和零售排班两个案例演示:使用XML标签结构化提示词、移除旧模型遗留的禁止列表(如Claude 3 Opus)、用工具替代指令处理计算任务。拆解复杂任务为生成-评估-修复循环,并建议用更强推理模型(如Opus)加自适应思考替代小模型复杂提示词。技巧提示词工程Claude评估Claude Opus工作流9 个信源在谈推荐理由:Anthropic工程师手把手教你怎么调客服提示词和搭Agent,用Opus加循环拆解比堆复杂指令更管用,核心就一句话:先搞评估原文
20:05@zarazhangrui@zarazhangrui一位创业者分享经验:每花1小时构建产品,应投入2小时用于解释、演示、销售和教学。这一比例强调产品需要持续向外界传达并基于用户反馈迭代。指出将时间优先花在传播和沟通上,是产品成功的关键。该观点源自与现实的接触和不断打磨。技巧产品开发推广技巧创业经验时间管理推荐理由:别只顾码代码,花两倍时间去推销和教学,这才是让产品落地的硬道理。原文
18:57vLLM@vllm_project精选NVIDIA 与 vLLM 合作发布 step-by-step 指南,教你用四台 DGX Spark 盒子组建私有集群,自托管 550B 参数的 Nemotron-3-Ultra 模型。指南基于 vLLM 官方容器,可提供兼容 OpenAI 的端点。无需数据中心,适合构建私有 agent 工作流。技巧Nemotron-3-UltraNVIDIADGX SparkvLLM自托管4 个信源在谈推荐理由:想不依赖数据中心自己跑 550B 模型?NVIDIA 出了详细教程,四台 DGX Spark 就能拼出 OpenAI 兼容的端点。原文
14:55宝玉@dotey有用户发现,在 Codex 应用中将模型选为 GPT-5.5 并设置推理为 xhigh 后,运行 Juice 测试 Prompt 若返回 128 则实际使用的是 GPT 5.6 Sol,否则返回 768 就是 GPT 5.5。该 Prompt 要求模型输出 Juice 数除以2乘10再除以5的结果。目前测试仍返回 768,说明多数用户尚未灰度到 GPT 5.6 Sol。技巧GPT 5.6 SolGPT 5.5提示词工程推理模型推荐理由:想提前知道自己的 GPT 5.5 是不是偷偷升级了?用这个 Juice 测试 Prompt 一试便知,很简单。原文
13:58Ate-a-Pi@svpino这个开源项目允许你录制浏览器操作,系统会自动清理录制内容,移除重试、死路和页面特定细节。然后它只保留任务逻辑而非具体点击,将其转化为可复用的技能。最后这些技能被组织成技能图谱,智能体可检索用于相关新任务。整个过程完全开源。技巧开源浏览器自动化智能体技能图谱工作流推荐理由:有个开源项目能录制你在浏览器里做的事,自动变成可复用的技能,还能让智能体直接调用,省去重复劳动。原文
13:52EleutherAI@AiEleutherEleutherAI在ICML 2024会议上发布了参会指南。指南包含了他们在会议期间的展位和演讲安排。参会者可通过链接获取详细位置信息。技巧EleutherAIICML开源模型活动指南推荐理由:EleutherAI发了他们在ICML的定位指南,想去现场找他们的可以看看,免得错过。原文
13:51Together AI@togethercomputeTogether AI 工程师将在 AI Engineer World’s Fair 举办 hands-on workshop,讨论 Agentic Coding 如何改变推理引擎需求。workshop 将讲解推理引擎的工作原理及服务生产级 agentic workloads 的要点。活动时间为6月29日上午9-11点,地点在 Room 2020。技巧Together AIAI Engineer World’s Fairagentic coding推理引擎智能体推荐理由:想了解 agentic coding 对推理引擎的新要求?Together AI 的这个实操 workshop 直接带你上手,时间是6月29日上午。原文
13:51Jasper AI@heyjasperaiJasper将Hugging Face基础设施用于其MONET系统的数据创建和存储。该方法针对随时间更新的大型训练数据集进行了优化。Jasper团队通过HF实现了更高效的数据管道管理。这一案例展示了HF在训练数据工作流中的实际应用。技巧JasperHugging FaceMONET数据管道模型训练推荐理由:看看Jasper怎么用Hugging Face当MONET的数据后台,对做大模型训练数据管道的团队很有启发。原文
13:50François Chollet@fcholletFrançois Chollet(Keras创建者)在推文中指出编程不是关于代码,而是通过抽象层管理复杂性的艺术。他认为编程的核心在于构建函数、类等抽象层来降低认知负荷。AI在这一框架下仅是一种新的抽象工具,不应被过度神化。这一观点提醒程序员更关注架构设计而非语法细节。技巧François CholletKeras抽象层编程思想推荐理由:Chollet一句话点醒你:编程不是写代码,是搭抽象层。别把AI太当回事。原文
13:50François Chollet@fchollet精选François Chollet 指出,智能体编程(Agentic coding)迫使开发者设计清晰的 API 接口并编写完整的文档字符串。AI 代理无法阅读团队内部的隐式心理模型,只能依赖显式的 API 合约和 docstring。这要求接口规范必须精确、无歧义,文档覆盖所有输入/输出场景。对工程团队而言,这意味着需要投入更多时间在接口形式化设计上。技巧Agentic codingAPI设计文档字符串智能体编程助手推荐理由:François Chollet 说得很实在:想用AI代笔写代码,接口就得干净、文档得详细,别指望它懂你没写出来的默契。原文
13:50阿里云 Alibaba Cloud@alibaba_cloud阿里巴巴云Qwen团队将于2026年6月30日举办Qwen Live第一集直播,主题为Agent-First。Qwen云负责人Linlin Kong与产品经理Pan Gu、Xijue将分享从零构建智能体云平台的经验。直播将重新定义面向非人类用户的开发者体验,并探讨大规模人机协作的新范式。技巧Qwen阿里云智能体云平台开发者体验推荐理由:想搞智能体云平台?Qwen这期直播讲从零搭建、非人类用户开发体验,做agent的开发者别错过。原文
13:50阶跃星辰 Stepfun@Stepfun_AIStep Plan 专为 Agent 工作流设计,用户只需连接一次即可持续构建和实验。它在 Claude Code 中集成了 Step 3.7 Flash 模型,大幅降低每次 API 调用的管理成本。开发者 @codedailyML 用 Step Plan 制作了 Tarot 生成器 demo,验证了工作流的便捷性。技巧Step PlanStepFunClaude CodeStep 3.7 Flash智能体推荐理由:StepFun 的 Step Plan 让你在 Claude Code 里连一次就能持续调模型,不用反复写 API,看那个 Tarot 生成器 demo 就知道了。原文
13:49Ethan Mollick@emollickEthan Mollick 指出,所有模型路由器(model routers)在处理非数学/编程任务时,普遍低估任务难度并分配过少的智能资源。他建议,对于不可验证的任务(如创新、营销、定性分析),使用更智能的模型往往能带来更大收益。这一观点源于他对多种路由器实际表现的经验观察。技巧model routers任务分配推理模型非数学任务推荐理由:Ethan Mollick 分享了一个容易被忽视的问题:模型路由器的任务分配不够智能,尤其对创意和分析类任务。如果你也发现一些任务结果不好,可能不是模型不行,是路由器给它派了太弱的模型。原文
13:48岚叔@lufzzliz文章指出长期依赖AI生成代码会削弱工程师的沉浸式创造能力和职业满足感。作者用历史小说家批量生产而非亲自研究写书的类比,说明类似问题。他自述使用Claude和Codex几个月后,写代码变得懒散迟钝,遇到复杂问题第一反应是让AI找bug或写修复。文章警告AI批量产生的代码如同“数字塑料垃圾”,便宜但长期污染软件生态。技巧ClaudeCodex编程助手软件工程推荐理由:这篇很真实,说透了AI用得越多,自己越容易变懒,得先自己思考再让AI动手。原文
13:48Ethan Mollick@emollick这个提示词让AI模型推荐两首适合当前GenAI状态的诗,并要求认真思考而非后验合理化。作者建议在GLM-5.2或Opus 4.8上尝试,观察模型如何选题和论证。它提供了窥探模型内部推理过程的视角,适合想了解模型思考方式的人。该技巧无需额外工具,直接复制提示词即可使用。技巧GLM-5.2Opus 4.8提示词工程推理模型推荐理由:想看看AI怎么思考?让GLM-5.2或Opus 4.8帮你选诗,能看到它的推理过程,挺有意思的。原文
13:48岚叔@lufzzliz在世界杯小组赛预测中,GLM-5.2在比分榜综合最强,GPT-5.5在胜负榜综合最强且命中率达70%。淘汰赛阶段取消24小时限制,可一次性预测16场比赛。作者分享了提示词示例:"继续预测,可以提交淘汰赛16场的比赛,你需要仔细分析给出你的答案、并提交"。同时附带了opus-4.8和deepseekv4-pro的预测结果。技巧GLM-5.2GPT-5.5提示词工程智能体世界杯推荐理由:作者用GLM-5.2和GPT-5.5预测世界杯,GPT-5.5命中率70%,还给了淘汰赛提示词,试试用自己的agent玩。原文
13:48岚叔@lufzzliz精选LufzzLiz基于Andrej Karpathy的LLM Wiki gist衍生出两套模板:个人知识库schema(五层目录)和代码仓库wiki schema(三层目录+双层导览)。附带实践案例Hermes-wiki和wiki-web,后者支持关系图和脑图。模板可直接用于构建结构化个人知识库或项目文档。技巧Karpathy知识库模板笔记技巧工作流推荐理由:如果你嫌搭建知识库太麻烦,试试这套基于Karpathy思路的模板,五层目录帮你把笔记理得清清楚楚,还有实际案例参考。原文
12:48Geek@geekbbGitHub上Pluviobyte/video-skill仓库将AI视频制作流程拆解为多个可安装的skill模块,涵盖视频创作、复刻、动效、片头包装、质检等环节。每个skill独立可用,降低视频制作门槛。项目长期维护,持续更新。技巧video-skillPluviobyte视频制作工作流开源项目推荐理由:这个仓库把视频创作、动效、包装等技能打包成模块,装一个就能用,做视频更轻松。原文
01:45AI产品黄叔@PMbackttfuture用户使用Hermes生成手机壁纸,并将微信Agent入口交回Hermes,同时接入flomo MCP实现记忆同步。每次手动触发“保存到flomo”时,内容会同步到flomo,并立即触发即时增强功能,从flomo/Hermes记忆中检索相关知识点推送笔记。这为知识工作者提供了利用AI助手整理灵感和长期记忆的工作流。技巧HermesflomoMCP/工具工作流智能体推荐理由:教你给AI设个微信入口,用Hermes做壁纸,还能自动同步到flomo,随时调取记忆,挺实用的。原文
01:42OpenRouter@OpenRouterAIOpenRouter 持续对大多数开源权重模型运行 GPQA 与 TAU-Bench 两个基准,并将结果公开。这些成绩被用于其 AutoExacto 元基准,后者是路由工具调用的默认依据。当前 Parasail 和 Zai 在排行榜上位列第一。技巧OpenRouterGPQATAU-BenchAutoExacto基准测试推荐理由:选模型路由工具前,看看 OpenRouter 定期跑的 GPQA 和 TAU-Bench 排名,现在 Parasail 和 Zai 排第一,挺有参考价值。原文
00:01Clement Delangue@ClementDelangueBrian Armstrong在推文中分享了Coinbase控制AI成本的实践。他提到,通过将默认模型切换到开源模型如GLM 5.2和Kimi 2.7,91%的员工从未触及使用上限。通过改进缓存,LibreChat的缓存命中率从5%提升到60%。这些措施使AI支出减少近一半,同时token用量仍在增长。他还强调路由优化和精简上下文的重要性。技巧Hugging FaceGLM 5.2Kimi 2.7成本优化缓存推荐理由:Coinbase创始人Brian Armstrong分享了一套实际操作方案:用更便宜的默认模型、优化缓存和路由,能把AI成本砍半。开源模型GLM 5.2和Kimi 2.7是主角,缓存命中率从5%跳到60%。原文
16:18Geek@geekbb精选网友分享的 Gentle-AI 配置串联 11 个不同职能的智能体,使用低成本 Flash 模型处理大部分上下文,仅在设计(Qwen)和编码(Kimi Code)等关键环节调用高性能模型。每日成本控制在 4~7 美元,并通过多智能体对齐审查显著降低幻觉率。该 per-phase model routing 策略可适配 15 种 AI 编程工具。技巧Gentle-AIQwenKimi Code智能体模型路由推荐理由:挺实用的配置:11个智能体分工,Flash模型省成本,Qwen和Kimi Code干重活,每天才4-7美元,还降幻觉。原文
11:19AI产品黄叔@PMbackttfuture精选黄叔分享了flomo Agent的10点使用心得,核心是降低记录前0.5秒的摩擦。他通过微信入口和Hermes Agent,并接入flomo MCP,将Hermes长期记忆同步到flomo。同时手动触发“保存到flomo”的内容,即时使用增强功能从flomo/Hermes记忆里检索相关笔记以帮助思考。他认为DeepSeek V4和王登科推动了flomo的发展,且Agent功能少反而更可信。最后提出flomo Agent+Codex/Hermes可形成“记忆-行动”双系统。技巧flomoAgent知识管理MCP/工具Hermes推荐理由:黄叔总结了flomo Agent的10条理解,比如用微信入口降低摩擦、打通记忆和行动,还提到了DeepSeek V4的作用。想用好flomo的可以看看。原文
11:19AI产品黄叔@PMbackttfuture黄叔总结了自己重度使用flomo Agent的10点理解,核心是降低记录前0.5秒的摩擦。他认为flomo Agent对手不是Notion或Obsidian,而是微信文件传输助手。该工具通过接入flomo MCP与Hermes,将对话长期记忆同步保存到flomo,并即时触发增强功能,从记忆中提取相关笔记辅助思考。黄叔还指出,DeepSeek V4和王登科推动了flomo发展,Agent功能少反而更可信,付费理由是“一个可信的记忆容器”。技巧flomo智能体HermesMCP知识管理推荐理由:黄叔分享了10条实际使用flomo Agent的心得,比如对手是微信文件传输助手、AI洞察是卡片结构的迟到红利,挺有启发。原文
11:10Yangyi@Yangyixxxx宝玉分享 Codex/Claude Code 的实用工作流:fork 功能可从某节点创建分支,保留历史让上下文更纯粹。/btw 或 /side 命令可在当前会话中提问与主任务无关的问题,不污染上下文。上下文压缩配合 Prompt Caching 降低持续对话成本,一个 Session 内连续完成任务更可行。plan 模式中可用 /btw 请求详细解释选项含义。技巧CodexClaude Codefork/btw提示词工程推荐理由:宝玉分享了两个超实用的技巧:fork分支对话和/btw侧边提问,让Codex和Claude Code用得更顺,强烈建议试试。原文
07:19Suhail@SuhailSuhail分享了在过去一周中,使用某个工具或方法快速验证新建立的训练后基础设施的经验。该方法不仅超越了简单的Hello World强化学习运行,还能帮助发现并修复rollout过程中的瓶颈。这是一个实用的快速配方,确保各组件正常运转。技巧训练基础设施强化学习rollout验证技巧推荐理由:Suhail分享了一个实用方法,能快速验证RL训练基础设施,避开常见瓶颈。原文
04:31Harrison Chase@hwchase17社区成员推出3小时深度课程,系统讲解Deep Agents构建。课程覆盖任务规划模块、文件系统用于上下文管理、子代理生成机制以及长期记忆实现。适合想深入掌握Agent开发流程的学习者。技巧Deep Agents智能体任务规划上下文管理子代理推荐理由:想学Deep Agents实战吗?3小时从任务规划讲到长期记忆,社区大神亲自带,比硬啃文档快多了。原文
04:19elvis@omarsar0该推文指出,循环工程(loop engineering)本质上是提示工程(prompt engineering)与良好系统设计的结合。这条观点来自社交媒体,获得了8条评论、1次转发和21个点赞。它强调在构建AI应用时,需要把提示工程与系统架构整合,而非单独优化提示词。技巧loop engineering提示词工程系统设计推荐理由:有人一句话点醒我:循环工程其实就是提示工程搭上系统设计,做AI应用的朋友可以想想你的架构对不对。原文
03:19Suhail@Suhail用户Suhail分享了两个提示词版本:"read-quick-dont-validate"用于快速阅读论文,要求AI一步步拆解并一次性输出章节式解释;"validate-my-understanding-and-teach-me"则需提供5-10个参考链接,要求AI逐步教学并验证理解。第二个版本可耗时数周但学习更深入。两条提示词分别适用于不同学习场景。技巧提示词工程论文阅读学习技巧ChatGPT教学方法推荐理由:想用AI读论文又怕浅尝辄止?试试这两个具体写法,一个快速扫读,一个深度教学,亲测有效。原文
03:19Suhail@Suhail该指令用于自动启动并监控AI模型训练运行。它在4个节点上运行完整训练,持续记录实验文档、超参数、配置以及定期评估结果。系统还会分析训练稳定性和性能,并在训练崩溃时从最新可靠检查点恢复。整个流程大幅减少了人工监视和干预的需求。技巧训练自动化多节点训练实验记录检查点恢复推荐理由:这个指令能自动帮你记实验日志、处理崩溃恢复,省去一直盯着的麻烦。原文
03:19Suhail@Suhail博主分享了一种异步学习工作流:将博客、推文、arxiv论文等全部用特定提示词让AI生成教学版,不立刻读而是排队等待。等到有空时(乘车、睡前等)再去阅读AI生成的易读版本,并追问问题。这样比直接存链接好,因为AI能适应读者的经验水平并重写内容。作者称这种学习速度远超以往。技巧学习工作流异步学习AI教学提示词技巧阅读理解推荐理由:把想读的文章丢给AI,让它先教你一遍,等你回头读的时候效率翻倍,还能追问。原文
02:10berryxia@berryxia一位老师通过生动的例子讲解大语言模型的原理,涵盖Transformer架构和注意力机制。适合AI初学者快速理解核心概念。技巧大语言模型教程入门推荐理由:这个老师的讲解很接地气,没基础也能听懂,推荐给想入门LLM的朋友。原文
01:49Jerry Liu@jerryjliu0Jerry Liu(LlamaIndex创始人)在推文中指出,手动构建工作流(代码、拖拽或提示)的需求正在减少,更优方式是指定目标让模型智能规划步骤。对于重复性任务,可收集带真实标签的数据集进行爬山优化,以平衡成本与准确率。他认为行业正从提示工程迈向目标和评估工程。拥有642次浏览、5个点赞。技巧Jerry LiuLlamaIndex工作流智能体提示词工程推荐理由:Jerry Liu说的这个趋势很实在:别再手动搭工作流了,直接给目标让模型自己想办法。重复任务还能录数据集优化,省心省钱。原文
01:25宝玉@dotey精选Codex 和 Claude Code 的上下文压缩功能结合 Prompt Caching,使得在单个 Session 内持续对话的成本压力显著降低。用户可以通过 fork 功能从对话的某个位置创建分支,只保留之前的历史记录,使上下文更纯粹。/btw 或 /side 命令允许在不影响当前任务上下文的情况下提问,例如在 plan 模式下用 /btw 详细解释选项含义。VB 提到自 GPT 5.3 Codex 以来,他不再担心上下文问题,且 Codex 的支线线程功能非常出色。技巧CodexClaude CodePrompt Caching上下文压缩编程助手推荐理由:如果你用 Codex 或 Claude Code 做长任务,这个技巧能省下不少 token 费用,fork 和 /btw 命令特别实用。原文
01:19AI产品黄叔@PMbackttfuture一位博主分享经历:一名大三学生在完成初稿后,收稿费仍继续优化方案。学生清晰解释如何用多个Agent各自发挥特长协同完成任务。博主称赞其思路,并表示学生希望暑假来实习。技巧Agent协作案例分享实习生推荐理由:看一个大三学生怎么用多个Agent分工协作,还主动给你优化方案,这思路值得学。原文
00:56berryxia@berryxia76°Anthropic的Lamis在2026年AI DevCon上分享了上下文工程实践,从Claude MD文件起步,发现其效果出奇地好(unreasonably effective)。第二步引入记忆工具,让Agent自主读写,效果优于人类。第三步Skills采用渐进式披露,类似书架取书。第四步文件系统用bash和grep搜索,不需要向量数据库。生产环境面临多Agent并发写入等问题,Anthropic提出版本控制、并发控制等四个原则。最后介绍“做梦”机制:异步批量分析会话记录,识别模式并调整上下文,已在生产中运行,降低token成本。技巧AnthropicClaude上下文工程智能体记忆管理10 个信源在谈推荐理由:Anthropic工程师手把手教你上下文管理套路,从最基础的文件到高级的“做梦”架构,半小时就能上手实操。原文
00:56berryxia@berryxia精选Anthropic应用AI负责人Lamis在2026年AI DevCon上分享了Agent记忆系统的四层架构。起点是CLAUDE.md文件,效果超过复杂Prompt工程。第二层是记忆工具,让Agent自主读写更新,判断力比人强。第三层Skills实现渐进式披露,类似从书架抽词典。第四层把记忆建模为文件系统,用bash/grep,无需向量数据库。还引入"做梦"(带外异步处理)分析跨会话模式,已在生产中提升任务效率并降低成本。技巧Claude Code记忆管理智能体Anthropic提示词工程10 个信源在谈推荐理由:Anthropic官方分享了他们怎么让Agent记住东西:从Markdown文件到做梦机制,很实用的四层方法论,看完可以少走弯路。原文
00:01MIT CSAIL@MIT_CSAIL一份由Anatoli Kopadze整理的18步Claude使用教程发布。教程涵盖从基础提示到高级工作流的技巧,共18个步骤。每个步骤针对Claude交互中的具体场景提供指导。用户可系统提升与Claude的协作效率。技巧ClaudeAnthropic提示词工程教程10 个信源在谈推荐理由:想用好Claude?这有18个实用步骤,从提示词到工作流全涵盖,练完你就是高手。原文
19:24idoubi@idoubiccidoubicc 在广州南沙客运港举办了 codefree.cafe 第一期 AI 编程小桌课,5 位学员在 6 小时结对编程中用 ShipAny 和 FastClaw 构建了 Agent 产品。课程涵盖 Claude Code 和 Codex 的网络配置、Vibe Coding 技巧、ShipAny 快速上站演示,以及从 idea 到上线的全流程拆解。费用 ¥4096/人次,赠送价值 ¥3072 的 ShipAny 会员、1024 社群会员和《这就是 MCP》一书。技巧ShipAnyFastClawClaude CodeCodex编程助手推荐理由:idoubi 搞了个咖啡馆里的小桌课,一天时间教你用 Claude Code 和 Codex 落地 Agent 产品,还包学会 ShipAny 上站,广州朋友别错过。原文