02:47AWS Machine Learning Blog@Enrique Salgado Hernández精选本文介绍了Amazon QuickSight中BI资产的备份最佳实践。首先讲解如何选择需要备份的资产(如仪表板、数据集等)。然后说明可用的API(如ListDashboards、CreateDashboard)用于备份操作。最后提供示例代码帮助快速实现备份流程。技巧Amazon QuickSightAWS备份策略BI资产教程推荐理由:AWS教你备份QuickSight资产,有代码示例,照着做就能避免数据丢失。原文
01:58AWS Machine Learning Blog@Anuranjan Mondal精选PAR 在 AWS 上构建了一个生产级多租户 LLM 分析系统,通过三层架构强制执行行级安全:使用 AWS SigV4 进行加密请求签名、在 Amazon Bedrock 上进行语义验证、以及通过 Split-Plane SQL 实现程序化数据隔离。每层独立运行以降低跨租户数据暴露风险,即使 LLM 本身被攻破或操纵也能保护数据。技巧AWSAmazon Bedrock多租户行级安全AI安全推荐理由:AWS 这篇教程手把手教你用 Bedrock 和 Split-Plane SQL 搭建多租户 LLM 分析系统,三层隔离防止数据泄露,值得做企业级 AI 安全的开发者看看。原文
01:57AWS Machine Learning Blog@Sanghwa Na精选AWS 博客展示如何用 Amazon Nova 2 Lite 和 Claude Sonnet 4.6 构建两模型管道,用于扫描文档的数字化。Nova 2 Lite 在单次调用中完成多模态提取(检测照片、提取姓名坐标、返回页面元数据)。Claude Sonnet 4.6 根据版面布局进行空间推理,将姓名和面孔匹配。该管道在 Amazon Bedrock 上运行,通过分工降低总处理成本。技巧Amazon Nova 2 LiteClaude Sonnet 4.6Amazon Bedrock文档数字化多模态推荐理由:用 Nova 2 Lite 做粗提取,Claude Sonnet 4.6 做精准匹配,文档数字化省心又省钱。原文
01:56AWS Machine Learning Blog@Troy Parrett精选本教程展示如何结合Amazon Bedrock Data Automation自动提取医疗理赔表单数据,再通过Amazon Bedrock AgentCore托管AI代理进行验证并转换为FHIR资源存入AWS HealthLake。该端到端工作流可减少人工处理流程,同时通过自动化校验保持数据准确性。文中逐步讲解每个组件的配置与集成方法。技巧Amazon BedrockAWS HealthLakeFHIR智能体医疗数据推荐理由:AWS官方手把手教你搭医疗理赔流水线,用Bedrock自动抽数据、转FHIR格式存HealthLake,能省不少人工核对时间。原文
01:33AWS Machine Learning Blog@Joshua Lacy精选本文介绍如何使用Amazon Bedrock AgentCore的内置可观测性功能调试生产环境中的智能体故障。文章涵盖常见的故障模式,如无限循环和工具调用失败。通过追踪和指标分析智能体行为,并提供结构化工作流来解决问题。本文是两部分系列的第一部分,第二部分将讨论性能优化和内存管理。技巧Amazon BedrockAgentCore可观测性智能体工具调用推荐理由:AWS博客教你用Bedrock AgentCore内置观察功能排查生产智能体故障,比如无限循环和工具调用失败,省去自己搭建监控的麻烦。原文
23:12berryxia@berryxiaMargot Van Laar在Code with Claude大会上分享提示词工程实战,核心观点是生产提示词调试维护比从零写更重要。她展示客服机器人场景:团队发现旧模型遗留的'禁止列表'指令导致新模型过度拟合,以及'请仔细计算'无效需提供计算器工具。在零售排班Agent场景中,她将复杂提示词拆成三个简单提示词(生成、评估、修复)组成循环,比单一大提示词更稳定。她强调可用Opus等更强推理模型加自适应思考来简化提示词,并务必建立量化评估基准验证改动效果。技巧AnthropicClaude提示词工程评估提示词维护8 个信源在谈推荐理由:Anthropic工程师手把手教你维护生产提示词,从客服机器人到排班Agent,拆成小提示词更靠谱,还有评估妙招。原文
23:10berryxia@berryxia精选Anthropic工程师Margot Van Laar在Code with Claude分享提示词工程最佳实践,强调通过评估(Eval)而非直接修改提示词来优化。她用客服机器人和零售排班两个案例演示:使用XML标签结构化提示词、移除旧模型遗留的禁止列表(如Claude 3 Opus)、用工具替代指令处理计算任务。拆解复杂任务为生成-评估-修复循环,并建议用更强推理模型(如Opus)加自适应思考替代小模型复杂提示词。技巧提示词工程Claude评估Claude Opus工作流8 个信源在谈推荐理由:Anthropic工程师手把手教你怎么调客服提示词和搭Agent,用Opus加循环拆解比堆复杂指令更管用,核心就一句话:先搞评估原文
20:05@zarazhangrui@zarazhangrui一位创业者分享经验:每花1小时构建产品,应投入2小时用于解释、演示、销售和教学。这一比例强调产品需要持续向外界传达并基于用户反馈迭代。指出将时间优先花在传播和沟通上,是产品成功的关键。该观点源自与现实的接触和不断打磨。技巧产品开发推广技巧创业经验时间管理推荐理由:别只顾码代码,花两倍时间去推销和教学,这才是让产品落地的硬道理。原文
18:57vLLM@vllm_project精选NVIDIA 与 vLLM 合作发布 step-by-step 指南,教你用四台 DGX Spark 盒子组建私有集群,自托管 550B 参数的 Nemotron-3-Ultra 模型。指南基于 vLLM 官方容器,可提供兼容 OpenAI 的端点。无需数据中心,适合构建私有 agent 工作流。技巧Nemotron-3-UltraNVIDIADGX SparkvLLM自托管4 个信源在谈推荐理由:想不依赖数据中心自己跑 550B 模型?NVIDIA 出了详细教程,四台 DGX Spark 就能拼出 OpenAI 兼容的端点。原文
14:55宝玉@dotey有用户发现,在 Codex 应用中将模型选为 GPT-5.5 并设置推理为 xhigh 后,运行 Juice 测试 Prompt 若返回 128 则实际使用的是 GPT 5.6 Sol,否则返回 768 就是 GPT 5.5。该 Prompt 要求模型输出 Juice 数除以2乘10再除以5的结果。目前测试仍返回 768,说明多数用户尚未灰度到 GPT 5.6 Sol。技巧GPT 5.6 SolGPT 5.5提示词工程推理模型推荐理由:想提前知道自己的 GPT 5.5 是不是偷偷升级了?用这个 Juice 测试 Prompt 一试便知,很简单。原文
13:58Ate-a-Pi@svpino这个开源项目允许你录制浏览器操作,系统会自动清理录制内容,移除重试、死路和页面特定细节。然后它只保留任务逻辑而非具体点击,将其转化为可复用的技能。最后这些技能被组织成技能图谱,智能体可检索用于相关新任务。整个过程完全开源。技巧开源浏览器自动化智能体技能图谱工作流推荐理由:有个开源项目能录制你在浏览器里做的事,自动变成可复用的技能,还能让智能体直接调用,省去重复劳动。原文
13:52EleutherAI@AiEleutherEleutherAI在ICML 2024会议上发布了参会指南。指南包含了他们在会议期间的展位和演讲安排。参会者可通过链接获取详细位置信息。技巧EleutherAIICML开源模型活动指南推荐理由:EleutherAI发了他们在ICML的定位指南,想去现场找他们的可以看看,免得错过。原文
13:51Together AI@togethercomputeTogether AI 工程师将在 AI Engineer World’s Fair 举办 hands-on workshop,讨论 Agentic Coding 如何改变推理引擎需求。workshop 将讲解推理引擎的工作原理及服务生产级 agentic workloads 的要点。活动时间为6月29日上午9-11点,地点在 Room 2020。技巧Together AIAI Engineer World’s Fairagentic coding推理引擎智能体推荐理由:想了解 agentic coding 对推理引擎的新要求?Together AI 的这个实操 workshop 直接带你上手,时间是6月29日上午。原文
13:51Jasper AI@heyjasperaiJasper将Hugging Face基础设施用于其MONET系统的数据创建和存储。该方法针对随时间更新的大型训练数据集进行了优化。Jasper团队通过HF实现了更高效的数据管道管理。这一案例展示了HF在训练数据工作流中的实际应用。技巧JasperHugging FaceMONET数据管道模型训练推荐理由:看看Jasper怎么用Hugging Face当MONET的数据后台,对做大模型训练数据管道的团队很有启发。原文
13:50François Chollet@fcholletFrançois Chollet(Keras创建者)在推文中指出编程不是关于代码,而是通过抽象层管理复杂性的艺术。他认为编程的核心在于构建函数、类等抽象层来降低认知负荷。AI在这一框架下仅是一种新的抽象工具,不应被过度神化。这一观点提醒程序员更关注架构设计而非语法细节。技巧François CholletKeras抽象层编程思想推荐理由:Chollet一句话点醒你:编程不是写代码,是搭抽象层。别把AI太当回事。原文
13:50François Chollet@fchollet精选François Chollet 指出,智能体编程(Agentic coding)迫使开发者设计清晰的 API 接口并编写完整的文档字符串。AI 代理无法阅读团队内部的隐式心理模型,只能依赖显式的 API 合约和 docstring。这要求接口规范必须精确、无歧义,文档覆盖所有输入/输出场景。对工程团队而言,这意味着需要投入更多时间在接口形式化设计上。技巧Agentic codingAPI设计文档字符串智能体编程助手推荐理由:François Chollet 说得很实在:想用AI代笔写代码,接口就得干净、文档得详细,别指望它懂你没写出来的默契。原文
13:50阿里云 Alibaba Cloud@alibaba_cloud阿里巴巴云Qwen团队将于2026年6月30日举办Qwen Live第一集直播,主题为Agent-First。Qwen云负责人Linlin Kong与产品经理Pan Gu、Xijue将分享从零构建智能体云平台的经验。直播将重新定义面向非人类用户的开发者体验,并探讨大规模人机协作的新范式。技巧Qwen阿里云智能体云平台开发者体验推荐理由:想搞智能体云平台?Qwen这期直播讲从零搭建、非人类用户开发体验,做agent的开发者别错过。原文
13:50阶跃星辰 Stepfun@Stepfun_AIStep Plan 专为 Agent 工作流设计,用户只需连接一次即可持续构建和实验。它在 Claude Code 中集成了 Step 3.7 Flash 模型,大幅降低每次 API 调用的管理成本。开发者 @codedailyML 用 Step Plan 制作了 Tarot 生成器 demo,验证了工作流的便捷性。技巧Step PlanStepFunClaude CodeStep 3.7 Flash智能体推荐理由:StepFun 的 Step Plan 让你在 Claude Code 里连一次就能持续调模型,不用反复写 API,看那个 Tarot 生成器 demo 就知道了。原文
13:49Ethan Mollick@emollickEthan Mollick 指出,所有模型路由器(model routers)在处理非数学/编程任务时,普遍低估任务难度并分配过少的智能资源。他建议,对于不可验证的任务(如创新、营销、定性分析),使用更智能的模型往往能带来更大收益。这一观点源于他对多种路由器实际表现的经验观察。技巧model routers任务分配推理模型非数学任务推荐理由:Ethan Mollick 分享了一个容易被忽视的问题:模型路由器的任务分配不够智能,尤其对创意和分析类任务。如果你也发现一些任务结果不好,可能不是模型不行,是路由器给它派了太弱的模型。原文
13:48岚叔@lufzzliz文章指出长期依赖AI生成代码会削弱工程师的沉浸式创造能力和职业满足感。作者用历史小说家批量生产而非亲自研究写书的类比,说明类似问题。他自述使用Claude和Codex几个月后,写代码变得懒散迟钝,遇到复杂问题第一反应是让AI找bug或写修复。文章警告AI批量产生的代码如同“数字塑料垃圾”,便宜但长期污染软件生态。技巧ClaudeCodex编程助手软件工程推荐理由:这篇很真实,说透了AI用得越多,自己越容易变懒,得先自己思考再让AI动手。原文
13:48Ethan Mollick@emollick这个提示词让AI模型推荐两首适合当前GenAI状态的诗,并要求认真思考而非后验合理化。作者建议在GLM-5.2或Opus 4.8上尝试,观察模型如何选题和论证。它提供了窥探模型内部推理过程的视角,适合想了解模型思考方式的人。该技巧无需额外工具,直接复制提示词即可使用。技巧GLM-5.2Opus 4.8提示词工程推理模型推荐理由:想看看AI怎么思考?让GLM-5.2或Opus 4.8帮你选诗,能看到它的推理过程,挺有意思的。原文
13:48岚叔@lufzzliz在世界杯小组赛预测中,GLM-5.2在比分榜综合最强,GPT-5.5在胜负榜综合最强且命中率达70%。淘汰赛阶段取消24小时限制,可一次性预测16场比赛。作者分享了提示词示例:"继续预测,可以提交淘汰赛16场的比赛,你需要仔细分析给出你的答案、并提交"。同时附带了opus-4.8和deepseekv4-pro的预测结果。技巧GLM-5.2GPT-5.5提示词工程智能体世界杯推荐理由:作者用GLM-5.2和GPT-5.5预测世界杯,GPT-5.5命中率70%,还给了淘汰赛提示词,试试用自己的agent玩。原文
13:48岚叔@lufzzliz精选LufzzLiz基于Andrej Karpathy的LLM Wiki gist衍生出两套模板:个人知识库schema(五层目录)和代码仓库wiki schema(三层目录+双层导览)。附带实践案例Hermes-wiki和wiki-web,后者支持关系图和脑图。模板可直接用于构建结构化个人知识库或项目文档。技巧Karpathy知识库模板笔记技巧工作流推荐理由:如果你嫌搭建知识库太麻烦,试试这套基于Karpathy思路的模板,五层目录帮你把笔记理得清清楚楚,还有实际案例参考。原文
12:48Geek@geekbbGitHub上Pluviobyte/video-skill仓库将AI视频制作流程拆解为多个可安装的skill模块,涵盖视频创作、复刻、动效、片头包装、质检等环节。每个skill独立可用,降低视频制作门槛。项目长期维护,持续更新。技巧video-skillPluviobyte视频制作工作流开源项目推荐理由:这个仓库把视频创作、动效、包装等技能打包成模块,装一个就能用,做视频更轻松。原文
06:46Simon Willison’s Weblog(博客/媒体)Jon Udell 反对“人类在环中”的说法,认为这拱手交出了主动权。他主张“人类代理在环中”,即由人类主导流程,邀请 LLM 代理加入团队。他以“Doctor, it hurts when agents create unreviewable PRs”为例,强调代理不该成为产生不可审查代码的黑箱。核心是让代理辅助而非替代人类的判断与工作流。技巧Jon Udell智能体编程助手LLMs推荐理由:Jon Udell 换了个角度聊 AI 工作流:别让代理做黑箱,让它们当团队助手,人类还是舵手。原文
01:45AI产品黄叔@PMbackttfuture用户使用Hermes生成手机壁纸,并将微信Agent入口交回Hermes,同时接入flomo MCP实现记忆同步。每次手动触发“保存到flomo”时,内容会同步到flomo,并立即触发即时增强功能,从flomo/Hermes记忆中检索相关知识点推送笔记。这为知识工作者提供了利用AI助手整理灵感和长期记忆的工作流。技巧HermesflomoMCP/工具工作流智能体推荐理由:教你给AI设个微信入口,用Hermes做壁纸,还能自动同步到flomo,随时调取记忆,挺实用的。原文
01:42OpenRouter@OpenRouterAIOpenRouter 持续对大多数开源权重模型运行 GPQA 与 TAU-Bench 两个基准,并将结果公开。这些成绩被用于其 AutoExacto 元基准,后者是路由工具调用的默认依据。当前 Parasail 和 Zai 在排行榜上位列第一。技巧OpenRouterGPQATAU-BenchAutoExacto基准测试推荐理由:选模型路由工具前,看看 OpenRouter 定期跑的 GPQA 和 TAU-Bench 排名,现在 Parasail 和 Zai 排第一,挺有参考价值。原文
00:54marktechpost@Sana Hassan精选本教程使用 Python 构建完整的 OCRmyPDF 流水线。先生成合成图像 PDF 以测试 OCR,再将其转换为可搜索 PDF 和 PDF/A 格式。通过提取侧边文本、计算单词召回率(word-recall)并比较文件大小来验证效果。还能调整 Tesseract 参数、清理噪点、纠正方向、在内存中运行 OCR 以及批量处理整个文件夹。技巧OCRmyPDFPDF/ATesseractPython文档扫描推荐理由:手把手教你用 Python 调 OCRmyPDF,从生成测试图片到批量转 PDF/A,还带召回率比较,适合文档处理需求的人。原文
00:01Clement Delangue@ClementDelangueBrian Armstrong在推文中分享了Coinbase控制AI成本的实践。他提到,通过将默认模型切换到开源模型如GLM 5.2和Kimi 2.7,91%的员工从未触及使用上限。通过改进缓存,LibreChat的缓存命中率从5%提升到60%。这些措施使AI支出减少近一半,同时token用量仍在增长。他还强调路由优化和精简上下文的重要性。技巧Hugging FaceGLM 5.2Kimi 2.7成本优化缓存推荐理由:Coinbase创始人Brian Armstrong分享了一套实际操作方案:用更便宜的默认模型、优化缓存和路由,能把AI成本砍半。开源模型GLM 5.2和Kimi 2.7是主角,缓存命中率从5%跳到60%。原文
16:18Geek@geekbb精选网友分享的 Gentle-AI 配置串联 11 个不同职能的智能体,使用低成本 Flash 模型处理大部分上下文,仅在设计(Qwen)和编码(Kimi Code)等关键环节调用高性能模型。每日成本控制在 4~7 美元,并通过多智能体对齐审查显著降低幻觉率。该 per-phase model routing 策略可适配 15 种 AI 编程工具。技巧Gentle-AIQwenKimi Code智能体模型路由推荐理由:挺实用的配置:11个智能体分工,Flash模型省成本,Qwen和Kimi Code干重活,每天才4-7美元,还降幻觉。原文
15:15marktechpost@Sana Hassan精选本教程基于 Hugging Face 的 Fable 5 Traces 数据集,在 Colab 中构建稳定工作流。手动解析合并的 JSONL 文件避免依赖问题,检查仓库文件并标准化工具调用。通过审计结构、脱敏密钥和可视化分布,导出安全的无 CoT 聊天数据集。最后使用纯 Python 的朴素贝叶斯模型在 traces 上训练基线,无需复杂框架。技巧Fable 5 TracesColab工具调用数据审计基线模型推荐理由:手把手教你用 Colab 搞定 Fable 5 Traces 数据,从解析到审计再到训练基线,全流程避坑实战。原文
11:19AI产品黄叔@PMbackttfuture精选黄叔分享了flomo Agent的10点使用心得,核心是降低记录前0.5秒的摩擦。他通过微信入口和Hermes Agent,并接入flomo MCP,将Hermes长期记忆同步到flomo。同时手动触发“保存到flomo”的内容,即时使用增强功能从flomo/Hermes记忆里检索相关笔记以帮助思考。他认为DeepSeek V4和王登科推动了flomo的发展,且Agent功能少反而更可信。最后提出flomo Agent+Codex/Hermes可形成“记忆-行动”双系统。技巧flomoAgent知识管理MCP/工具Hermes推荐理由:黄叔总结了flomo Agent的10条理解,比如用微信入口降低摩擦、打通记忆和行动,还提到了DeepSeek V4的作用。想用好flomo的可以看看。原文
11:19AI产品黄叔@PMbackttfuture黄叔总结了自己重度使用flomo Agent的10点理解,核心是降低记录前0.5秒的摩擦。他认为flomo Agent对手不是Notion或Obsidian,而是微信文件传输助手。该工具通过接入flomo MCP与Hermes,将对话长期记忆同步保存到flomo,并即时触发增强功能,从记忆中提取相关笔记辅助思考。黄叔还指出,DeepSeek V4和王登科推动了flomo发展,Agent功能少反而更可信,付费理由是“一个可信的记忆容器”。技巧flomo智能体HermesMCP知识管理推荐理由:黄叔分享了10条实际使用flomo Agent的心得,比如对手是微信文件传输助手、AI洞察是卡片结构的迟到红利,挺有启发。原文
11:10Yangyi@Yangyixxxx宝玉分享 Codex/Claude Code 的实用工作流:fork 功能可从某节点创建分支,保留历史让上下文更纯粹。/btw 或 /side 命令可在当前会话中提问与主任务无关的问题,不污染上下文。上下文压缩配合 Prompt Caching 降低持续对话成本,一个 Session 内连续完成任务更可行。plan 模式中可用 /btw 请求详细解释选项含义。技巧CodexClaude Codefork/btw提示词工程推荐理由:宝玉分享了两个超实用的技巧:fork分支对话和/btw侧边提问,让Codex和Claude Code用得更顺,强烈建议试试。原文
07:19Suhail@SuhailSuhail分享了在过去一周中,使用某个工具或方法快速验证新建立的训练后基础设施的经验。该方法不仅超越了简单的Hello World强化学习运行,还能帮助发现并修复rollout过程中的瓶颈。这是一个实用的快速配方,确保各组件正常运转。技巧训练基础设施强化学习rollout验证技巧推荐理由:Suhail分享了一个实用方法,能快速验证RL训练基础设施,避开常见瓶颈。原文
04:31Harrison Chase@hwchase17社区成员推出3小时深度课程,系统讲解Deep Agents构建。课程覆盖任务规划模块、文件系统用于上下文管理、子代理生成机制以及长期记忆实现。适合想深入掌握Agent开发流程的学习者。技巧Deep Agents智能体任务规划上下文管理子代理推荐理由:想学Deep Agents实战吗?3小时从任务规划讲到长期记忆,社区大神亲自带,比硬啃文档快多了。原文
04:19elvis@omarsar0该推文指出,循环工程(loop engineering)本质上是提示工程(prompt engineering)与良好系统设计的结合。这条观点来自社交媒体,获得了8条评论、1次转发和21个点赞。它强调在构建AI应用时,需要把提示工程与系统架构整合,而非单独优化提示词。技巧loop engineering提示词工程系统设计推荐理由:有人一句话点醒我:循环工程其实就是提示工程搭上系统设计,做AI应用的朋友可以想想你的架构对不对。原文
03:19Suhail@Suhail用户Suhail分享了两个提示词版本:"read-quick-dont-validate"用于快速阅读论文,要求AI一步步拆解并一次性输出章节式解释;"validate-my-understanding-and-teach-me"则需提供5-10个参考链接,要求AI逐步教学并验证理解。第二个版本可耗时数周但学习更深入。两条提示词分别适用于不同学习场景。技巧提示词工程论文阅读学习技巧ChatGPT教学方法推荐理由:想用AI读论文又怕浅尝辄止?试试这两个具体写法,一个快速扫读,一个深度教学,亲测有效。原文
03:19Suhail@Suhail该指令用于自动启动并监控AI模型训练运行。它在4个节点上运行完整训练,持续记录实验文档、超参数、配置以及定期评估结果。系统还会分析训练稳定性和性能,并在训练崩溃时从最新可靠检查点恢复。整个流程大幅减少了人工监视和干预的需求。技巧训练自动化多节点训练实验记录检查点恢复推荐理由:这个指令能自动帮你记实验日志、处理崩溃恢复,省去一直盯着的麻烦。原文
03:19Suhail@Suhail博主分享了一种异步学习工作流:将博客、推文、arxiv论文等全部用特定提示词让AI生成教学版,不立刻读而是排队等待。等到有空时(乘车、睡前等)再去阅读AI生成的易读版本,并追问问题。这样比直接存链接好,因为AI能适应读者的经验水平并重写内容。作者称这种学习速度远超以往。技巧学习工作流异步学习AI教学提示词技巧阅读理解推荐理由:把想读的文章丢给AI,让它先教你一遍,等你回头读的时候效率翻倍,还能追问。原文