06:56Meta Engineering Blog(博客/媒体)精选Meta在博客中分享了构建隐私感知基础设施时,资产分类面临的挑战。隐私控制(如保留、访问、用途限制)需要对数据有准确理解,但相同名称可能在不同上下文有不同含义,例如字段“age”在不同场景代表不同数据。Meta通过案例研究说明了如何设计分类系统来识别这些差异。技巧Meta隐私控制资产分类AI安全推荐理由:Meta用实际案例讲隐私控制的难点,一个‘age’字段在不同场景含义不同,搞错了会出大问题。原文
05:57Guillermo Rauch@rauchgNext.js 在错误提示界面中加入了“Ways to fix this”功能,并配套“Copy prompt”按钮。用户点击后可直接将错误上下文和修复建议复制为结构化的提示词,方便粘贴到 Claude、ChatGPT 等 AI 编程助手中。该功能已在 Next.js 的开发者工具中上线,支持常见的编译和运行时错误。此举将调试流程从手动描述问题缩短为一次复制粘贴,提升了修复效率。技巧Next.js提示词工程编程助手开发者体验推荐理由:Next.js 这个新 UI 太实用了,点一下就能把错误和修复提示复制成 prompt,直接丢给 AI 就能修,省去打字时间。原文
04:59elvis@omarsar0精选推文讨论动态工作流适用于少数用例,被视为测试时计算(TTC)的新范式。作者指出动态工作流在爬山式研究实验中表现强劲,且通过精心规划和提高推理水平可获更好结果。文章强调验证器/评审器对结果至关重要,组合不同的编码代理可取得更优效果。当需要从不同代理(如LLM委员会)获取多元视角时,动态工作流非常有用,但前沿模型尚不擅长优化地即时生成测试平台。提到了Mythos等新型模型可能更善于代理编排,且需要更多TTC基准来评估动态工作流的有效性。技巧动态工作流测试时计算推理模型智能体Mythos推荐理由:如果你在做代理编排或研究测试时计算,这条推文给出了非常实用的观察,比如什么时候该用动态工作流、如何用好验证器,还提到了Mythos这类新模型。原文
04:54Guillermo Rauch@rauchgVercel 构建了一个包含技能、linter(ESLint 等)、评估和更新循环的系统,确保编码代理遵循设计标准。该系统的核心是一组自定义规则,可自动检测代码中的设计偏差(如布局、颜色主题)。他们使用 Vercel AI SDK 和 Claude 3.5 Sonnet 实现代理的实时反馈。博客详细描述了如何通过循环迭代(每次提交触发评估)持续改进代理行为。Vercel 还开源了部分组件,如 design-linter 工具包。技巧Vercel设计规范编码代理AI 代码生成自定义 linter推荐理由:Vercel 分享了他们怎么让 AI 写代码时自动遵守设计规范——用 linter、评估循环和自定义规则。想给 AI 代码加设计约束的可以抄作业。原文
04:03Harrison Chase@hwchase17精选LangChain 发布了一个面向 JS 框架的 Agent 部署 cookbook,提供完整的全栈示例代码。内容覆盖 streaming UI、子 agent(subagents)、线程历史(thread history)以及生产环境持久化注意事项。该 cookbook 旨在帮助开发者将本地演示的 agent 快速部署到真实应用中。技巧LangChainJavaScriptagent部署教程推荐理由:想把 LangChain agent 从本地搬到线上?这份 cookbook 手把手教你用 JS 做全栈,连 streaming UI 和子 agent 都配好了。原文
03:11LangChain@LangChainAI精选LangChain JS 团队发布了 Agent 部署 Cookbook,包含全栈示例代码。这些示例展示了流式 UI、子代理、线程历史等功能,并附带生产环境持久化笔记。Cookbook 覆盖了多种常见 JS 框架,帮助开发者将本地 demo 的 Agent 真正部署到实际应用中。技巧LangChainAgentJavaScript全栈开发部署教程推荐理由:LangChain 出了个部署指南,教你用 JS 框架把 Agent 做成全栈应用,带流式 UI 和子代理,直接抄作业。原文
03:09Cursor@cursor_ai精选Cursor AI 发布推文(获得74次点赞、6621次查看)介绍其约束评估环境的方法。该推文指向博客文章,详细解释了如何通过限制环境来使模型评估分数更准确反映智能水平。技巧Cursor AI编程助手评估环境模型基准4 个信源在谈推荐理由:Cursor AI 分享了他们约束评估环境的做法,让分数更准,比一般基准更可靠,适合做模型评估的看看。原文
03:07Ate-a-Pi@svpinoSantiago Valdarrama 分享智能体自我改进的三个途径:模型层(仅适用于代码和数学,由大实验室负责)、执行框架层(步骤、工具和安全检查,容易控制且回报大)、上下文层(纯文本记录学习内容,最易入手)。他还强调从用户纠正智能体决策的每个实例中学习,真实反馈无可替代。文章提供了明确的优先级和实操建议。技巧智能体反馈学习Agent系统设计上下文学习推荐理由:想让你家智能体越用越聪明?这个线程给了三个可落地的改进方向,尤其是从用户操作中学习那块,不少人都忽略了。原文
02:58Gary Marcus@GaryMarcusAnthropic工程师在一场40分钟工作坊中展示了如何利用循环(loops)构建可运行数天的AI智能体。他们透露,Anthropic内部30%以上的代码已由循环编写,这极大加快了交付速度。工作坊拆解了智能体循环、工具调用、记忆管理和子智能体等核心组件。该方法被视为神经符号AI的典型应用,在持久任务执行上明显优于传统无循环生成式方法。技巧Anthropic智能体Agent循环工作流代码生成10 个信源在谈推荐理由:Anthropic工程师手把手教你用循环搭建能跑好几天的智能体,内部30%代码都这么写,比大部分500美元的vibe编程课实在。原文
02:56AK@_akhaliq开发者使用GLM 5.2模型在hf-claude环境下,为9B参数的Ornith-1.0-9B模型搭建了一个Gradio服务器应用。该推文获得3条回复和3197次浏览。应用通过Gradio界面提供交互式推理,可直接测试模型的文本生成能力。代码可能开源,用户可自行部署。技巧GLM 5.2hf-claudeOrnith-1.0-9BGradio模型部署推荐理由:有人用GLM 5.2和hf-claude给Ornith-1.0-9B做了个Gradio界面,直接就能上手试,省了写前端代码的功夫。原文
02:09AWS Machine Learning Blog@Renuka Kumar精选AWS博客提出Agentic Overlays方案,通过薄包装层将传统REST服务转化为支持A2A交互的智能体。该方案同时使REST API兼容Model Context Protocol (MCP),作为工具暴露。企业无需重写业务逻辑、重复代码或运行并行基础设施。博客提供参考架构和示例代码,帮助减少基础设施中的智能体膨胀。技巧AWSAgentic overlaysMCPA2A企业服务推荐理由:AWS教你怎么给旧REST服务套个Agentic Overlays壳,不用重写代码就能变A2A智能体、兼容MCP,比从头建省事多了。原文
01:51Harrison Chase@hwchase17精选73°LangChain团队发布技术博客,详细介绍SmithDB的构建与运行。SmithDB是一个专门为agent traces设计的数据库,其所有持久数据存储在对象存储中。博客阐述了如何在这种存储上构建、压缩和查询全文搜索索引,并处理每个GET请求50–100ms的延迟。团队分享了在生产环境中运行SmithDB倒排索引(inverted index)的经验。技巧SmithDBLangChain智能体追踪全文搜索数据库推荐理由:LangChain团队手把手教你如何为agent traces造一个数据库,对象存储上做全文搜索还能压到50-100ms延迟,干货满满。原文
01:37OpenAI@OpenAI (@OpenAI)OpenAI 在官方博客发布“How agents work”指南,详细拆解 Agent 的核心组成:模型调用(以 GPT-4o 为例)、工具集成(代码解释器、函数调用等)、持久化记忆(向量数据库)以及编排模式(链式与多步)。指南对比了简单查询与复杂多步骤 Agent 的设计差异,并给出基于 Assistants API 的代码示例。文章未公布新的基准分数,但提供了可立即实现的架构建议。技巧AgentOpenAIGPT-4o工具使用指南10 个信源在谈推荐理由:OpenAI 手把手教你做智能体,从原理到代码都有,适合想自己搭 Agent 的同学。原文
01:26LangChain@LangChainAILangChain 团队解决了在对象存储中构建全文搜索索引的挑战:每个 GET 请求耗时 50-100ms,且数据持久化在远程存储。他们介绍了 SmithDB 的倒排索引构造、压缩和查询方案,涉及批量写入、压缩策略以减少请求次数,以及针对高延迟的查询优化。这些方法在生产环境中已稳定运行。技巧LangChainSmithDB全文搜索对象存储倒排索引推荐理由:LangChain 分享了怎么在对象存储上搞全文搜索,延迟 50-100ms 的情况下还能压出来倒排索引,挺实在的实战经验。原文
01:15Hugging Face@huggingfaceHugging Face 通过直播演示如何在本机部署和运行开源 AI 模型。教程覆盖了从模型下载、环境配置到推理执行的完整流程,无需依赖云端服务。适合希望离线使用 LLaMA、Mistral 等模型的开发者。技巧Hugging Face开源模型本地部署推理推荐理由:想自己跑开源模型?Hugging Face 这场直播手把手教你在本地部署,省去云端费用和延迟。原文
00:58AWS Machine Learning Blog@Venkata Sistla精选AWS发布了一篇博客,展示如何利用现代数据网格策略构建受治理的无服务器数据网格。该方案基于AWS无服务器架构,提供安全、可扩展的数据基础。文章详细说明了如何为生产级Agentic AI应用搭建数据网格。它涵盖了数据治理、访问控制和数据共享等关键环节。技巧AWS数据网格Agentic AI无服务器云服务推荐理由:想用AWS搞Agentic AI?这篇手把手教你搭数据网格,安全又省心。原文
00:57Philipp Schmid@_philschmidGoogle 在 Gemini 3.5 Flash 中上线了 computer use 功能,支持浏览器、移动端和桌面环境。开发者 Philipp Schmid 发布了一个快速入门教程,用单个脚本从终端安装 Android 模拟器。教程包含基础 agent 循环,通过 adb 接口控制手机,也支持远程设备连接(adb connect <ip>:5555)。类似模式可扩展到 iOS 的 simctl。技巧Gemini 3.5 FlashGoogleAndroidadb智能体推荐理由:Google 刚给 Gemini 3.5 Flash 加了 computer use,这份教程用一条命令就能在模拟器上跑 agent 控制手机,还支持远程和 iOS,很实用。原文
00:57AWS Machine Learning Blog@Aurelio DeSimone精选AWS发布了Chaplin开源方案,利用AI代理通过模型上下文协议(MCP)提供自助健康事件分析。Chaplin基于Amazon Bedrock,可自动聚合AWS Health事件并提供可操作建议。该方案支持自然语言查询,无需编写复杂代码即可洞察AWS资源健康状态。用户可快速部署并自定义MCP服务器来扩展分析能力。技巧Amazon BedrockChaplinMCP智能体AWS服务推荐理由:AWS出了个叫Chaplin的开源工具,用Bedrock的AI代理配合MCP协议,让你自然语言查AWS健康事件,不用写代码就能找到问题原因。原文
00:56AWS Machine Learning Blog@Nick Biso精选本文演示了如何在Amazon SageMaker AI上部署SeedVR2进行视频超分辨率。介绍了解决方案架构和具体部署步骤。通过性能对比展示了SeedVR2在视频放大质量和处理效率上的提升。技巧SeedVR2Amazon SageMaker AI超分辨率视频增强模型部署推荐理由:AWS教你用SeedVR2在SageMaker上给视频做超分辨率,有步骤有对比,想试试高清视频放大可以看看。原文
00:55AWS Machine Learning Blog@Andrea Gallo精选本文介绍如何在Amazon SageMaker AI上利用NVIDIA Blackwell架构优化训练配置。包括根据模型大小(1B到64B参数)选择合适精度格式,调整batch size和序列长度以利用Blackwell扩展内存,以及策略性应用激活检查点。通过P6-B200实例启动分布式训练,提供一套实用的训练调优框架。技巧Amazon SageMaker AINVIDIA BlackwellP6-B200实例训练优化编程助手5 个信源在谈推荐理由:AWS发了篇实战教程,教你用NVIDIA Blackwell在SageMaker上调优训练,从选精度到调batch size都讲清了,搞大模型训练的人别错过。原文
00:36Milvus@milvusio精选单个1-5分的RAG质量评分会隐藏严重问题:一个回答90%基于文档,但10%虚构核心参数就不可用,平均分仍显示4分。幻觉分布也不均匀,数值查找或多条件问题类型的幻觉率远高于平均,不按类型分桶就看不到偏差。优化答案相关性时,添加提示词“提供更完整背景”可能提升相关度但导致模型依赖参数知识,降低忠实度。更可靠的方法是声明级评估:将回答拆成原子事实,用NLI模型检查每个声明是否被检索内容支撑,计算接地率,并对关键参数设置硬性阻断。按问题类型分桶评分,Milvus可用标量字段直接过滤分析,不依赖额外报表管线。技巧RAGMilvus评估幻觉声明级评估推荐理由:如果你在用RAG做生产系统,这篇讲透了为什么平均分不靠谱,还给了按声明颗粒度和问题类型精准监测的方法,连Milvus怎么分桶都说了,很实用。原文
23:55Tw93@HiTw93Mole项目团队使用AI从Twitter和论坛帖子中收集并分类用户正面评论,构建了一面"爱之墙"并展示在mole.fit网站上。该墙包含5条回复、41个爱心和3852次查看,所有善意的留言都被收录。用户可以在网站上查看自己是否被提及。技巧MoleAI数据整理用户反馈社交媒体推荐理由:这个项目用AI从社交平台扒出所有夸Mole的留言,拼成一面故事墙,还能找到有没有你的身影原文
23:46OpenRouter@OpenRouterAIOpenRouter 发布新功能,允许用户通过两条命令(claude mcp add --transport http openrouter mcp.openrouter.ai/mcp 和 claude mcp login openrouter)在一分钟内完成模型的选择、定价、测试和集成。该功能基于 MCP(Model Context Protocol),支持所有主流代理(如 Claude)。用户可在 openrouter.ai/mcp 立即使用。技巧OpenRouterClaudeMCP智能体工具推荐理由:OpenRouter 搞了个骚操作,两行命令就能把模型接到 Claude 等代理里,一分钟搞定测试和定价,省去一堆配置。原文
22:57Viking@vikingmute推文介绍了ponytail项目和一个Vibe Coding提示词技巧,建议在提示词末尾加入“如果GitHub/npm上有成熟开源方案,直接复用”。该技巧基于DRY理念,能有效减少GPT等模型生成冗余代码的现象。该技巧特别适合新手避免over-engineering。技巧ponytailGPT提示词工程Vibe Coding编程助手推荐理由:给用GPT写代码的人:提示词末尾加‘复用开源方案’能防止AI重复造轮子,亲测有效。原文
22:39向阳乔木@vista8腾讯推出了一款专为Agent设计的邮箱服务,允许用户抢注邮箱名。注册后,用户会获得一段提示词,可将其发给Codex或其他Agent来完成命令行界面设置。该邮箱旨在简化Agent的通信与配置流程,无需手动编写脚本。目前该功能已开放注册,用户可通过评论区链接体验。技巧腾讯Agent邮箱Codex提示词工程推荐理由:腾讯出了个给Agent用的邮箱,注册后拿到提示词就能让Codex自动配好CLI,省得自己写命令,挺方便的。原文
22:00LangChain@LangChainAI精选LangChain 推文指出通用聊天适合一次性问答,答案出现即结束。专门智能体适合重复性、有固定形状的工作,使用相同工具和格式。智能体能记住线程可能遗忘的上下文,适合多次运行相同流程。技巧LangChain智能体提示词工程推荐理由:LangChain用一句话说清楚了选择原则:如果下次解释方式一样,就该用智能体,别放聊天里。原文
19:54Geek@geekbb精选一个轻量Python脚本让Codex CLI反复回答同一道糖果数学题,用于对比不同模型的表现。脚本可调整reasoning effort参数并观察效果。代码开源于GitHub,便于复现和扩展。技巧Codex CLIreasoning effortPython脚本糖果数学题推理测试推荐理由:想测不同模型对同一道题的推理差别?用这个脚本跑糖果题,还能调reasoning effort,很直观。原文
17:28berryxia@berryxia这篇帖子介绍了构建AI智能体的6个核心架构支柱和1个人机协同机制。MCP由Anthropic提出,作为通用标准让智能体即插即用外部工具。智能体循环包括感知→思考→行动→观察→重复的流程。单体与多智能体架构两种模式可灵活选择。智能体驱动的RAG动态路由查询并验证上下文。人机协同机制(HITL)在关键操作前插入人工检查点。技巧MCPAnthropic智能体智能体循环RAG10 个信源在谈推荐理由:想搭AI智能体但怕底层理论?这篇用7个点讲透架构,从MCP到记忆系统,普通开发者也能快速落地。原文
17:07腾讯混元 Tencent Hunyuan@TencentCloud城市大学一名学生使用WorkBuddy,仅通过输入文字就将环保想法转化为一款名为“farmer saving chickens”的冒险游戏。WorkBuddy是一款AI工具,无需编程即可快速构建可玩应用。该案例展示了AI如何降低游戏开发门槛。技巧WorkBuddy城市大学无代码游戏开发AI应用推荐理由:看看CityU学生怎么用WorkBuddy一句话就做出个游戏,太有意思了!原文
12:00Yangyi@Yangyixxxx用户分享使用AI学习《说文解字》的经验,指出AI能清晰解释“读若”和“反切”等音韵概念。AI从上古声、中古声到平上去入四声的演变,以及清浊声母导致阴阳平声的演化过程,都讲得十分清楚。用户建议通过多追问保持独立思考,可规避AI的幻觉。技巧说文解字读若反切音韵学古籍辅助推荐理由:有人试了用AI学《说文解字》的音韵,从反切到声调演变,讲得比百度清楚多了,还能追问防幻觉,值得试试。原文
11:54Geek@geekbbChatHub项目推出融合模式,允许一组模型并行作答,再由评审模型综合生成更优答案。该模式支持16家LLM提供商的免费额度,合计约每月17亿Token。用户需要逐个添加API key,项目暂不支持批量导入。技巧融合模式多模型并行免费额度API key评审模型推荐理由:这个项目能同时调用多个模型并行答题,再由评审模型挑最优,还能把各厂商免费额度凑一起用,每月17亿Token呢。原文
10:55Geek@geekbb一个开源项目整合了16家LLM提供商的免费额度,合计每月约17亿Token。其中Google AI Studio提供Gemini 2.5 Flash和Pro的免费API,速率限制高达1M tokens/min,无需信用卡。该工具可避免支付高额API费用,适合批量测试和轻量级应用。技巧Gemini 2.5 FlashGemini 2.5 ProGoogle AI Studio开源项目免费API额度推荐理由:把各大厂的免费额度集中起来用,尤其Google那1M tokens/min的免费API太香了,零成本搞推理。原文
10:54宝玉@doteydecode-codex 是一个开源项目,包含两个 Skills:codex-app-ref-refresh 用于解包已安装的 Codex.app(app.asar)到 ./ref 目录;deobfuscate-javascript 用于将 ref/webview/assets 中的 JS 反混淆为可读代码并输出到 ./restored。使用时需先确保本地安装 Codex App,然后依次执行两个 Skills,其中 deobfuscate-javascript 步骤需配合 /goal 参数才能还原大部分文件。项目地址在 GitHub,建议 fork 后自己测试。技巧Codexdecode-codex反编译JavaScript 反混淆编程助手推荐理由:如果你 token 多到没处花,又想研究闭源 coding agent 的内部代码,这个项目让你亲自动手反编译 Codex App,把混淆的 JS 变成人能读懂的代码。原文
10:25shao__meng@shao__meng精选Matt Pocock 在开源 Skills 系列中增加了新技能「loop-me」,目前处于 in-progress 阶段。该技能在多轮会话中利用当前目录作为有状态工作区,通过「拷问」方式将想法转化为可落地的 workflows/*.md 规格文件。loop-me 与已有的 grill-me 共享拷问纪律,但产出不同:grill-me 对齐任意计划,loop-me 只产出 workflows/*.md。其核心是识别用户生活中可预测的重复模式(职业节奏、早晨例行等),并主动发现用户未意识到的任务,从而委托给 AI agent。项目在 GitHub 上已有 165K star。技巧loop-meSkills智能体工作流提示词工程推荐理由:如果你总在做重复的杂事,这个新技能 loop-me 能帮你把流程写成规格,然后让 AI 接手,省下大把时间。原文
08:25Simon Willison’s Weblog(博客/媒体)精选Simon Willison 受 Mozilla 的 MDN MCP 服务启发,将 mdn/browser-compat-data 仓库中的浏览器兼容性数据转换为约 66MB 的 SQLite 数据库。他使用 Claude Code for Web (Opus 4.8) 生成了转换脚本,并用 Codex Desktop (GPT-5.5) 构建了一个 GitHub Actions 工作流,将数据库推送到独立的 db 分支。该数据库托管在 GitHub 上并设置了 CORS 头,用户可通过 Datasette Lite 在线浏览和查询。技巧MozillaMDNClaude CodeGPT-5.5GitHub Actions2 个信源在谈推荐理由:Simon 用 Claude 和 GPT 帮你把 MDN 浏览器数据转成了 SQLite,能直接用 Datasette Lite 在线查,超方便。原文
08:24AK@_akhaliq用户使用 GLM 5.2 模型在 hf-claude 框架下,为图像生成模型 krea-2-turbo 构建了一个 Gradio 交互界面。该工作流允许通过 Gradio 直接调用 krea-2-turbo 进行图像生成,无需复杂命令行操作。演示视频显示界面支持实时参数调整,如步数、引导尺度等。目前该项目已在 GitHub 上开源,提供了完整的代码和部署说明。技巧GLM 5.2hf-claudekrea-2-turboGradio工作流推荐理由:教你用 GLM 5.2 + hf-claude 给 krea-2-turbo 搭个 Gradio 界面,省去命令行繁琐,上手即用。原文
07:54宝玉@dotey作者分享处理播客访谈整理时细节遗漏的技巧:同时让AI生成2-3份稿子,挑选一份质量最好的作为底稿,再把其他稿子内容合并进来。这样既能避免遗漏,也能防止单次生成糟糕时追问无法补救。另外,对于长达3小时的播客,连续追问3次左右“还有什么细节需要补充”也能改善质量,但不如多稿合并方法高效。技巧提示词工程工作流AI写作整理技巧推荐理由:教你怎么用多稿合并法搞定AI整理长访谈,比单一追问更省心,写稿不漏细节。原文
07:25AK@_akhaliq开发者将GLM-5.2模型集成到hf-claude环境,并基于Gradio框架创建了面向Krea-2-Turbo的工作流。该工作流提供交互界面,简化了从模型调用到结果展示的流程。项目代码已在社交媒体分享,获得初步关注。技巧GLM-5.2hf-claudeKrea-2-TurboGradio工作流推荐理由:有人把GLM-5.2塞进hf-claude,做了个给Krea-2-Turbo用的Gradio界面,挺实用的。原文
06:22Ate-a-Pi@svpino精选Lena开源了一个RAG助手,用于导航航空公司政策,包含完整源代码和视频讲解。该应用使用LangChain构建检索管道,LangGraph管理对话状态,通过pgvector在Postgres中存储嵌入。项目还使用Terraform部署基础设施,索引文档以将答案锚定在源文本上。开发者可以从中学习具体的工程决策和实现细节。技巧LangChainLangGraphpgvectorRAG开源项目推荐理由:Lena把整个RAG应用的源码和讲解视频都开源了,用LangChain+LangGraph搭建,还用了pgvector和Terraform,想学RAG实战的可以直接拿走。原文
04:54Harrison Chase@hwchase17hwchase17 在 X 上分享了一个巧妙思路:用 tracing(追踪)来作为 AI 系统的 memory(记忆)。该推文获得 1461 次查看、7 个喜欢和 3 条回复。Strata 和 ChainZenit 等用户也参与了讨论。这种方法无需额外数据库,仅利用追踪日志即可实现上下文记忆。技巧hwchase17StrataChainZenit记忆追踪推荐理由:LangChain 创始人 hwchase17 分享了一个超聪明的做法——用 tracing 记录来当记忆用,省掉专门搭数据库的麻烦。原文