01:51Harrison Chase@hwchase17精选73°LangChain团队发布技术博客,详细介绍SmithDB的构建与运行。SmithDB是一个专门为agent traces设计的数据库,其所有持久数据存储在对象存储中。博客阐述了如何在这种存储上构建、压缩和查询全文搜索索引,并处理每个GET请求50–100ms的延迟。团队分享了在生产环境中运行SmithDB倒排索引(inverted index)的经验。技巧SmithDBLangChain智能体追踪全文搜索数据库推荐理由:LangChain团队手把手教你如何为agent traces造一个数据库,对象存储上做全文搜索还能压到50-100ms延迟,干货满满。原文
01:26LangChain@LangChainAILangChain 团队解决了在对象存储中构建全文搜索索引的挑战:每个 GET 请求耗时 50-100ms,且数据持久化在远程存储。他们介绍了 SmithDB 的倒排索引构造、压缩和查询方案,涉及批量写入、压缩策略以减少请求次数,以及针对高延迟的查询优化。这些方法在生产环境中已稳定运行。技巧LangChainSmithDB全文搜索对象存储倒排索引推荐理由:LangChain 分享了怎么在对象存储上搞全文搜索,延迟 50-100ms 的情况下还能压出来倒排索引,挺实在的实战经验。原文
01:15Hugging Face@huggingfaceHugging Face 通过直播演示如何在本机部署和运行开源 AI 模型。教程覆盖了从模型下载、环境配置到推理执行的完整流程,无需依赖云端服务。适合希望离线使用 LLaMA、Mistral 等模型的开发者。技巧Hugging Face开源模型本地部署推理推荐理由:想自己跑开源模型?Hugging Face 这场直播手把手教你在本地部署,省去云端费用和延迟。原文
00:57Philipp Schmid@_philschmidGoogle 在 Gemini 3.5 Flash 中上线了 computer use 功能,支持浏览器、移动端和桌面环境。开发者 Philipp Schmid 发布了一个快速入门教程,用单个脚本从终端安装 Android 模拟器。教程包含基础 agent 循环,通过 adb 接口控制手机,也支持远程设备连接(adb connect <ip>:5555)。类似模式可扩展到 iOS 的 simctl。技巧Gemini 3.5 FlashGoogleAndroidadb智能体推荐理由:Google 刚给 Gemini 3.5 Flash 加了 computer use,这份教程用一条命令就能在模拟器上跑 agent 控制手机,还支持远程和 iOS,很实用。原文
00:36Milvus@milvusio精选单个1-5分的RAG质量评分会隐藏严重问题:一个回答90%基于文档,但10%虚构核心参数就不可用,平均分仍显示4分。幻觉分布也不均匀,数值查找或多条件问题类型的幻觉率远高于平均,不按类型分桶就看不到偏差。优化答案相关性时,添加提示词“提供更完整背景”可能提升相关度但导致模型依赖参数知识,降低忠实度。更可靠的方法是声明级评估:将回答拆成原子事实,用NLI模型检查每个声明是否被检索内容支撑,计算接地率,并对关键参数设置硬性阻断。按问题类型分桶评分,Milvus可用标量字段直接过滤分析,不依赖额外报表管线。技巧RAGMilvus评估幻觉声明级评估推荐理由:如果你在用RAG做生产系统,这篇讲透了为什么平均分不靠谱,还给了按声明颗粒度和问题类型精准监测的方法,连Milvus怎么分桶都说了,很实用。原文
23:55Tw93@HiTw93Mole项目团队使用AI从Twitter和论坛帖子中收集并分类用户正面评论,构建了一面"爱之墙"并展示在mole.fit网站上。该墙包含5条回复、41个爱心和3852次查看,所有善意的留言都被收录。用户可以在网站上查看自己是否被提及。技巧MoleAI数据整理用户反馈社交媒体推荐理由:这个项目用AI从社交平台扒出所有夸Mole的留言,拼成一面故事墙,还能找到有没有你的身影原文
23:46OpenRouter@OpenRouterAIOpenRouter 发布新功能,允许用户通过两条命令(claude mcp add --transport http openrouter mcp.openrouter.ai/mcp 和 claude mcp login openrouter)在一分钟内完成模型的选择、定价、测试和集成。该功能基于 MCP(Model Context Protocol),支持所有主流代理(如 Claude)。用户可在 openrouter.ai/mcp 立即使用。技巧OpenRouterClaudeMCP智能体工具推荐理由:OpenRouter 搞了个骚操作,两行命令就能把模型接到 Claude 等代理里,一分钟搞定测试和定价,省去一堆配置。原文
22:57Viking@vikingmute推文介绍了ponytail项目和一个Vibe Coding提示词技巧,建议在提示词末尾加入“如果GitHub/npm上有成熟开源方案,直接复用”。该技巧基于DRY理念,能有效减少GPT等模型生成冗余代码的现象。该技巧特别适合新手避免over-engineering。技巧ponytailGPT提示词工程Vibe Coding编程助手推荐理由:给用GPT写代码的人:提示词末尾加‘复用开源方案’能防止AI重复造轮子,亲测有效。原文
22:39向阳乔木@vista8腾讯推出了一款专为Agent设计的邮箱服务,允许用户抢注邮箱名。注册后,用户会获得一段提示词,可将其发给Codex或其他Agent来完成命令行界面设置。该邮箱旨在简化Agent的通信与配置流程,无需手动编写脚本。目前该功能已开放注册,用户可通过评论区链接体验。技巧腾讯Agent邮箱Codex提示词工程推荐理由:腾讯出了个给Agent用的邮箱,注册后拿到提示词就能让Codex自动配好CLI,省得自己写命令,挺方便的。原文
22:00LangChain@LangChainAI精选LangChain 推文指出通用聊天适合一次性问答,答案出现即结束。专门智能体适合重复性、有固定形状的工作,使用相同工具和格式。智能体能记住线程可能遗忘的上下文,适合多次运行相同流程。技巧LangChain智能体提示词工程推荐理由:LangChain用一句话说清楚了选择原则:如果下次解释方式一样,就该用智能体,别放聊天里。原文
19:54Geek@geekbb精选一个轻量Python脚本让Codex CLI反复回答同一道糖果数学题,用于对比不同模型的表现。脚本可调整reasoning effort参数并观察效果。代码开源于GitHub,便于复现和扩展。技巧Codex CLIreasoning effortPython脚本糖果数学题推理测试推荐理由:想测不同模型对同一道题的推理差别?用这个脚本跑糖果题,还能调reasoning effort,很直观。原文
17:28berryxia@berryxia这篇帖子介绍了构建AI智能体的6个核心架构支柱和1个人机协同机制。MCP由Anthropic提出,作为通用标准让智能体即插即用外部工具。智能体循环包括感知→思考→行动→观察→重复的流程。单体与多智能体架构两种模式可灵活选择。智能体驱动的RAG动态路由查询并验证上下文。人机协同机制(HITL)在关键操作前插入人工检查点。技巧MCPAnthropic智能体智能体循环RAG10 个信源在谈推荐理由:想搭AI智能体但怕底层理论?这篇用7个点讲透架构,从MCP到记忆系统,普通开发者也能快速落地。原文
17:07腾讯混元 Tencent Hunyuan@TencentCloud城市大学一名学生使用WorkBuddy,仅通过输入文字就将环保想法转化为一款名为“farmer saving chickens”的冒险游戏。WorkBuddy是一款AI工具,无需编程即可快速构建可玩应用。该案例展示了AI如何降低游戏开发门槛。技巧WorkBuddy城市大学无代码游戏开发AI应用推荐理由:看看CityU学生怎么用WorkBuddy一句话就做出个游戏,太有意思了!原文
12:00Yangyi@Yangyixxxx用户分享使用AI学习《说文解字》的经验,指出AI能清晰解释“读若”和“反切”等音韵概念。AI从上古声、中古声到平上去入四声的演变,以及清浊声母导致阴阳平声的演化过程,都讲得十分清楚。用户建议通过多追问保持独立思考,可规避AI的幻觉。技巧说文解字读若反切音韵学古籍辅助推荐理由:有人试了用AI学《说文解字》的音韵,从反切到声调演变,讲得比百度清楚多了,还能追问防幻觉,值得试试。原文
11:54Geek@geekbbChatHub项目推出融合模式,允许一组模型并行作答,再由评审模型综合生成更优答案。该模式支持16家LLM提供商的免费额度,合计约每月17亿Token。用户需要逐个添加API key,项目暂不支持批量导入。技巧融合模式多模型并行免费额度API key评审模型推荐理由:这个项目能同时调用多个模型并行答题,再由评审模型挑最优,还能把各厂商免费额度凑一起用,每月17亿Token呢。原文
10:55Geek@geekbb一个开源项目整合了16家LLM提供商的免费额度,合计每月约17亿Token。其中Google AI Studio提供Gemini 2.5 Flash和Pro的免费API,速率限制高达1M tokens/min,无需信用卡。该工具可避免支付高额API费用,适合批量测试和轻量级应用。技巧Gemini 2.5 FlashGemini 2.5 ProGoogle AI Studio开源项目免费API额度推荐理由:把各大厂的免费额度集中起来用,尤其Google那1M tokens/min的免费API太香了,零成本搞推理。原文
10:54宝玉@doteydecode-codex 是一个开源项目,包含两个 Skills:codex-app-ref-refresh 用于解包已安装的 Codex.app(app.asar)到 ./ref 目录;deobfuscate-javascript 用于将 ref/webview/assets 中的 JS 反混淆为可读代码并输出到 ./restored。使用时需先确保本地安装 Codex App,然后依次执行两个 Skills,其中 deobfuscate-javascript 步骤需配合 /goal 参数才能还原大部分文件。项目地址在 GitHub,建议 fork 后自己测试。技巧Codexdecode-codex反编译JavaScript 反混淆编程助手推荐理由:如果你 token 多到没处花,又想研究闭源 coding agent 的内部代码,这个项目让你亲自动手反编译 Codex App,把混淆的 JS 变成人能读懂的代码。原文
10:25shao__meng@shao__meng精选Matt Pocock 在开源 Skills 系列中增加了新技能「loop-me」,目前处于 in-progress 阶段。该技能在多轮会话中利用当前目录作为有状态工作区,通过「拷问」方式将想法转化为可落地的 workflows/*.md 规格文件。loop-me 与已有的 grill-me 共享拷问纪律,但产出不同:grill-me 对齐任意计划,loop-me 只产出 workflows/*.md。其核心是识别用户生活中可预测的重复模式(职业节奏、早晨例行等),并主动发现用户未意识到的任务,从而委托给 AI agent。项目在 GitHub 上已有 165K star。技巧loop-meSkills智能体工作流提示词工程推荐理由:如果你总在做重复的杂事,这个新技能 loop-me 能帮你把流程写成规格,然后让 AI 接手,省下大把时间。原文
08:24AK@_akhaliq用户使用 GLM 5.2 模型在 hf-claude 框架下,为图像生成模型 krea-2-turbo 构建了一个 Gradio 交互界面。该工作流允许通过 Gradio 直接调用 krea-2-turbo 进行图像生成,无需复杂命令行操作。演示视频显示界面支持实时参数调整,如步数、引导尺度等。目前该项目已在 GitHub 上开源,提供了完整的代码和部署说明。技巧GLM 5.2hf-claudekrea-2-turboGradio工作流推荐理由:教你用 GLM 5.2 + hf-claude 给 krea-2-turbo 搭个 Gradio 界面,省去命令行繁琐,上手即用。原文
07:54宝玉@dotey作者分享处理播客访谈整理时细节遗漏的技巧:同时让AI生成2-3份稿子,挑选一份质量最好的作为底稿,再把其他稿子内容合并进来。这样既能避免遗漏,也能防止单次生成糟糕时追问无法补救。另外,对于长达3小时的播客,连续追问3次左右“还有什么细节需要补充”也能改善质量,但不如多稿合并方法高效。技巧提示词工程工作流AI写作整理技巧推荐理由:教你怎么用多稿合并法搞定AI整理长访谈,比单一追问更省心,写稿不漏细节。原文
07:25AK@_akhaliq开发者将GLM-5.2模型集成到hf-claude环境,并基于Gradio框架创建了面向Krea-2-Turbo的工作流。该工作流提供交互界面,简化了从模型调用到结果展示的流程。项目代码已在社交媒体分享,获得初步关注。技巧GLM-5.2hf-claudeKrea-2-TurboGradio工作流推荐理由:有人把GLM-5.2塞进hf-claude,做了个给Krea-2-Turbo用的Gradio界面,挺实用的。原文
06:22Ate-a-Pi@svpino精选Lena开源了一个RAG助手,用于导航航空公司政策,包含完整源代码和视频讲解。该应用使用LangChain构建检索管道,LangGraph管理对话状态,通过pgvector在Postgres中存储嵌入。项目还使用Terraform部署基础设施,索引文档以将答案锚定在源文本上。开发者可以从中学习具体的工程决策和实现细节。技巧LangChainLangGraphpgvectorRAG开源项目推荐理由:Lena把整个RAG应用的源码和讲解视频都开源了,用LangChain+LangGraph搭建,还用了pgvector和Terraform,想学RAG实战的可以直接拿走。原文
04:54Harrison Chase@hwchase17hwchase17 在 X 上分享了一个巧妙思路:用 tracing(追踪)来作为 AI 系统的 memory(记忆)。该推文获得 1461 次查看、7 个喜欢和 3 条回复。Strata 和 ChainZenit 等用户也参与了讨论。这种方法无需额外数据库,仅利用追踪日志即可实现上下文记忆。技巧hwchase17StrataChainZenit记忆追踪推荐理由:LangChain 创始人 hwchase17 分享了一个超聪明的做法——用 tracing 记录来当记忆用,省掉专门搭数据库的麻烦。原文
03:54Harrison Chase@hwchase17LangSmith Engine 支持将智能体轨迹追踪到 LangSmith,通过后台分析轨迹自动生成记忆更新建议。更新后的记忆存储在 Context Hub 中,实现类似睡眠时间计算(sleep time compute)的离线记忆优化。该方法由 Harrison Chase 在教程中演示,视频地址附于推文。技巧LangSmith智能体记忆工作流推荐理由:Harrison Chase 教你用 LangSmith Engine 让智能体在后台自动更新记忆,看完就能上手操作。原文
03:42Harrison Chase@hwchase17文章介绍了智能体记忆管理的三步流程:首先运行智能体,然后分析其运行轨迹,最后基于分析结果更新记忆。该方法由Jake Broekhuizen分享,适用于提升智能体在多次交互中的表现。流程强调了对历史行为的自动化反思和记忆调整,是构建持久性智能体的实用技巧。技巧智能体Agent记忆管理工作流推荐理由:Jake Broekhuizen分享了一个超实用的Agent记忆循环:跑Agent → 分析记录 → 更新记忆。简单三步,自己也能复现。原文
02:44Notion@NotionHQ精选Notion 宣布与 Cursor 集成,用户可在 Notion 中启动任务,然后跳转到 Cursor 继续。每个会话都会创建一个 Cursor Cloud Agent,保留用户的账户环境、权限和连接。Agent 可让用户在 Cursor 中从上次中断处无缝接续工作。该功能旨在提升跨工具协作效率。技巧NotionCursorCursor Cloud Agent工作流集成6 个信源在谈推荐理由:Notion 和 Cursor 打通了,你可以先在 Notion 里写草稿,再跳到 Cursor 让 Agent 接着干活,环境权限都给你留着。原文
02:42Notion@NotionHQNotion团队将客户bug或功能请求分配给Cursor agent。agent读取任务简报,在代码库中工作并自动打开PR。该流程让非工程成员也能交接实际工程工作。Cursor作为AI编程助手,可理解上下文并生成代码变更。这展示了AI agent在协作中的实际应用。技巧CursorNotion编程助手工作流智能体9 个信源在谈推荐理由:Notion团队用Cursor自动处理bug和功能请求,连PR都自动开,省掉了手动交接的功夫,值得试试。原文
02:41DeepLearning.AI@DeepLearningAIDeepLearning.AI 发起7天语音AI构建挑战,教你用编码代理自动提醒而不必盯着终端。活动截止日期为6月30日。参与者将学习如何让AI主动呼叫你,解放监控终端的负担。技巧DeepLearning.AI语音AI编码代理挑战赛推荐理由:DeepLearning.AI 搞了个7天挑战,教你用语音AI让编码代理自动呼叫你,不用死守终端。活动到6月30日截止,想学赶紧上车。原文
01:31LangChain@LangChainAI精选Jake Broekhuizen在12分钟视频中演示如何让智能体通过记忆更新来改进表现。他介绍使用LangSmith Engine发现运行问题,并将记忆写入Context Hub。这种方法能让智能体在多次运行之间持续优化,而非仅留下痕迹。适合需要在大规模部署中管理智能体记忆的开发者。技巧LangChainLangSmith智能体记忆推荐理由:想知道怎么让智能体不反复犯同样的错?看LangChain这12分钟视频,教你用LangSmith Engine和Context Hub实现跨运行学习。原文
01:28Guillermo Rauch@rauchgVercel AI Gateway 的仪表盘自动显示了 tokens 和 uptime 的恢复数据,效果惊人。用户从 Anthropic API 切换到 Vercel AI Gateway 后,获得了更好的可靠性。这些数据无需手动分析,直接展示在界面上。技巧VercelAI GatewayAnthropic APIAPI网关可靠性推荐理由:Vercel AI Gateway 自动显示 tokens 和 uptime 数据,切换后可靠性更高,比你手动算省事多了。原文
01:25elvis@omarsar0精选作者完全改用语音而非文字输入与AI代理交互,发现音频描述越详细、越长,代理结果越好。他还开发了屏幕录制、截图、追踪鼠标动作和语音注释功能,帮助代理处理设计和精确开发任务。多模态提示(语音+屏幕+动作)显著提升了代理的可靠性,尽管消耗更多token。作者将这些经验制作为可复用的命令集,插入循环后效果显著改善。技巧智能体多模态提示词工程语音交互推荐理由:有人分享用语音+屏幕录制和多模态提示跟AI代理唠嗑,提示越啰嗦结果越靠谱,还教你怎么录屏加注释,值得试试原文
00:48LangChain@LangChainAI精选LangChain 创始人 Harrison Chase 将于6月24日举办网络研讨会“The Agent Development Lifecycle 101”,阐述构建可靠智能体的五步循环:构建、测试、部署、监控、改进。他强调了首次发布仅是开始,需要可重复的迭代流程来提升智能体性能。该研讨会面向所有构建智能体的团队,提供从工具、上下文、提示到评估的全流程指导。技巧LangChainHarrison Chase智能体开发工作流推荐理由:Harrison Chase 亲自讲怎么从零搭出靠谱的AI智能体,5步循环+真实案例,做Agent的别错过。原文
00:47berryxia@berryxia精选Matt Pocock发布/loop-me技能,要求用户先彻底审视日常工作,找出值得委托给AI的重复循环。它采用“grilling”面试法,一次只问一个问题并附带推荐答案,直到模糊点消除。最终产出清晰的workflows/.md规范文件,使实施者无需额外提问即可执行。目的是降低认知负荷,聚焦高价值决策。技巧Matt Pocock/loop-me工作流自动化开发者工具提示词工程推荐理由:Matt Pocock做了个/loop-me,不是直接替干活,而是帮你把流程理得清清楚楚,AI照着做就行,省心省力。原文
00:29向阳乔木@vista8精选洪定坤提出用AI生成可交互原型替代PRD,提前暴露分歧。AI开发系统化流程包括AI写Spec、功能实现、Browser Use验证、自动提交上线。Harness基建通过上下文工程、架构约束、团队知识Memory和技术债梳理,将可交付性从40~60分提升至80分。技巧字节火山引擎洪定坤原型驱动开发AI开发工作流Harness基建推荐理由:字节火山引擎洪定坤分享了三个提升AI开发效率的方法,尤其Harness基建能帮你把交付质量从及格提到优秀。原文
00:15Milvus@milvusio精选Milvus团队指出LLM在RAG中频繁引用了不支持的来源。引文失败分为两类:忠实性错误(生成内容与检索文档不符,如模型声称150W功耗但文档只说低功耗)和引文准确性错误(元数据映射错误、缺失引用、幽灵引用、弱支持引用、过度引用)。其中幽灵引用常因索引重建后ID过期导致。修复方案因错误类型而异:忠实性问题调整生成层约束或基座模型,引文准确性问题需工程层修复元数据管理。技巧RAG引文忠实性检索增强生成Milvus推荐理由:别总怪模型了,很多引文错误出在工程层。这篇文章帮你分清五种引文故障,对症下药。原文
23:40Geek@geekbb精选Pi Coding Agent 的 Web UI 采用双进程架构,会话守护进程与 Web 服务分离,确保 Agent 会话在服务器端持久运行。即使关闭浏览器或重启前端服务,会话也不会中断。该方案支持跨设备监督桌面和服务器上的 AI 编码 Agent,适合需要长期稳定运行编码任务的场景。技巧Pi Coding AgentWeb UI双进程架构持久化运行编程助手推荐理由:Pi Coding Agent 的 Web UI 让你关掉浏览器后编码任务还在服务器跑,跨设备也能接着监督,很实用。原文
22:46LangChain@LangChainAI精选Jeff Barg在Interrupt会议上透露,Clay每月运行3.5亿个GTM智能体。他指出,缓存可将LLM调用成本降低高达70%。限制工具调用范围不仅能节省成本,还能提升输出质量。在多租户负载下,引入公平队列机制至关重要。技巧ClayGTM agentsLLM成本缓存工具调用推荐理由:做AI智能体上线的小伙伴必看,Clay的AI负责人亲自讲了怎么降本70%和优化队列,干货12分钟。原文
18:32AI Will@FinanceYF5传统AI使用方式是一问一答、改完再问,效率低下。顶尖AI工程师设计自动化循环,让循环去提示AI。这种方法将用户从引擎角色解放出来,让AI自主迭代。通过循环设计,可以减少人工干预,大幅提升生产力。技巧提示词工程工作流自动化AI效率推荐理由:别再做人工提示苦力了,学学工程师怎么用循环驱动AI,效率翻倍。原文
18:27AI Will@FinanceYF5Thariq 完全没碰视频剪辑软件,而是让 Claude 写代码并调用多个工具完成编辑。Claude 使用了转录服务、FFmpeg 做音视频处理、Figma MCP 做调色、Remotion UI 制作界面并完成渲染。整个过程由 AI 编程生成复杂脚本,替代传统剪辑工具。技巧ClaudeFigma MCPRemotionFFmpeg视频生成1 个信源在谈推荐理由:看看人家怎么用 Claude 写代码搞定视频剪辑,不用碰任何剪辑软件,全程 AI 自动化。原文
17:29shao__meng@shao__meng精选字节跳动发布豆包2.1系列模型,豆包2.1 Pro在Coding和Agent能力上有显著提升,VLM能力介于Claude Opus 4.6和4.8之间。作者使用TRAE Work测试其前端设计图还原能力,模型会先思考规划再分步骤实现,通过本地预览和视觉验证确保质量。最终输出包含自适应布局和实际配图,而非仅占位符,交互和细节还原到位。技巧豆包2.1 ProTRAE Work字节跳动前端设计编程助手推荐理由:有人拿TRAE Work测了豆包2.1 Pro,前端的视觉还原和配图能力很惊艳,做设计稿转代码可以试试。原文