全部 AI 动态 · AI 热点

6月26日

01:51

Harrison Chase@hwchase17

精选73°

LangChain团队发布技术博客，详细介绍SmithDB的构建与运行。SmithDB是一个专门为agent traces设计的数据库，其所有持久数据存储在对象存储中。博客阐述了如何在这种存储上构建、压缩和查询全文搜索索引，并处理每个GET请求50–100ms的延迟。团队分享了在生产环境中运行SmithDB倒排索引（inverted index）的经验。

技巧 SmithDB LangChain 智能体追踪全文搜索数据库

推荐理由：LangChain团队手把手教你如何为agent traces造一个数据库，对象存储上做全文搜索还能压到50-100ms延迟，干货满满。

原文

01:26

LangChain@LangChainAI

LangChain 团队解决了在对象存储中构建全文搜索索引的挑战：每个 GET 请求耗时 50-100ms，且数据持久化在远程存储。他们介绍了 SmithDB 的倒排索引构造、压缩和查询方案，涉及批量写入、压缩策略以减少请求次数，以及针对高延迟的查询优化。这些方法在生产环境中已稳定运行。

技巧 LangChain SmithDB 全文搜索对象存储倒排索引

推荐理由：LangChain 分享了怎么在对象存储上搞全文搜索，延迟 50-100ms 的情况下还能压出来倒排索引，挺实在的实战经验。

原文

01:15

Hugging Face@huggingface

Hugging Face 通过直播演示如何在本机部署和运行开源 AI 模型。教程覆盖了从模型下载、环境配置到推理执行的完整流程，无需依赖云端服务。适合希望离线使用 LLaMA、Mistral 等模型的开发者。

技巧 Hugging Face 开源模型本地部署推理

推荐理由：想自己跑开源模型？Hugging Face 这场直播手把手教你在本地部署，省去云端费用和延迟。

原文

00:57

Philipp Schmid@_philschmid

Google 在 Gemini 3.5 Flash 中上线了 computer use 功能，支持浏览器、移动端和桌面环境。开发者 Philipp Schmid 发布了一个快速入门教程，用单个脚本从终端安装 Android 模拟器。教程包含基础 agent 循环，通过 adb 接口控制手机，也支持远程设备连接（adb connect <ip>:5555）。类似模式可扩展到 iOS 的 simctl。

技巧 Gemini 3.5 Flash Google Android adb 智能体

推荐理由：Google 刚给 Gemini 3.5 Flash 加了 computer use，这份教程用一条命令就能在模拟器上跑 agent 控制手机，还支持远程和 iOS，很实用。

原文

00:36

Milvus@milvusio

精选

单个1-5分的RAG质量评分会隐藏严重问题：一个回答90%基于文档，但10%虚构核心参数就不可用，平均分仍显示4分。幻觉分布也不均匀，数值查找或多条件问题类型的幻觉率远高于平均，不按类型分桶就看不到偏差。优化答案相关性时，添加提示词“提供更完整背景”可能提升相关度但导致模型依赖参数知识，降低忠实度。更可靠的方法是声明级评估：将回答拆成原子事实，用NLI模型检查每个声明是否被检索内容支撑，计算接地率，并对关键参数设置硬性阻断。按问题类型分桶评分，Milvus可用标量字段直接过滤分析，不依赖额外报表管线。

技巧 RAG Milvus 评估幻觉声明级评估

推荐理由：如果你在用RAG做生产系统，这篇讲透了为什么平均分不靠谱，还给了按声明颗粒度和问题类型精准监测的方法，连Milvus怎么分桶都说了，很实用。

原文

6月25日

23:55

Tw93@HiTw93

Mole项目团队使用AI从Twitter和论坛帖子中收集并分类用户正面评论，构建了一面"爱之墙"并展示在mole.fit网站上。该墙包含5条回复、41个爱心和3852次查看，所有善意的留言都被收录。用户可以在网站上查看自己是否被提及。

技巧 Mole AI数据整理用户反馈社交媒体

推荐理由：这个项目用AI从社交平台扒出所有夸Mole的留言，拼成一面故事墙，还能找到有没有你的身影

原文

23:46

OpenRouter@OpenRouterAI

OpenRouter 发布新功能，允许用户通过两条命令（claude mcp add --transport http openrouter mcp.openrouter.ai/mcp 和 claude mcp login openrouter）在一分钟内完成模型的选择、定价、测试和集成。该功能基于 MCP（Model Context Protocol），支持所有主流代理（如 Claude）。用户可在 openrouter.ai/mcp 立即使用。

技巧 OpenRouter Claude MCP 智能体工具

推荐理由：OpenRouter 搞了个骚操作，两行命令就能把模型接到 Claude 等代理里，一分钟搞定测试和定价，省去一堆配置。

原文

22:57

Viking@vikingmute

推文介绍了ponytail项目和一个Vibe Coding提示词技巧，建议在提示词末尾加入“如果GitHub/npm上有成熟开源方案，直接复用”。该技巧基于DRY理念，能有效减少GPT等模型生成冗余代码的现象。该技巧特别适合新手避免over-engineering。

技巧 ponytail GPT 提示词工程 Vibe Coding 编程助手

推荐理由：给用GPT写代码的人：提示词末尾加‘复用开源方案’能防止AI重复造轮子，亲测有效。

原文

22:39

向阳乔木@vista8

腾讯推出了一款专为Agent设计的邮箱服务，允许用户抢注邮箱名。注册后，用户会获得一段提示词，可将其发给Codex或其他Agent来完成命令行界面设置。该邮箱旨在简化Agent的通信与配置流程，无需手动编写脚本。目前该功能已开放注册，用户可通过评论区链接体验。

技巧腾讯 Agent 邮箱 Codex 提示词工程

推荐理由：腾讯出了个给Agent用的邮箱，注册后拿到提示词就能让Codex自动配好CLI，省得自己写命令，挺方便的。

原文

22:00

LangChain@LangChainAI

精选

LangChain 推文指出通用聊天适合一次性问答，答案出现即结束。专门智能体适合重复性、有固定形状的工作，使用相同工具和格式。智能体能记住线程可能遗忘的上下文，适合多次运行相同流程。

技巧 LangChain 智能体提示词工程

推荐理由：LangChain用一句话说清楚了选择原则：如果下次解释方式一样，就该用智能体，别放聊天里。

原文

19:54

Geek@geekbb

精选

一个轻量Python脚本让Codex CLI反复回答同一道糖果数学题，用于对比不同模型的表现。脚本可调整reasoning effort参数并观察效果。代码开源于GitHub，便于复现和扩展。

技巧 Codex CLI reasoning effort Python脚本糖果数学题推理测试

推荐理由：想测不同模型对同一道题的推理差别？用这个脚本跑糖果题，还能调reasoning effort，很直观。

原文

17:28

berryxia@berryxia

这篇帖子介绍了构建AI智能体的6个核心架构支柱和1个人机协同机制。MCP由Anthropic提出，作为通用标准让智能体即插即用外部工具。智能体循环包括感知→思考→行动→观察→重复的流程。单体与多智能体架构两种模式可灵活选择。智能体驱动的RAG动态路由查询并验证上下文。人机协同机制（HITL）在关键操作前插入人工检查点。

技巧 MCP Anthropic 智能体智能体循环 RAG

推荐理由：想搭AI智能体但怕底层理论？这篇用7个点讲透架构，从MCP到记忆系统，普通开发者也能快速落地。

原文

17:07

腾讯混元 Tencent Hunyuan@TencentCloud

城市大学一名学生使用WorkBuddy，仅通过输入文字就将环保想法转化为一款名为“farmer saving chickens”的冒险游戏。WorkBuddy是一款AI工具，无需编程即可快速构建可玩应用。该案例展示了AI如何降低游戏开发门槛。

技巧 WorkBuddy 城市大学无代码游戏开发 AI应用

推荐理由：看看CityU学生怎么用WorkBuddy一句话就做出个游戏，太有意思了！

原文

12:00

Yangyi@Yangyixxxx

用户分享使用AI学习《说文解字》的经验，指出AI能清晰解释“读若”和“反切”等音韵概念。AI从上古声、中古声到平上去入四声的演变，以及清浊声母导致阴阳平声的演化过程，都讲得十分清楚。用户建议通过多追问保持独立思考，可规避AI的幻觉。

技巧说文解字读若反切音韵学古籍辅助

推荐理由：有人试了用AI学《说文解字》的音韵，从反切到声调演变，讲得比百度清楚多了，还能追问防幻觉，值得试试。

原文

11:54

Geek@geekbb

ChatHub项目推出融合模式，允许一组模型并行作答，再由评审模型综合生成更优答案。该模式支持16家LLM提供商的免费额度，合计约每月17亿Token。用户需要逐个添加API key，项目暂不支持批量导入。

技巧融合模式多模型并行免费额度 API key 评审模型

推荐理由：这个项目能同时调用多个模型并行答题，再由评审模型挑最优，还能把各厂商免费额度凑一起用，每月17亿Token呢。

原文

10:55

Geek@geekbb

一个开源项目整合了16家LLM提供商的免费额度，合计每月约17亿Token。其中Google AI Studio提供Gemini 2.5 Flash和Pro的免费API，速率限制高达1M tokens/min，无需信用卡。该工具可避免支付高额API费用，适合批量测试和轻量级应用。

技巧 Gemini 2.5 Flash Gemini 2.5 Pro Google AI Studio 开源项目免费API额度

推荐理由：把各大厂的免费额度集中起来用，尤其Google那1M tokens/min的免费API太香了，零成本搞推理。

原文

10:54

宝玉@dotey

decode-codex 是一个开源项目，包含两个 Skills：codex-app-ref-refresh 用于解包已安装的 Codex.app（app.asar）到 ./ref 目录；deobfuscate-javascript 用于将 ref/webview/assets 中的 JS 反混淆为可读代码并输出到 ./restored。使用时需先确保本地安装 Codex App，然后依次执行两个 Skills，其中 deobfuscate-javascript 步骤需配合 /goal 参数才能还原大部分文件。项目地址在 GitHub，建议 fork 后自己测试。

技巧 Codex decode-codex 反编译 JavaScript 反混淆编程助手

推荐理由：如果你 token 多到没处花，又想研究闭源 coding agent 的内部代码，这个项目让你亲自动手反编译 Codex App，把混淆的 JS 变成人能读懂的代码。

原文

10:25

shao__meng@shao__meng

精选

Matt Pocock 在开源 Skills 系列中增加了新技能「loop-me」，目前处于 in-progress 阶段。该技能在多轮会话中利用当前目录作为有状态工作区，通过「拷问」方式将想法转化为可落地的 workflows/*.md 规格文件。loop-me 与已有的 grill-me 共享拷问纪律，但产出不同：grill-me 对齐任意计划，loop-me 只产出 workflows/*.md。其核心是识别用户生活中可预测的重复模式（职业节奏、早晨例行等），并主动发现用户未意识到的任务，从而委托给 AI agent。项目在 GitHub 上已有 165K star。

技巧 loop-me Skills 智能体工作流提示词工程

推荐理由：如果你总在做重复的杂事，这个新技能 loop-me 能帮你把流程写成规格，然后让 AI 接手，省下大把时间。

原文

08:24

AK@_akhaliq

用户使用 GLM 5.2 模型在 hf-claude 框架下，为图像生成模型 krea-2-turbo 构建了一个 Gradio 交互界面。该工作流允许通过 Gradio 直接调用 krea-2-turbo 进行图像生成，无需复杂命令行操作。演示视频显示界面支持实时参数调整，如步数、引导尺度等。目前该项目已在 GitHub 上开源，提供了完整的代码和部署说明。

技巧 GLM 5.2 hf-claude krea-2-turbo Gradio 工作流

推荐理由：教你用 GLM 5.2 + hf-claude 给 krea-2-turbo 搭个 Gradio 界面，省去命令行繁琐，上手即用。

原文

07:54

宝玉@dotey

作者分享处理播客访谈整理时细节遗漏的技巧：同时让AI生成2-3份稿子，挑选一份质量最好的作为底稿，再把其他稿子内容合并进来。这样既能避免遗漏，也能防止单次生成糟糕时追问无法补救。另外，对于长达3小时的播客，连续追问3次左右“还有什么细节需要补充”也能改善质量，但不如多稿合并方法高效。

技巧提示词工程工作流 AI写作整理技巧

推荐理由：教你怎么用多稿合并法搞定AI整理长访谈，比单一追问更省心，写稿不漏细节。

原文

07:25

AK@_akhaliq

开发者将GLM-5.2模型集成到hf-claude环境，并基于Gradio框架创建了面向Krea-2-Turbo的工作流。该工作流提供交互界面，简化了从模型调用到结果展示的流程。项目代码已在社交媒体分享，获得初步关注。

技巧 GLM-5.2 hf-claude Krea-2-Turbo Gradio 工作流

推荐理由：有人把GLM-5.2塞进hf-claude，做了个给Krea-2-Turbo用的Gradio界面，挺实用的。

原文

06:22

Ate-a-Pi@svpino

精选

Lena开源了一个RAG助手，用于导航航空公司政策，包含完整源代码和视频讲解。该应用使用LangChain构建检索管道，LangGraph管理对话状态，通过pgvector在Postgres中存储嵌入。项目还使用Terraform部署基础设施，索引文档以将答案锚定在源文本上。开发者可以从中学习具体的工程决策和实现细节。

技巧 LangChain LangGraph pgvector RAG 开源项目

推荐理由：Lena把整个RAG应用的源码和讲解视频都开源了，用LangChain+LangGraph搭建，还用了pgvector和Terraform，想学RAG实战的可以直接拿走。

原文

04:54

Harrison Chase@hwchase17

hwchase17 在 X 上分享了一个巧妙思路：用 tracing（追踪）来作为 AI 系统的 memory（记忆）。该推文获得 1461 次查看、7 个喜欢和 3 条回复。Strata 和 ChainZenit 等用户也参与了讨论。这种方法无需额外数据库，仅利用追踪日志即可实现上下文记忆。

技巧 hwchase17 Strata ChainZenit 记忆追踪

推荐理由：LangChain 创始人 hwchase17 分享了一个超聪明的做法——用 tracing 记录来当记忆用，省掉专门搭数据库的麻烦。

原文

03:54

Harrison Chase@hwchase17

LangSmith Engine 支持将智能体轨迹追踪到 LangSmith，通过后台分析轨迹自动生成记忆更新建议。更新后的记忆存储在 Context Hub 中，实现类似睡眠时间计算（sleep time compute）的离线记忆优化。该方法由 Harrison Chase 在教程中演示，视频地址附于推文。

技巧 LangSmith 智能体记忆工作流

推荐理由：Harrison Chase 教你用 LangSmith Engine 让智能体在后台自动更新记忆，看完就能上手操作。

原文

03:42

Harrison Chase@hwchase17

文章介绍了智能体记忆管理的三步流程：首先运行智能体，然后分析其运行轨迹，最后基于分析结果更新记忆。该方法由Jake Broekhuizen分享，适用于提升智能体在多次交互中的表现。流程强调了对历史行为的自动化反思和记忆调整，是构建持久性智能体的实用技巧。

技巧智能体 Agent 记忆管理工作流

推荐理由：Jake Broekhuizen分享了一个超实用的Agent记忆循环：跑Agent → 分析记录 → 更新记忆。简单三步，自己也能复现。

原文

02:44

Notion@NotionHQ

精选

Notion 宣布与 Cursor 集成，用户可在 Notion 中启动任务，然后跳转到 Cursor 继续。每个会话都会创建一个 Cursor Cloud Agent，保留用户的账户环境、权限和连接。Agent 可让用户在 Cursor 中从上次中断处无缝接续工作。该功能旨在提升跨工具协作效率。

技巧 Notion Cursor Cursor Cloud Agent 工作流集成

推荐理由：Notion 和 Cursor 打通了，你可以先在 Notion 里写草稿，再跳到 Cursor 让 Agent 接着干活，环境权限都给你留着。

原文

02:42

Notion@NotionHQ

Notion团队将客户bug或功能请求分配给Cursor agent。agent读取任务简报，在代码库中工作并自动打开PR。该流程让非工程成员也能交接实际工程工作。Cursor作为AI编程助手，可理解上下文并生成代码变更。这展示了AI agent在协作中的实际应用。

技巧 Cursor Notion 编程助手工作流智能体

推荐理由：Notion团队用Cursor自动处理bug和功能请求，连PR都自动开，省掉了手动交接的功夫，值得试试。

原文

02:41

DeepLearning.AI@DeepLearningAI

DeepLearning.AI 发起7天语音AI构建挑战，教你用编码代理自动提醒而不必盯着终端。活动截止日期为6月30日。参与者将学习如何让AI主动呼叫你，解放监控终端的负担。

技巧 DeepLearning.AI 语音AI 编码代理挑战赛

推荐理由：DeepLearning.AI 搞了个7天挑战，教你用语音AI让编码代理自动呼叫你，不用死守终端。活动到6月30日截止，想学赶紧上车。

原文

01:31

LangChain@LangChainAI

精选

Jake Broekhuizen在12分钟视频中演示如何让智能体通过记忆更新来改进表现。他介绍使用LangSmith Engine发现运行问题，并将记忆写入Context Hub。这种方法能让智能体在多次运行之间持续优化，而非仅留下痕迹。适合需要在大规模部署中管理智能体记忆的开发者。

技巧 LangChain LangSmith 智能体记忆

推荐理由：想知道怎么让智能体不反复犯同样的错？看LangChain这12分钟视频，教你用LangSmith Engine和Context Hub实现跨运行学习。

原文

01:28

Guillermo Rauch@rauchg

Vercel AI Gateway 的仪表盘自动显示了 tokens 和 uptime 的恢复数据，效果惊人。用户从 Anthropic API 切换到 Vercel AI Gateway 后，获得了更好的可靠性。这些数据无需手动分析，直接展示在界面上。

技巧 Vercel AI Gateway Anthropic API API网关可靠性

推荐理由：Vercel AI Gateway 自动显示 tokens 和 uptime 数据，切换后可靠性更高，比你手动算省事多了。

原文

01:25

elvis@omarsar0

精选

作者完全改用语音而非文字输入与AI代理交互，发现音频描述越详细、越长，代理结果越好。他还开发了屏幕录制、截图、追踪鼠标动作和语音注释功能，帮助代理处理设计和精确开发任务。多模态提示（语音+屏幕+动作）显著提升了代理的可靠性，尽管消耗更多token。作者将这些经验制作为可复用的命令集，插入循环后效果显著改善。

技巧智能体多模态提示词工程语音交互

推荐理由：有人分享用语音+屏幕录制和多模态提示跟AI代理唠嗑，提示越啰嗦结果越靠谱，还教你怎么录屏加注释，值得试试

原文

00:48

LangChain@LangChainAI

精选

LangChain 创始人 Harrison Chase 将于6月24日举办网络研讨会“The Agent Development Lifecycle 101”，阐述构建可靠智能体的五步循环：构建、测试、部署、监控、改进。他强调了首次发布仅是开始，需要可重复的迭代流程来提升智能体性能。该研讨会面向所有构建智能体的团队，提供从工具、上下文、提示到评估的全流程指导。

技巧 LangChain Harrison Chase 智能体开发工作流

推荐理由：Harrison Chase 亲自讲怎么从零搭出靠谱的AI智能体，5步循环+真实案例，做Agent的别错过。

原文

00:47

berryxia@berryxia

精选

Matt Pocock发布/loop-me技能，要求用户先彻底审视日常工作，找出值得委托给AI的重复循环。它采用“grilling”面试法，一次只问一个问题并附带推荐答案，直到模糊点消除。最终产出清晰的workflows/.md规范文件，使实施者无需额外提问即可执行。目的是降低认知负荷，聚焦高价值决策。

技巧 Matt Pocock /loop-me 工作流自动化开发者工具提示词工程

推荐理由：Matt Pocock做了个/loop-me，不是直接替干活，而是帮你把流程理得清清楚楚，AI照着做就行，省心省力。

原文

00:29

向阳乔木@vista8

精选

洪定坤提出用AI生成可交互原型替代PRD，提前暴露分歧。AI开发系统化流程包括AI写Spec、功能实现、Browser Use验证、自动提交上线。Harness基建通过上下文工程、架构约束、团队知识Memory和技术债梳理，将可交付性从40~60分提升至80分。

技巧字节火山引擎洪定坤原型驱动开发 AI开发工作流 Harness基建

推荐理由：字节火山引擎洪定坤分享了三个提升AI开发效率的方法，尤其Harness基建能帮你把交付质量从及格提到优秀。

原文

00:15

Milvus@milvusio

精选

Milvus团队指出LLM在RAG中频繁引用了不支持的来源。引文失败分为两类：忠实性错误（生成内容与检索文档不符，如模型声称150W功耗但文档只说低功耗）和引文准确性错误（元数据映射错误、缺失引用、幽灵引用、弱支持引用、过度引用）。其中幽灵引用常因索引重建后ID过期导致。修复方案因错误类型而异：忠实性问题调整生成层约束或基座模型，引文准确性问题需工程层修复元数据管理。

技巧 RAG 引文忠实性检索增强生成 Milvus

推荐理由：别总怪模型了，很多引文错误出在工程层。这篇文章帮你分清五种引文故障，对症下药。

原文

6月24日

23:40

Geek@geekbb

精选

Pi Coding Agent 的 Web UI 采用双进程架构，会话守护进程与 Web 服务分离，确保 Agent 会话在服务器端持久运行。即使关闭浏览器或重启前端服务，会话也不会中断。该方案支持跨设备监督桌面和服务器上的 AI 编码 Agent，适合需要长期稳定运行编码任务的场景。

技巧 Pi Coding Agent Web UI 双进程架构持久化运行编程助手

推荐理由：Pi Coding Agent 的 Web UI 让你关掉浏览器后编码任务还在服务器跑，跨设备也能接着监督，很实用。

原文

22:46

LangChain@LangChainAI

精选

Jeff Barg在Interrupt会议上透露，Clay每月运行3.5亿个GTM智能体。他指出，缓存可将LLM调用成本降低高达70%。限制工具调用范围不仅能节省成本，还能提升输出质量。在多租户负载下，引入公平队列机制至关重要。

技巧 Clay GTM agents LLM成本缓存工具调用

推荐理由：做AI智能体上线的小伙伴必看，Clay的AI负责人亲自讲了怎么降本70%和优化队列，干货12分钟。

原文

18:32

AI Will@FinanceYF5

传统AI使用方式是一问一答、改完再问，效率低下。顶尖AI工程师设计自动化循环，让循环去提示AI。这种方法将用户从引擎角色解放出来，让AI自主迭代。通过循环设计，可以减少人工干预，大幅提升生产力。

技巧提示词工程工作流自动化 AI效率

推荐理由：别再做人工提示苦力了，学学工程师怎么用循环驱动AI，效率翻倍。

原文

18:27

AI Will@FinanceYF5

Thariq 完全没碰视频剪辑软件，而是让 Claude 写代码并调用多个工具完成编辑。Claude 使用了转录服务、FFmpeg 做音视频处理、Figma MCP 做调色、Remotion UI 制作界面并完成渲染。整个过程由 AI 编程生成复杂脚本，替代传统剪辑工具。

技巧 Claude Figma MCP Remotion FFmpeg 视频生成

推荐理由：看看人家怎么用 Claude 写代码搞定视频剪辑，不用碰任何剪辑软件，全程 AI 自动化。

原文

17:29

shao__meng@shao__meng

精选

字节跳动发布豆包2.1系列模型，豆包2.1 Pro在Coding和Agent能力上有显著提升，VLM能力介于Claude Opus 4.6和4.8之间。作者使用TRAE Work测试其前端设计图还原能力，模型会先思考规划再分步骤实现，通过本地预览和视觉验证确保质量。最终输出包含自适应布局和实际配图，而非仅占位符，交互和细节还原到位。

技巧豆包2.1 Pro TRAE Work 字节跳动前端设计编程助手

推荐理由：有人拿TRAE Work测了豆包2.1 Pro，前端的视觉还原和配图能力很惊艳，做设计稿转代码可以试试。

原文