全部 AI 动态 · AI 热点

6月28日

03:19

Suhail@Suhail

博主分享了一种异步学习工作流：将博客、推文、arxiv论文等全部用特定提示词让AI生成教学版，不立刻读而是排队等待。等到有空时（乘车、睡前等）再去阅读AI生成的易读版本，并追问问题。这样比直接存链接好，因为AI能适应读者的经验水平并重写内容。作者称这种学习速度远超以往。

技巧学习工作流异步学习 AI教学提示词技巧阅读理解

推荐理由：把想读的文章丢给AI，让它先教你一遍，等你回头读的时候效率翻倍，还能追问。

原文

02:10

berryxia@berryxia

一位老师通过生动的例子讲解大语言模型的原理，涵盖Transformer架构和注意力机制。适合AI初学者快速理解核心概念。

技巧大语言模型教程入门

推荐理由：这个老师的讲解很接地气，没基础也能听懂，推荐给想入门LLM的朋友。

原文

01:49

Jerry Liu@jerryjliu0

Jerry Liu（LlamaIndex创始人）在推文中指出，手动构建工作流（代码、拖拽或提示）的需求正在减少，更优方式是指定目标让模型智能规划步骤。对于重复性任务，可收集带真实标签的数据集进行爬山优化，以平衡成本与准确率。他认为行业正从提示工程迈向目标和评估工程。拥有642次浏览、5个点赞。

技巧 Jerry Liu LlamaIndex 工作流智能体提示词工程

推荐理由：Jerry Liu说的这个趋势很实在：别再手动搭工作流了，直接给目标让模型自己想办法。重复任务还能录数据集优化，省心省钱。

原文

01:25

宝玉@dotey

精选

Codex 和 Claude Code 的上下文压缩功能结合 Prompt Caching，使得在单个 Session 内持续对话的成本压力显著降低。用户可以通过 fork 功能从对话的某个位置创建分支，只保留之前的历史记录，使上下文更纯粹。/btw 或 /side 命令允许在不影响当前任务上下文的情况下提问，例如在 plan 模式下用 /btw 详细解释选项含义。VB 提到自 GPT 5.3 Codex 以来，他不再担心上下文问题，且 Codex 的支线线程功能非常出色。

技巧 Codex Claude Code Prompt Caching 上下文压缩编程助手

推荐理由：如果你用 Codex 或 Claude Code 做长任务，这个技巧能省下不少 token 费用，fork 和 /btw 命令特别实用。

原文

01:19

AI产品黄叔@PMbackttfuture

一位博主分享经历：一名大三学生在完成初稿后，收稿费仍继续优化方案。学生清晰解释如何用多个Agent各自发挥特长协同完成任务。博主称赞其思路，并表示学生希望暑假来实习。

技巧 Agent 协作案例分享实习生

推荐理由：看一个大三学生怎么用多个Agent分工协作，还主动给你优化方案，这思路值得学。

原文

00:56

berryxia@berryxia

76°

Anthropic的Lamis在2026年AI DevCon上分享了上下文工程实践，从Claude MD文件起步，发现其效果出奇地好（unreasonably effective）。第二步引入记忆工具，让Agent自主读写，效果优于人类。第三步Skills采用渐进式披露，类似书架取书。第四步文件系统用bash和grep搜索，不需要向量数据库。生产环境面临多Agent并发写入等问题，Anthropic提出版本控制、并发控制等四个原则。最后介绍“做梦”机制：异步批量分析会话记录，识别模式并调整上下文，已在生产中运行，降低token成本。

技巧 Anthropic Claude 上下文工程智能体记忆管理

推荐理由：Anthropic工程师手把手教你上下文管理套路，从最基础的文件到高级的“做梦”架构，半小时就能上手实操。

原文

00:56

berryxia@berryxia

精选

Anthropic应用AI负责人Lamis在2026年AI DevCon上分享了Agent记忆系统的四层架构。起点是CLAUDE.md文件，效果超过复杂Prompt工程。第二层是记忆工具，让Agent自主读写更新，判断力比人强。第三层Skills实现渐进式披露，类似从书架抽词典。第四层把记忆建模为文件系统，用bash/grep，无需向量数据库。还引入"做梦"（带外异步处理）分析跨会话模式，已在生产中提升任务效率并降低成本。

技巧 Claude Code 记忆管理智能体 Anthropic 提示词工程

推荐理由：Anthropic官方分享了他们怎么让Agent记住东西：从Markdown文件到做梦机制，很实用的四层方法论，看完可以少走弯路。

原文

00:01

MIT CSAIL@MIT_CSAIL

一份由Anatoli Kopadze整理的18步Claude使用教程发布。教程涵盖从基础提示到高级工作流的技巧，共18个步骤。每个步骤针对Claude交互中的具体场景提供指导。用户可系统提升与Claude的协作效率。

技巧 Claude Anthropic 提示词工程教程

推荐理由：想用好Claude？这有18个实用步骤，从提示词到工作流全涵盖，练完你就是高手。

原文

6月27日

22:24

techcrunch@Connie Loizos

Connor Christou确诊癌症后，将血检结果、扫描数据、穿戴设备输出和日记全部输入Claude来辅助决策。Claude帮助他整合多模态健康数据，识别出传统医疗流程中易被忽略的模式。他通过AI对比不同治疗方案的临床试验数据，最终选择了定制化疗法。整个过程强调数据驱动而非猜测，并公开了具体操作流程。

技巧 Claude 创始人癌症健康数据 AI医疗

推荐理由：有人把血检、扫描、手表数据全喂给Claude来治癌症，不是科幻，是他真这么干了。

原文

19:36

Sebastian Raschka: Ahead of AI@Sebastian Raschka, PhD

精选

本文介绍如何用aider和Continue等本地编码代理工具替代Claude Code与GitHub Codex订阅。这些工具可搭配Ollama部署的Llama 3和DeepSeek Coder等开源模型。本地运行能保护代码隐私，并节省每月订阅费用。作者给出了从安装Ollama到连接模型的完整配置步骤。

技巧 Claude Code Codex aider 编程助手开源模型

推荐理由：想省掉Claude Code的月费？Sebastian手把手教你用本地开源模型加aider和Continue自己搭编码代理，便宜又安全。

原文

19:24

idoubi@idoubicc

idoubicc 在广州南沙客运港举办了 codefree.cafe 第一期 AI 编程小桌课，5 位学员在 6 小时结对编程中用 ShipAny 和 FastClaw 构建了 Agent 产品。课程涵盖 Claude Code 和 Codex 的网络配置、Vibe Coding 技巧、ShipAny 快速上站演示，以及从 idea 到上线的全流程拆解。费用 ¥4096/人次，赠送价值 ¥3072 的 ShipAny 会员、1024 社群会员和《这就是 MCP》一书。

技巧 ShipAny FastClaw Claude Code Codex 编程助手

推荐理由：idoubi 搞了个咖啡馆里的小桌课，一天时间教你用 Claude Code 和 Codex 落地 Agent 产品，还包学会 ShipAny 上站，广州朋友别错过。

原文

16:54

向阳乔木@vista8

用户vista8分享了安装@wey_gu开发的nowledge mem应用，并配置MCP（Model Context Protocol）的体验。该应用支持AI对话记忆功能，同时集成个人知识库，提升AI交互的连续性。评论区提供下载链接，目前已有852次浏览和2次互动。

技巧 nowledge mem MCP AI对话记忆个人知识库

推荐理由：想给AI加上长期记忆？试试这个nowledge mem配MCP，能记对话还能建个人知识库，实用又简单。

原文

13:25

Philipp Schmid@_philschmid

精选

Interactions API 引入了 background=True 参数，用于处理超过标准 HTTP 超时限制的长时间运行异步代理任务。官方发布使用指南，说明如何配置请求、在任务完成后重新连接以及流式传输结果。该参数允许客户端在提交任务后立即返回，而无需保持连接直到任务完成。

技巧 Interactions API background=True 异步任务教程

推荐理由：写异步 agent 任务总超时？试试 Interactions API 新加的 background=True，可以断开等结果再重连，还支持流式。

原文

13:21

LangChain@LangChainAI

LangChain与Chime合作发布指南，指导金融服务团队如何利用更强的监督机制构建生产级AI智能体。该指南涵盖LangChain框架的使用，强调可观测性、合规性和风险控制。指南提供具体步骤，帮助团队实现更可靠的AI部署。

技巧 LangChain Chime 智能体 AI安全

推荐理由：LangChain出了个新指南，专门讲金融服务怎么搞生产级智能体，还加了更强监督。做金融AI的可以看看，省了自己踩坑。

原文

13:20

LangChain@LangChainAI

Alex Olsen 加入 LangChain 团队后发表首篇文章，详解 Deep Agents 如何利用 prompt caching 技术减少 API 调用次数。该方案通过缓存重复提示词，最高可降低 50% 的 API 成本。文章提供了具体实现步骤和代码示例，帮助开发者快速集成。

技巧 LangChain Deep Agents prompt caching 成本优化

推荐理由：LangChain 新成员 Alex 手把手教你给 Deep Agents 加缓存，省下一半 API 钱，实用技巧别错过。

原文

13:14

OpenRouter@OpenRouterAI

推文展示了如何使用OpenRouter的MCP功能构建一个模型委员会（Model Council），并针对用户的代码库和用例进行调优。该工作流由用户Lennox Saint验证，确认效果出色。示例提供了可操作的步骤，帮助开发者利用多个模型协作解决问题。

技巧 OpenRouter MCP 模型委员会智能体提示词工程

推荐理由：OpenRouter官方示范，手把手教你用MCP搭模型委员会，实测好用。

原文

12:57

OpenRouter@OpenRouterAI

精选

OpenRouter发布了一个MCP演示，展示agent如何通过MCP从DesignArena拉取实时设计模型排行。演示中，agent同时启动GLM-5.2、Opus 4.7和Kimi 2.6三个子模型，各自生成自画像网页并排展示。用户可以直接对比三个模型的输出，选择最喜欢的设计。这种方式省去了手动注册多个平台、重复输入提示词的繁琐流程。

技巧 OpenRouter MCP/工具 GLM-5.2 Opus 4.7 Kimi 2.6

推荐理由：OpenRouter演示了怎么用MCP让agent自动调用GLM-5.2、Opus 4.7、Kimi 2.6三个模型并排出设计图，再也不用一个个手动试了。

原文

12:45

elvis@omarsar0

作者认为开源模型与前沿闭源模型同等重要，并提出了一个结合使用的框架：租用前沿模型的推理和智能能力，同时通过开源模型掌握上下文和知识，并利用开源模型作为验证器和评判器。这一策略让用户既能享受前沿模型的强大推理，又能保持对上下文和信息的控制权。该框架提供了一种实用的模型组合思路。

技巧开源模型推理模型模型集成

推荐理由：一个实用的使用策略：把前沿模型当脑子，开源模型当知识库，自己掌握上下文。

原文

12:36

elvis@omarsar0

作者通过创建私人ChatGPT会话，记录饮食、药物和感受，利用AI作为第二意见和提醒工具，配合医生指导，在6个月内成功减重100磅。这个过程包括减少工作时间、改善睡眠和饮食、增加运动。作者认为个人健康是AI最有价值的应用之一，同时也在开发AI个人导师项目@dair_ai。他强调详细的每日日志和AI的持续提醒是成功的关键，最终ChatGPT和医生共同帮助他改善了生活质量。

技巧 ChatGPT 个人健康 AI助手经验分享

推荐理由：作者亲身经历：用ChatGPT记日志、当健康教练，6个月减了100磅。不是广告，是真实可复用的AI辅助健康管理方法。

原文

12:34

Geek@geekbb

1. 开发者 @tamanekokoro 分享一键配置方法：登录 Cloudflare 后进入 Workers AI → REST API → 创建 API Token，无需信用卡即可获取 API 密钥与账户 ID。2. 在 Chatbox 中以 OpenAI API 兼容模式配置自定义端点，将模型名填为 @cf/zai-org/glm-5.2 即可调用 GLM-5.2 模型。3. 该免费方案每日有使用限制，不适合无限制畅用场景。4. 设置过程仅需几分钟，适合快速体验 GLM-5.2 的轻量需求。

技巧 Cloudflare GLM-5.2 Workers AI Chatbox 免费模型

推荐理由：想白嫖 GLM-5.2？Cloudflare Workers AI 一键免费接入，不用绑卡，Chatbox 里改个模型名就能跑，但每天有次数限制，轻度玩玩够用。

原文

12:26

AI Engineer@aiDotEngineer

精选

Paul Bakaus 将在 AI Engineer World's Fair 发表两场演讲，涵盖智能体技能工程与设计工具控制。他基于构建 24+ 技能、跨越 9 种 harness/模型组合的实战经验，揭示平行子智能体、混合专家路由、技能记忆、自动钩子与环境变量等技巧。此外还介绍开源设计工具 Impeccable AI 的 24 个形容词级命令（如 /bolder、/quieter、/distill）。两场演讲分别聚焦如何突破模型默认安全输出，以及从形容词层面控制设计风格。

技巧 Paul Bakaus ai-engineer 智能体提示词工程 impeccable_ai

推荐理由：想突破 agent 平庸输出？Paul Bakaus 分享 24+ 技能实战干货，还有形容词级设计控制，很实用。

原文

12:25

Fireworks AI@FireworksAI_HQ

FactoryAI 将模型管理平台标准化为 Fireworks，实现部署扩展。此举带来开放模型增长 2-3 倍，每美元工作量提升 5-15 倍，并能第一时间获取新开放权重模型。团队负责人 Leo Tchourakov 在视频中详解了具体实现。

技巧 Fireworks FactoryAI 开放模型模型管理部署优化

推荐理由：想提升AI模型部署效率？看看FactoryAI怎么用Fireworks实现5-15倍成本效益，还能第一时间用上新模型。

原文

12:17

Harrison Chase@hwchase17

Coinbase CEO Brian Armstrong在推文中介绍了公司通过更优默认设置、智能路由和缓存来控制AI支出增长。他们默认使用开源模型如GLM 5.2和Kimi 2.7，使91%员工未触发使用上限。缓存命中率在LibreChat中从5%提升至60%。这些措施使AI支出降低近一半，同时token使用量持续增长。

技巧成本优化缓存 Coinbase GLM 5.2 Kimi 2.7

推荐理由：Coinbase用缓存和默认模型省了一半钱，还让token随便用，想省成本的团队可以照抄作业。

原文

12:06

LangChain@LangChainAI

LangChain的Brace Sproul和Jake Broekhuizen在视频中比较了构建agent时使用MCP（Model Context Protocol）与CLI（命令行接口）的优缺点。MCP提供了标准化上下文传递，适合多步骤复杂agent任务；CLI更轻量直接，适合简单工具调用。视频通过实际案例演示了两种方式的适用场景和取舍。

技巧智能体 MCP CLI LangChain agent

推荐理由：LangChain的两位专家亲讲MCP和CLI在agent开发中的实战对比，帮你选对工具写代码。

原文

11:57

Simon Willison@simonw

Simon Willison在推文中指出，当前LLM（如GPT-4、Claude等）在构建前端时默认选择React的倾向较去年明显降低。他过去几乎每次前端提示都要加入“不要用React”，但近几个月来多数模型已不再需要这一约束。这一变化减少了提示词的必要修改，反映出LLM默认行为的演进。

技巧 Simon Willison LLM React 前端开发提示词工程

推荐理由：Simon Willison分享了一个省事小发现：现在LLM写前端默认React少了，你少写一句提示词。

原文

11:46

elvis@omarsar0

一条推文引用了一个关于动态工作流的讨论，话题来自dair.academy的活动。该活动已有311次查看，内容涉及工作流自动化。推文包含指向具体资源的链接。

技巧动态工作流 dair.ai 工作流自动化

推荐理由：想学动态工作流？dair.ai的活动资源可以看看，有具体案例讲解。

原文

11:39

marktechpost@Sana Hassan

精选

本教程演示如何从Hugging Face流式加载NVIDIA Open-SWE-Traces数据集，无需本地下载即可在Google Colab中高效处理。内容涵盖多轮智能体对话标准化、代码补丁解析、构建包含轨迹长度、工具使用次数、补丁大小、语言分布及解决结果的分析DataFrame。最后基于成功标签、Token限制、语言过滤和补丁可用性筛选出监督微调子集。

技巧 NVIDIA Open-SWE-Traces Hugging Face 微调编程助手

推荐理由：想自己动手做代码智能体微调数据？这教程手把手教你解析NVIDIA开源的Open-SWE-Traces，连Token预算和工具使用指标都算好了。

原文

6月26日

23:19

LangChain@LangChainAI

monday.com 的一个智能体需要处理超过 200 个工具，导致严重的上下文污染，LLM 混乱且推理成本飙升。团队采用 Deep Agents 架构重建了产品 Sidekick，将工具分组管理以隔离上下文。重构后智能体决策准确率提升、延迟降低。详细方案在 YouTube 视频中由 @omribruchim 讲解。

技巧 monday.com Deep Agents Sidekick 智能体工具上下文

推荐理由：monday.com 用 Deep Agents 把 200+ 工具拆成小组，解决 LLM 被上下文污染搞晕的问题，成本降效果升，多工具场景必看。

原文

23:01

AWS Machine Learning Blog@Christopher Phillippi

精选

Stripe采用ReAct代理框架构建金融合规系统，通过任务分解将复杂流程拆解为92个原子步骤。系统使用提示缓存技术将推理成本降低40%，同时保持人工监督机制确保审计可追溯性。该设计在Stripe的支付处理场景中覆盖了98%的合规审核任务，漏报率低于0.5%。

技巧 Stripe ReAct 金融合规智能体提示词工程

推荐理由：Stripe分享了他们怎么用AI代理处理金融合规的真实案例，包括ReAct框架和提示缓存省钱技巧，适合做合规系统的人参考。

原文

20:34

berryxia@berryxia

精选

岚叔发布了一个开源skill，先让模型将文章或架构内容压缩为结构化JSON spec，再通过本地Python + Pillow渲染出黑底手绘风格的PNG和GIF，同时输出可编辑的Excalidraw JSON。该skill可直接供agent调用，解决了复杂内容可视化效率低、观感差的问题，风格克制且便于扩展。

技巧岚叔 Excalidraw Python Pillow 手绘风格

推荐理由：你还在手动画架构图？岚叔这个skill帮你一步生成手绘动态图，还能用Excalidraw编辑，效率拉满。

原文

20:05

vLLM@vllm_project

精选

Cohere 开源了他们使用 AI 编码智能体维护 vLLM fork 的方法。该方法将维护视为控制循环：每次上游发布后 rebase，运行测试，诊断错误，修复，重复直到通过。原本数周的工作缩短到数天。技能库已开源（cohere-ai/vllm-skills），且修复已回馈上游。

技巧 Cohere vLLM 编码智能体开源

推荐理由：Cohere 开源了用 AI agent 维护 vLLM fork 的实践，把几周工作缩到几天，修复还回馈了上游。

原文

16:09

marktechpost@Sana Hassan

本教程分步指导你在 Google Colab 中从零构建一个轻量级 AI 智能体，灵感来源于 Nanobot 架构。内容包括：实现提供者抽象层、注册工具调用功能、添加会话记忆管理、集成生命周期钩子、定义技能模块，以及部署一个 MCP 风格的工具服务器。全程不使用外部框架，让你理解消息、工具、记忆与模型响应的协作机制。最终得到一个可对接真实 LLM 提供者的智能体循环。

技巧 Nanobot Google Colab MCP服务器智能体工具调用

推荐理由：手把手教你用 Colab 搭一个能调用工具、记住对话的 AI 智能体，还把 MCP 服务器也揉进去了，代码全开源。

原文

15:58

李继刚@lijigang_com

长期与Claude或DeepSeek等模型对话，你的语言风格会不自觉地模仿对方。重度使用后，说话会带出「Claude味儿」「DeepSeek味儿」。进行30天月度主题阅读，沉浸在同一主题的上下文中，能加深理解并切换看问题视角。

技巧 Claude DeepSeek 语言风格主题阅读

推荐理由：长期用Claude或DeepSeek聊天，说话会带味儿，还能用主题阅读切换视角，亲测有效

原文

15:57

向阳乔木@vista8

腾讯云 Edgeone Makers 提供了多种 Agents 模板，包括售后 Agent、市场营销 Agent 和 AI 聊天 Agent。这些模板可一键部署，无需复杂配置。该平台旨在降低 Agent 开发门槛，让开发者聚焦业务逻辑而非工程部署。用户可通过活动页注册体验，链接为 cloud.tencent.com/act/pro/edgeon。

技巧腾讯云 Edgeone Makers 智能体 Agent模板部署

推荐理由：想快速搭个智能体但不会写代码？腾讯云 Edgeone Makers 直接给模板，部署就能用，省时省力。

原文

15:56

腾讯混元 Tencent Hunyuan@TencentCloud

一位开发者使用简单的文本提示（text prompts）构建了完整的香港主题跳跃游戏，包含视觉和声音。该作品在2026年香港腾讯云日黑客马拉松游戏开发挑战赛中荣获冠军。展示了AI从“不可靠”到如今高效创意生产工具的演变。

技巧 vibe coding 腾讯云香港主题跳跃游戏 AI编程

推荐理由：看看腾讯云黑客松冠军怎么用文本提示就搓出一个香港主题跳跃游戏，视觉和音效全包，效率惊人！

原文

15:42

向阳乔木@vista8

腾讯云EdgeOne发布了「EdgeOne Makers」产品，通过npm install -g edgeone、edgeone makers create --template openai-agents-starter-node等3行命令即可搭建AI Agent开发框架。该工具自动处理上下文、并发和沙箱环境问题，本地启动测试网站后可直接对话查看Agent效果与工具调用细节。线上支持绑定域名和关联GitHub进行持续迭代，目前处于Beta内测阶段，注册可免费领取50万Token。

技巧 EdgeOne EdgeOne Makers 腾讯云智能体部署

推荐理由：腾讯云EdgeOne出了个新工具，3行命令就把AI Agent框架搭好还能直接部署，省去自己搞并发和沙箱的麻烦，还送50万Token试玩。

原文

14:53

AI Will@FinanceYF5

73°

OpenAI 在其公司内部所有部门推广使用 Codex 作为智能体工具。员工利用 Codex 执行更复杂的任务，这些任务运行时间更长，并涉及跨职能协作。该实践展示了智能体工具如何提升工作效率和团队协作能力。

技巧 OpenAI Codex 智能体编程助手

推荐理由：OpenAI 自己都在用 Codex 干活，说它能让员工做更复杂、跨部门的任务，说明 agent 工具真的有用。

原文

10:45

OpenRouter@OpenRouterAI

精选

OpenRouter 宣布 GLM-5.2 提供商正在优化推理速度。新增 wafter_ai 和 FireworksAI_HQ 两个快速变体。设置模型为 "z-ai/glm-5.2:nitro" 可根据实时流量自动切换到最快提供商。该功能无需手动切换，持续使用最佳性能。

技巧 GLM-5.2 OpenRouter wafer_ai FireworksAI_HQ 推理模型

推荐理由：OpenRouter 出的省心用法：设成 nitro 模式，GLM-5.2 自动走最快的推理服务商，不用自己选。

原文

08:52

08:52Hugging Face: Blog（博客/媒体）

精选

HuggingFace推出新功能：只需一条命令即可在HF Jobs上启动vLLM推理引擎。vLLM是一个高性能、低延迟的推理框架，支持多种GPU和自定义模型。该功能简化了从模型托管到服务部署的流程，无需手动配置容器或基础设施。用户可以快速部署LLaMA、Mistral等开源模型。

技巧 vLLM HuggingFace HF Jobs 推理模型部署

推荐理由：HuggingFace出了新招：一行命令就能跑vLLM服务器，省去了手动配置的麻烦，适合快速部署自己的模型。

原文

08:25

Genspark@genspark_ai

Genspark团队举办直播，演示新版AgentBase的使用方法。直播包含实机操作和问答环节，视频浏览量已达938次。观众可以学习如何配置和运行AgentBase。

技巧 AgentBase 直播教程智能体 Genspark

推荐理由：想玩转AgentBase？这场直播手把手教你，有问有答，别错过。

原文