全部 AI 动态 · AI 热点

6月16日

02:13

AWS Machine Learning Blog@Po-Shin Chen

精选

AWS博客介绍了Strands Evals工具，用于检测AI Agent执行中的失败并定位根因。调用detector函数后，输出包含分类失败类型与置信度分数、从根因到下游症状的因果链，以及修复建议（指定修改系统提示还是工具定义）。该工具可集成到评估流程中，实现每个测试运行的自动诊断。

推荐理由：AWS教你用Strands Evals自动揪出AI Agent的失败根因，还告诉你该改提示词还是工具定义，比盲猜管用多了。

原文

02:05

elvis@omarsar0

Elvis Saravia在推文中强调，AI工程师应掌握自己的智能决策。该推文获得2148次浏览和11次点赞。Fireworks使个人开发者更容易拥有和控制自己的AI系统。

技巧 Fireworks Lin Qiao Elvis Saravia AI所有权

推荐理由：Elvis Saravia用数据说话，告诉你别把AI决策权外包。Fireworks让你也能轻松掌控模型。

原文

01:05

向阳乔木@vista8

Suno音乐生成工具最近上新了几首风格特别的歌曲，包括《Ghostty》《We Flow》《Neon Son》等。这些歌曲通过组合不同风格元素，创造出新的听觉体验。作品展示了Suno在音乐风格融合和创意生成方面的能力。

技巧 Suno AI音乐音乐生成风格融合

推荐理由：Suno又整新活了，这几首风格混搭的歌听着挺新鲜，想试试AI音乐创作可以听听看。

原文

01:01

elvis@omarsar0

一名用户将AI员工添加到Slack工作区，并让它在Slack内运行本周DAIR Academy任务。AI自动完成了全部工作并准备发布，整个过程无需人工干预。该AI被描述为“至今最强大的AI”，能够理解真实工作任务并自主执行。

技巧 Slack DAIR Academy 智能体工作流

推荐理由：有人把AI员工拉进Slack，让它干DAIR Academy的活，结果它自己干完了。想知道怎么做到的？看这条。

原文

01:01

Geek@geekbb

该开源书稿名为XQuant，发布于GitHub，面向零基础读者。它教用户用自然语言描述量化交易策略，并让AI自动生成对应代码。目标是帮助读者从零搭建一个完整、可迭代的量化交易系统。书稿全程不需要读者编写代码，只需理解策略思路。

技巧 XQuant 量化交易开源书稿自然语言编程

推荐理由：想学量化但不会写代码？这个开源书稿让你用自然语言描述策略，AI帮你写代码，零基础也能上手。

原文

00:14

LangChain@LangChainAI

LangChain 官方发布了 Deep Agents 系列教程的第一部分，深入讲解执行环境（execution environment）作为 Deep Agent 的骨干。该视频由 Sydney Runkle 主讲，详细介绍了代理的底层运行机制。

技巧 LangChain Deep Agents 智能体教程

推荐理由：LangChain 官方出品的 Deep Agents 实战教程，从执行环境讲起，适合想深入理解智能体原理的开发者和学习者。

原文

6月15日

22:54

Philipp Schmid@_philschmid

Google联合Kaggle推出免费5天AI Agents课程，使用Gemini和Google AI Studio。课程涵盖Day1智能体与vibe coding入门、Day2工具与互操作性、Day3技能记忆与长上下文、Day4安全与评估、Day5生产级部署与可观测性。只需Kaggle账号和Google AI Studio账号（均免费）即可参加。

技巧 Gemini Kaggle AI Agents 智能体教程

推荐理由：Kaggle上5天免费课程，用Gemini从0搭智能体，每天一个实战模块，带你到生产级部署。

原文

22:28

向阳乔木@vista8

该工具可输入任意App名称，自动抓取AppStore用户评论，然后通过LLM进行数据分析，将反馈转化为产品经理可用的信息。预设了全球各国免费版和付费版Top10 App数据供学习参考。代码已开源，方便开发者研究或直接使用。

技巧 AppStore LLM 数据分析开源工具

推荐理由：想分析AppStore用户反馈？这个开源工具能自动抓评论再用LLM分析，省去手动收集的麻烦。

原文

22:05

AWS Machine Learning Blog@Sundar Raghavan

精选

本教程介绍如何使用 Deep Agents 和 Bedrock AgentCore 构建竞争研究智能体。你将在多步AI工作流中创建隔离执行环境。在第二部分，你可以通过 AgentCore CLI 将同一智能体部署到 Bedrock AgentCore Runtime，作为托管、会话隔离的服务运行。

技巧 Deep Agents Bedrock AgentCore AgentCore CLI 智能体

推荐理由：AWS 教你用 Deep Agents 和 Bedrock AgentCore 搭研究智能体，还能用 CLI 部署成托管服务，适合搞多步AI流程的开发者。

原文

21:40

Geek@geekbb

GitHub 仓库 dify-workflow-templates 提供了 269 个 Dify 工作流即用模板。模板涵盖 15 个类别，包括翻译、图像生成、知识库、代码开发、数据分析、内容创作、Agent 智能体等。每个模板可直接导入 Dify 使用，无需从零搭建。该集合适合快速搭建 AI 应用场景的工作流。

技巧 Dify 工作流模板 Agent智能体内容创作

推荐理由：Dify 用户快去 GitHub 拿 269 个现成模板，覆盖翻译、图像、Agent 等 15 类场景，直接导入用，省得自己写。

原文

21:38

LangChain@LangChainAI

精选

Lyft 利用 LangChain 构建了 8 个 AI Agent，这些 Agent 能完全解决 35% 的客户问题。在 LangChain 的 Interrupt 会议上，Lyft 分享了内部使用的评估方法，以及如何通过 LangSmith 扩展评估规模。他们还总结了在开发过程中学到的经验教训。

技巧 Lyft LangChain LangSmith 智能体客户服务

推荐理由：Lyft 用 LangChain 做了 8 个 AI Agent，直接干掉 35% 的客服工单，还分享了评估细节。

原文

19:30

Geek@geekbb

LLMTrim 是一款开源工具，能在发送 LLM API 请求前自动移除冗余 token，可节省最多 30% 的 token 消耗。它通过分析请求内容删除无用空格、重复提示词等，且不影响回答质量。支持 OpenAI、Anthropic 等主流 API。

技巧 LLMTrim token压缩 API成本优化提示词工程

推荐理由：想省 API 钱？试试 LLMTrim，请求前自动挤掉废话 token，能省下 30% 呢，效果一样。

原文

18:20

AI Will@FinanceYF5

使用Workflow模式进行代码审查时，能自动并行启动数百个Agent，每个文件被分配一个独立Agent。这些Agent共同找出bug、边界问题和UX缺陷。其审查效果超越其他所有模型的总和。

技巧 Workflow 智能体代码审查并行处理

推荐理由：试试Workflow模式做代码审查，它能自动派几百个Agent同时干活，每个文件一个，找出bug比别的模型加起来还多。

原文

18:18

AI Will@FinanceYF5

Fable 5 的自动化故事板创建器只需输入创意，通过 LLM 生成分镜脚本，再用文本到图像模型生成关键画面，最后用图像到视频模型转化为动态镜头。该工具还能生成 B-roll 镜头和 360 度全景画面，用于 Seedance 2 的 ground truth 数据。所有输出节点均可手动编辑修改，实现从文案到电影的端到端自动化。

技巧 Fable 5 Seedance 2 故事板自动化视频生成

推荐理由：这个工具让你写个想法就能自动出故事板，连B-roll和全景视频都能生成，做视频前期超省事。

原文

17:54

Viking@vikingmute

在Arena设计测评中，Claude表现断崖式领先，GPT设计持续拉胯。作者推荐Qwen 3.7 Max，称其近期使用体验惊艳。分享工作流：利用design.md配合需求生成images2出图，再以图片为参考生成页面。Claude Design产品能帮助非设计师用户从技术细节中解脱，并提升视觉效果。

技巧 Claude Qwen 3.7 GPT 设计工作流

推荐理由：设计测评里Claude最强，不用它可以试试Qwen 3.7 Max。还有一套用design.md先出图再生成页面的工作流，挺实用。

原文

15:50

Geek@geekbb

该工具支持HTTP/HTTPS/SOCKS4/SOCKS5代理的批量可用性检测。可针对OpenAI、Grok、Gemini、Claude等服务做专项可达性检查。附带Web管理界面和代理仓库功能。项目地址在github.com/strongshuai/pr...

技巧 OpenAI Grok Gemini Claude 代理检测

推荐理由：这个工具能一键检测免费代理能不能用，还专门测能不能连上OpenAI、Claude这些AI服务，省去手动试错的麻烦。

原文

15:28

小互@imxiaohu

该平台允许任何开发者注册账号，将自研AI Agent接入。开发者需填写Agent名称、能力描述及所用模型，并配置Webhook地址作为任务接收接口。通过能力测试审核后，Agent即可自动接单。

技巧 Agent Webhook 开发者平台接单审核

推荐理由：想把自己的AI Agent放到平台上赚钱？这篇讲清楚了注册、配Webhook、过审核的全流程。

原文

15:23

小互@imxiaohu

一个AI Agent悬赏任务市场支持用户发布优化数据库、写skill等复杂任务并挂赏金，由AI Agent抢单完成。平台抽成15%，Agent获85%，并有信誉分体系（五个等级）。支持CLI命令发任务，可嵌入定时脚本实现自动化。Agent干砸了会扣分，靠谱的优先看到高价任务。

技巧智能体悬赏任务市场 CLI 工作流自动化

推荐理由：这平台让AI Agent直接接单干活，你发任务它做，省心还能赚钱，比外包更自动化。

原文

13:34

Geek@geekbb

新工作流中，Claude Fable 5 负责规划与代码评审，GPT-5.5 Codex 负责实现与调研。仓库作为持久记忆，门禁规则在代码生成前就已设定。该方法解决单模型编码时上下文退化、自评分偏误等问题。相关代码与配置已开源在 github.com/DanMcInerney 的仓库中。

技巧 Claude Fable 5 GPT-5.5 Codex 编程助手提示词工程多模型协作

推荐理由：双模型协作，治编码通病

原文

13:02

李继刚@lijigang_com

许多AI模型在回复中喜欢说“想象一下”。目前很多Agent已支持多模态能力。可以添加一条规则：每当模型输出“想象一下”时，直接生成配图并标注信息。这样能直观呈现模型想表达的画面。该方法利用了Agent的多模态能力来增强表达效果。

技巧智能体多模态提示词工程配图生成

推荐理由：让模型边想边画

原文

12:34

AI Will@FinanceYF5

用户分享了一种使用Codex自动设定/goal指令的方法。Codex能为自己生成的每个子智能体自动编写目标。该方法基于Codex的自我演进能力，无需手动指定指令。视频展示了Codex自主生成子智能体目标的完整流程。

技巧 Codex 智能体自动目标提示词工程

推荐理由：告别手动写目标

原文

12:32

AI Will@FinanceYF5

Pietro Schirano分享了一个工作流技巧：他不再亲手为每个任务写/goal，而是让Codex自动生成它自己的goal以及每个子agent的goal。该方法通过一次简单的提示让Codex执行自描述和子目标分配，减少了手动编写提示词的时间。这个技巧适用于Codex驱动的多agent场景，可以提升效率。

技巧 Codex 提示词技巧 Agent 工作流智能体

推荐理由：学Codex新玩法，省写goal时间

原文

12:00

宝玉@dotey

Lovable设计负责人Felix Haas总结了七条AI时代高效团队经验，包括别等安排、招人看态度、好奇与沉迷区别、资深人重新动手、自我意识是速度敌人、先发布再迭代。Lovable于2024年上线，8个月达成1亿美元年收入，2025年底完成3.3亿美元B轮融资，估值66亿美元。这些经验来自这家欧洲增长最快的AI创业公司内部视角。

技巧 Lovable 团队管理 AI效率创业经验

推荐理由：Lovable团队管理实战心得

原文

11:13

marktechpost@Michal Sutter

精选

Claude Code 2026 指南介绍了 25 项功能，包括 CLAUDE.md、skills、subagents、hooks、MCP 和 Auto Mode。它提供了对比表格和可运行的代码示例。还包含实际用例和一个交互式演示供读者尝试。该指南覆盖了从基础配置到高级自动化的完整工作流。

技巧 Claude Code 编程助手 MCP/工具智能体

推荐理由：学会Claude Code全部25招

原文

11:13

elvis@omarsar0

精选

推文作者分享了一个提升Agent自主运行/goal效果的技巧：从历史会话中挖掘表现良好的目标，将这些洞察打包成自动化技能，供/goal工具复用。该方法可以解决LLM的奖励黑客行为、快速完成任务偏好等异常行为。作者已在编排器应用中构建了/goal的UI界面，并建议将这套做法作为Agent工具。

技巧 Codex LLM 提示词工程智能体工作流

推荐理由：学一招让Agent目标更靠谱

原文

11:12

elvis@omarsar0

作者用6个月自建了一套Agent编排器，包含路由、动态工作流、验证器、MCP工具等功能。他通过挖掘Agent会话记录递归构建和测试新想法，涵盖自主循环和持续学习系统。他认为锁定特定工具或模型供应商风险过高，必须自己控制成本、决策和上下文管理。这为应对本周Fable事件提供了最佳防御。

技巧编排器智能体 MCP/工具 Agent

推荐理由：自己动手做编排器，比依赖供应商强

原文

11:12

elvis@omarsar0

研究者omarsar0分享了构建自改进AI系统的经验，可以通过选择论文和方法即时创建新功能。系统能根据自生成评估决定是否保留或丢弃功能，目标是实现无需人工干预的自我维护。这一工作流展示了如何利用论文复现功能快速测试新想法。

技巧自改进 AI系统构建论文复现工作流

推荐理由：手把手教你自改进AI

原文

11:12

elvis@omarsar0

作者出于研究好奇心构建了Agent编排器应用，其自改进系统意外实现了高可靠性、独立性和可塑性。他认为这些特性是未来智能栈的关键部分。上下文控制能让Agent产生令人惊讶的行为，但高层决策不能外包给单一公司。

技巧智能体 Agent编排器自改进系统

推荐理由：自己动手搞Agent编排

原文

11:12

宝玉@dotey

作者在 baoyu-skills 项目中尝试用 EXTEND.md 文件保存用户自定义设置。但 Markdown 不是严格结构化数据，导致程序解析困难，格式难以保持一致。作者建议改用 JSON 或 YAML 作为 Skill 扩展配置，既能被 LLM 方便读取，也能用代码解析和保存。

技巧 baoyu-skills JSON YAML Markdown 智能体

推荐理由：配置改用 JSON 更靠谱

原文

11:12

Google AI Developers@googleaidevs

Google AI研究员与工程师在Kaggle推出5天Vibe Code课程。学员将学习用自然语言编写可扩展的智能体系统。课程包含一个实践性的结业项目（capstone project）。

技巧 Vibe Code Google AI Kaggle 智能体提示词工程

推荐理由：Google AI的Kaggle课程，学用自然语言写代码

原文

11:11

elvis@omarsar0

Omar Sanseviero分享了一个名为llm-council的开源技能，用于在Claude Code中组合多个LLM组成委员会进行深度研究。该技能默认使用Fireworks AI的API，但可轻松适配OpenRouter。项目托管在github.com/dair-ai/dair-ai仓库，目前支持Claude Code，但可能兼容其他智能体。作者表示可用此技能执行复杂的研究任务，并计划未来扩展到更多领域和动态工作流。

技巧 llm-council Fireworks Claude Code 智能体研究任务

推荐理由：分享了一个LLM委员会技能，能组合多个模型做研究

原文

11:11

Viking@vikingmute

精选

Viking分享了一个省钱的工作流，灵感来自shadcn的improve skills思路。先让GPT-5.5 High出包含Metadata、Scope和Steps的plan，不写一行代码。再用Composer 2.5和DeepSeek v4 pro分别实现，效果都不错。最后用review-forge审查提高代码质量，整体花费非常少。这个repo 4天获得3.7K stars。

技巧 GPT-5.5 High Composer 2.5 DeepSeek v4 pro review-forge shadcn 工作流省钱

推荐理由：省钱开发新功能的实际方法

原文

11:10

Tw93@HiTw93

Waza 是一套包含8项工程习惯技能（规划、审查、调试等）的工具，可在 Claude Code、Codex 等编码工具上运行。用户切换底层模型后仍能保持相同工作流程。Waza 帮助开发者延续熟悉的工程习惯，无需因模型变更而重新学习。该工具已在GitHub开源。

技巧 Waza Claude Code Codex 编程助手工作流

推荐理由：用Waza在多个编码工具间切换模型

原文

11:10

shao__meng@shao__meng

精选

Codex Mobile 将手机作为远程开发机的控制中心，代码执行仍在桌面端完成。任务启动时可配置主机、工作区、Git 分支，并创建独立 worktree 隔离变更。Side Chat 提供与主线程关联的轻量对话，不打断主工作流。Plan 模式用于高风险任务，Goal 模式设定可验证终态，Mobile 端支持完整操作。Mobile 独有优势包括拍照/选图、语音录制 prompt，以及通过行内评论审查代码变更。

技巧 Codex Mobile OpenAI 编程助手远程开发代码审查

推荐理由：手机远程编码实战技巧

原文

11:08

orange.ai@oran_ge

精选

橙线插画 skill 是一款将长文自动生成插图的工具，作者用它为一篇7.5万字的文章制作了20张插图。Agent 会为每个场景生成2套方案供选择，最终未对任何图片进行修改。该skill已开源，下载地址在github.com/orange2ai/oran…。

技巧 Orange AI 橙线插画 skill 智能体提示词工程

推荐理由：能帮长文秒变漫画，省时省力

原文

10:20

向阳乔木@vista8

精选

该工具输入任意App名称即可自动抓取AppStore用户评价，并通过DeepSeek进行四类信息挖掘：用户正面/负面评价、问题与版本更新的关联、产品机会识别、可视化图表输出。产品预计下周开源，可帮助产品经理快速从评论中提取 actionable 信息。

技巧 DeepSeek AppStore 产品经理用户评论挖掘数据分析

推荐理由：帮你用DeepSeek挖掘AppStore评论，找出产品机会

原文

10:04

marktechpost@Sana Hassan

精选

本教程演示如何使用FineWeb数据集进行流式采样（无需下载TB级全量数据），检查模式与元数据（如URL、语言、语言得分、token数量）。复现了FineWeb质量过滤管道的简化版本。涉及去重与分词操作。适合大规模网络语料分析的学习。

技巧 FineWeb 流式处理过滤去重分词

推荐理由：手把手教你用FineWeb做数据清洗

原文

6月14日

20:56

Geek@geekbb

illo-sketch是一个AI技能，可将文章或创意转化为印刷风格的社论插图。它内置十套画风，包括riso印刷、蓝图、黏土和像素等。用户可使用一只可重复使用的吉祥物来演绎创意点子。该项目托管在GitHub上，由tmchow开发。

技巧 illo-sketch GitHub 印刷风格插图生成吉祥物

推荐理由：十套画风加吉祥物，创意插图神器

原文

16:21

Yangyi@Yangyixxxx

Ponytail插件通过YAGNI原则和检查stdlib、平台原生功能、已有依赖等步骤，让AI coding agent避免过度工程。基准测试显示代码量减少80-94%，成本降低47-77%，速度提升3-6倍。支持Hermes、Claude Code、Codex、Cursor等Agent。

技巧 Ponytail AI编程助手智能体提示词工程代码优化

推荐理由：让AI agent少写80%代码

原文

16:09

Viking@vikingmute

Shadcn 的 /improve 思路主张用最强大的模型（如 GPT-6）深入理解代码库、发现问题并产出高质量计划，而将实际执行交给更便宜的模型完成。Skill 本身绝不直接修改代码，只负责产出计划，主 Skill 包括快速和全面等多种模式。该 repo 发布 4 天即获 3.7K stars，作者认为 skills 是目前最容易获得 stars 的方式。

技巧 shadcn /improve 编程助手开源模型智能体

推荐理由：Shadcn 教你用最强模型出计划

原文