02:42Notion@NotionHQNotion团队将客户bug或功能请求分配给Cursor agent。agent读取任务简报,在代码库中工作并自动打开PR。该流程让非工程成员也能交接实际工程工作。Cursor作为AI编程助手,可理解上下文并生成代码变更。这展示了AI agent在协作中的实际应用。技巧CursorNotion编程助手工作流智能体9 个信源在谈推荐理由:Notion团队用Cursor自动处理bug和功能请求,连PR都自动开,省掉了手动交接的功夫,值得试试。原文
02:41DeepLearning.AI@DeepLearningAIDeepLearning.AI 发起7天语音AI构建挑战,教你用编码代理自动提醒而不必盯着终端。活动截止日期为6月30日。参与者将学习如何让AI主动呼叫你,解放监控终端的负担。技巧DeepLearning.AI语音AI编码代理挑战赛推荐理由:DeepLearning.AI 搞了个7天挑战,教你用语音AI让编码代理自动呼叫你,不用死守终端。活动到6月30日截止,想学赶紧上车。原文
02:37AK@_akhaliq阿里发布Qwen-AgentWorld,一个基于Qwen的语言世界模型,专为通用智能体设计。该模型旨在帮助智能体理解环境动态并做出决策。目前尚未公开具体的基准测试结果或性能数据。AI模型Qwen-AgentWorldQwen阿里智能体世界模型推荐理由:阿里出了AgentWorld世界模型,让智能体能更好地理解环境,做Agent开发的朋友可以关注一下。原文
02:35Notion@NotionHQNotion 宣布与 Claude 集成,用户可在文档中直接调用 Claude。Claude 能读取用户代码库,根据粗略的 PRD 自动补全技术细节,并原地更新文档。该功能支持团队成员在文档内编辑和评论,提升技术文档编写效率。AI产品NotionClaudePRD代码库文档协作4 个信源在谈推荐理由:Notion 这次把 Claude 直接嵌入文档,你给个毛坯 PRD,它读你代码库帮你填成精装版,团队还能直接改,写技术文档省事了。原文
02:34Notion@NotionHQNotion 宣布在其平台中集成 Claude 智能体,允许用户创建定制化的 AI 助手。这些智能体可专门用于数据分析、编程、制作电子表格和幻灯片等任务。用户可以将智能体放置在共享任务板上,与团队成员一起协作。智能体之间能够链式工作、互相传递任务,实现24小时不间断自动运行。AI产品NotionClaude智能体团队协作4 个信源在谈推荐理由:Notion 现在能创建 Claude 智能体了,你可以定义专门干数据分析、写代码的助手,还能把它们和团队放在一起自动跑流程,24小时不停工。原文
02:34Notion@NotionHQNotion 发布新功能,允许用户为每个 agent 独立设置上下文与权限,控制 agent 可访问的数据和操作能力。团队管理者可查看每次 agent 运行的完整日志,确保透明度和安全性。该功能旨在简化真实工作委托,让用户放心将任务交给 agent 执行。AI产品NotionAgent权限上下文3 个信源在谈推荐理由:Notion 现在能精细控制每个 agent 能看什么、做什么,团队还能追踪每次运行记录,用起来更放心。原文
02:32Notion@NotionHQNotion发布External Agents功能,首批集成Claude(Anthropic)和Cursor(编程助手)两个AI智能体。用户可以在团队共享看板上为智能体分配任务,通过@提及就像调用同事一样。智能体独立运行并完成任务,视频展示了Claude与Cursor在Notion中的实际协作过程。该功能将AI代理直接融入Notion协作工作流,无需切换应用。AI产品NotionClaudeCursor智能体集成10 个信源在谈推荐理由:Notion现在能让Claude和Cursor像队友一样被@去干活,团队看板上直接指派任务,超方便。原文
02:27Greg Brockman@gdb72°OpenAI推出新版GPT-5.5 Instant,对话体验更风趣。模型能更好理解用户问题意图并动态调整回应。它处理复杂约束更可靠,购物和本地推荐也更实用。今天向付费用户开放,明天免费用户可用。AI产品GPT-5.5 InstantOpenAI对话模型推荐系统10 个信源在谈推荐理由:OpenAI把GPT-5.5 Instant升级了,聊天更带劲,能猜准你心里想啥,推荐东西也更靠谱,免费党明天就能体验。原文
02:24Clement Delangue@ClementDelangue精选Kog在HuggingFace上开源了其2B参数模型,该模型此前被用于演示,运行速度达到3000+ tokens每秒。开源模型可供开发者下载和部署,适用于快速推理场景。AI模型KogHuggingFace2B模型开源模型推理速度推荐理由:Kog开源了一个2B模型,每秒能处理3000多个token,适合需要高速推理的任务。原文
02:12OpenAI@OpenAI73°OpenAI发布新版GPT-5.5 Instant,提升了理解问题意图和自适应回答的能力。新模型能更可靠地处理复杂约束,并让购物与本地推荐更实用连贯。该版本今天向付费用户推送,明天向免费用户开放。AI模型GPT-5.5OpenAI推理模型对话体验10 个信源在谈推荐理由:聊天更懂你,推荐更靠谱,免费用户明天就能用上,赶紧试试。原文
01:39Philipp Schmid@_philschmid83°Google 在 Gemini 3.5 Flash 模型中内置了计算机使用功能,代理可接收屏幕和目标后自主执行操作。支持浏览器、手机(安卓/iOS)和桌面环境三种模式。内置安全防护、用户确认机制和自动停止功能,并针对提示注入进行了额外训练。开发者演示了让代理自动审计网页、运行代码片段并返回报告。AI模型Gemini 3.5 FlashGoogle计算机使用智能体推荐理由:Gemini 3.5 Flash 现在能直接操控你的屏幕,自动干测试网页、点按钮这些活,比普通 AI 助手更像真工具。原文
01:34@koltregaskes@koltregaskes开发者Kolt Regaskes在最新的Claude Code更新中发现指向Claude Fable的字符串。这些线索暗示Anthropic的Fable项目可能重新推出。Claude Fable的具体功能尚未公开,但此次更新让外界重燃期待。AI产品Claude CodeClaude FableAnthropic编程助手10 个信源在谈推荐理由:Claude Code更新里挖出了Fable的字符串,Anthropic可能复活这个项目了,开发者可以留意后续动作。原文
01:31LangChain@LangChainAI精选Jake Broekhuizen在12分钟视频中演示如何让智能体通过记忆更新来改进表现。他介绍使用LangSmith Engine发现运行问题,并将记忆写入Context Hub。这种方法能让智能体在多次运行之间持续优化,而非仅留下痕迹。适合需要在大规模部署中管理智能体记忆的开发者。技巧LangChainLangSmith智能体记忆推荐理由:想知道怎么让智能体不反复犯同样的错?看LangChain这12分钟视频,教你用LangSmith Engine和Context Hub实现跨运行学习。原文
01:30Figma@figmaFigma 在 Config 2026 大会上发布了生成式插件功能。用户只需描述所需的行为、控件和参数,Figma agent 即可自动生成匹配工作流的插件。该功能降低了插件开发门槛,让设计师无需编码也能定制工具。这是 Figma 首次将 AI agent 直接集成到插件创建流程中。AI产品FigmaGenerative pluginsConfig 2026AI agent设计工具5 个信源在谈推荐理由:Figma 让你用自然语言描述需求,AI 自动生成插件,省去写代码的麻烦。设计流程定制化从此更简单。原文
01:28Guillermo Rauch@rauchgVercel AI Gateway 的仪表盘自动显示了 tokens 和 uptime 的恢复数据,效果惊人。用户从 Anthropic API 切换到 Vercel AI Gateway 后,获得了更好的可靠性。这些数据无需手动分析,直接展示在界面上。技巧VercelAI GatewayAnthropic APIAPI网关可靠性推荐理由:Vercel AI Gateway 自动显示 tokens 和 uptime 数据,切换后可靠性更高,比你手动算省事多了。原文
01:25elvis@omarsar0精选作者完全改用语音而非文字输入与AI代理交互,发现音频描述越详细、越长,代理结果越好。他还开发了屏幕录制、截图、追踪鼠标动作和语音注释功能,帮助代理处理设计和精确开发任务。多模态提示(语音+屏幕+动作)显著提升了代理的可靠性,尽管消耗更多token。作者将这些经验制作为可复用的命令集,插入循环后效果显著改善。技巧智能体多模态提示词工程语音交互推荐理由:有人分享用语音+屏幕录制和多模态提示跟AI代理唠嗑,提示越啰嗦结果越靠谱,还教你怎么录屏加注释,值得试试原文
01:21Google DeepMind@GoogleDeepMindGoogle DeepMind在播客中讨论AI Agent经济,涉及数百万AI Agent之间的协商、交易和委托。嘉宾weballergy和fryrsquared参与,探讨通过多样化代理决策避免AI群体思维(cognitive monoculture)。重点包括代理安全陷阱和分布式智能概念。行业Google DeepMindAI Agent智能体经济分布式智能推荐理由:Google DeepMind的播客聊AI agent经济,讲了几百万agent怎么协商交易,还能避免群体思维,想了解智能体协作可以听听。原文
01:18Jerry Liu@jerryjliu0精选Mistral OCR 在 ParseBench 上与多个前沿和开源权重模型进行对比测试。它在语义格式化方面表现突出,能准确处理删除线、上下标、标题层级和链接。在内容忠实度(阅读顺序、幻觉、遗漏)和视觉定位(边界框)上也具有竞争力。表格处理能力一般,几乎没有图表能力。其价格明显低于 Azure Doc Intelligence 和 AWS Textract 等 OCR 服务商。AI模型Mistral OCRParseBenchOCR语义格式化基准测试推荐理由:Mistral OCR 在 ParseBench 上语义格式化很强,价格还比 Azure/AWS 便宜,适合做高质量 OCR 又不愿花大价钱的场景。原文
01:12NVIDIA AI@NVIDIAAI76°NVIDIA 发布了 NeMo AutoModel,基于 Hugging Face Transformers v5 为混合专家 (MoE) 模型提供原生支持。通过 Expert Parallelism、DeepEP 和 TransformerEngine 内核,仅需几行代码即可应用优化。实测显示 NeMo AutoModel 将主流 MoE 模型训练吞吐量提升 3.4 到 3.7 倍。该工具是 NeMo 框架的一部分,专为大规模模型构建设计。AI产品NeMo AutoModelMoEHugging Face Transformers v5训练加速NVIDIA7 个信源在谈推荐理由:NVIDIA 出了个 NeMo AutoModel,基于 Hugging Face Transformers v5,几行代码就能给 MoE 模型训练加速 3 倍以上,搞大模型训练的值得看看。原文
00:52berryxia@berryxiaEmil Kowalski的/emil-design-eng技能安装量已突破10万次。他正在开发更细分的设计工程skills,目标是让AI agent在设计任务上输出更精准、可控的结果。他投入大量时间进行测试,确保agent输出的一致性和正确性。这标志着高质量agent skills从实验走向规模化。AI产品智能体设计工程/emil-design-engAgent skills测试验证推荐理由:想用AI做设计的兄弟,Emil的agent技能已经被10万人验证了,现在他又在搞更细分的,让设计输出更靠谱,值得试试。原文
00:50berryxia@berryxia83°OpenAI推出自研AI芯片Jalapeño,专用于推理(Inference)场景,设计制造仅用9个月,并由AI辅助完成。该芯片由Broadcom负责生产,目标是将推理成本降低约50%(Broadcom CEO原话)。早期性能数据显示,其性能功耗比显著优于NVIDIA Blackwell和Google TPU。首批样片已到手并开始测试。AI产品OpenAIJalapeñoBroadcom推理芯片芯片设计10 个信源在谈推荐理由:OpenAI被推理成本逼急了,自研芯片Jalapeño,9个月流片,性能超Blackwell和TPU还省一半钱,值得看看细节。原文
00:49berryxia@berryxia77°Qwen团队直接训练了一个语言世界模型Qwen-AgentWorld,核心目标是从头建模环境而非仅训练Agent行为。模型需预测终端输出、网页变化及代码执行后状态,而非单纯学习操作。利用该模型作为模拟器进行可控Sim RL,在某些任务上模拟训练的Agent性能甚至超过真实环境训练的Agent。此外,仅做环境预测的预训练能力可直接迁移到多轮Agent任务,在多个benchmark上取得显著提升,包括未见领域。Qwen开源了35B MoE版本及对应基准。AI模型QwenQwen-AgentWorld世界模型Agent强化学习推荐理由:通义千问出了个新模型,不是教Agent怎么动,而是先让模型懂环境变化。用模拟环境练出的Agent反而比真实环境练的还强,还开源了35B版,值得看看。原文
00:48LangChain@LangChainAI精选LangChain 创始人 Harrison Chase 将于6月24日举办网络研讨会“The Agent Development Lifecycle 101”,阐述构建可靠智能体的五步循环:构建、测试、部署、监控、改进。他强调了首次发布仅是开始,需要可重复的迭代流程来提升智能体性能。该研讨会面向所有构建智能体的团队,提供从工具、上下文、提示到评估的全流程指导。技巧LangChainHarrison Chase智能体开发工作流推荐理由:Harrison Chase 亲自讲怎么从零搭出靠谱的AI智能体,5步循环+真实案例,做Agent的别错过。原文
00:47berryxia@berryxia精选Matt Pocock发布/loop-me技能,要求用户先彻底审视日常工作,找出值得委托给AI的重复循环。它采用“grilling”面试法,一次只问一个问题并附带推荐答案,直到模糊点消除。最终产出清晰的workflows/.md规范文件,使实施者无需额外提问即可执行。目的是降低认知负荷,聚焦高价值决策。技巧Matt Pocock/loop-me工作流自动化开发者工具提示词工程推荐理由:Matt Pocock做了个/loop-me,不是直接替干活,而是帮你把流程理得清清楚楚,AI照着做就行,省心省力。原文
00:34AI Breakfast@AiBreakfastSuperNori 推出首个 Proactive Family AI Agent,专为家庭照料者打造。不同于传统 AI 助手或副驾驶,该 AI 能主动与用户对话,帮助处理家庭事务。产品已开放候补名单,用户可通过 YouTube 视频了解其工作方式。AI产品SuperNori智能体家庭AI主动式AI1 个信源在谈推荐理由:SuperNori 不是普通的助手,是第一个专门为家庭照料者做的主动式 AI,帮你操心家里的大小事。原文
00:29向阳乔木@vista8精选洪定坤提出用AI生成可交互原型替代PRD,提前暴露分歧。AI开发系统化流程包括AI写Spec、功能实现、Browser Use验证、自动提交上线。Harness基建通过上下文工程、架构约束、团队知识Memory和技术债梳理,将可交付性从40~60分提升至80分。技巧字节火山引擎洪定坤原型驱动开发AI开发工作流Harness基建推荐理由:字节火山引擎洪定坤分享了三个提升AI开发效率的方法,尤其Harness基建能帮你把交付质量从及格提到优秀。原文
00:24OpenRouter@OpenRouterAISakanaAI 推出 Fugu Ultra,这是一个多模型协作系统,已在 OpenRouter 平台上线。该系统让多个模型协同工作,旨在超越单一模型性能。它体现了“集体智能”理念,目前可在 OpenRouter 上试用。AI模型SakanaAIFugu UltraOpenRouter多模型集体智能推荐理由:想试试多个模型一起干活的效果?Fugu Ultra 在 OpenRouter 上就能玩,感受集体智能。原文
00:15Milvus@milvusio精选Milvus团队指出LLM在RAG中频繁引用了不支持的来源。引文失败分为两类:忠实性错误(生成内容与检索文档不符,如模型声称150W功耗但文档只说低功耗)和引文准确性错误(元数据映射错误、缺失引用、幽灵引用、弱支持引用、过度引用)。其中幽灵引用常因索引重建后ID过期导致。修复方案因错误类型而异:忠实性问题调整生成层约束或基座模型,引文准确性问题需工程层修复元数据管理。技巧RAG引文忠实性检索增强生成Milvus推荐理由:别总怪模型了,很多引文错误出在工程层。这篇文章帮你分清五种引文故障,对症下药。原文
00:10berryxia@berryxiaEverOS 是一个为 AI Agent 设计的开源记忆操作系统,在 ACL 2026 发表。其核心 HyperMem 采用超图结构组织记忆,在长期对话任务中召回率超过 93%,而传统 RAG 约 45%。加上 Skills 自进化策略后,27B 参数模型任务成功率提升 234.8%,性能追平 397B 模型。该项目在 GitHub 获得 7200 星,支持 Claude Code、Codex 等主流框架,安装只需三行命令。AI模型EverOSHyperMemACL 2026智能体记忆系统推荐理由:EverOS 开源了,安装三行命令就能让 AI 记住所有对话,27B 小模型靠记忆打败 397B 大模型,试试看。原文
23:40Geek@geekbb精选Pi Coding Agent 的 Web UI 采用双进程架构,会话守护进程与 Web 服务分离,确保 Agent 会话在服务器端持久运行。即使关闭浏览器或重启前端服务,会话也不会中断。该方案支持跨设备监督桌面和服务器上的 AI 编码 Agent,适合需要长期稳定运行编码任务的场景。技巧Pi Coding AgentWeb UI双进程架构持久化运行编程助手推荐理由:Pi Coding Agent 的 Web UI 让你关掉浏览器后编码任务还在服务器跑,跨设备也能接着监督,很实用。原文
23:29elvis@omarsar0Perplexity 发布了新功能 /learn 技能,通过智能体自动生成学习计划。该计划包含一个动态学习中心(artifact),可根据学习者的需求和进度实时调整。目前该功能已在 Perplexity 平台上线,用户可体验个性化学习路径。AI产品Perplexity/learn智能体学习计划个性化推荐理由:Perplexity 新出的 /learn 技能,能自动帮你制定学习计划,还会根据你学的情况动态调整,比自己瞎找资料高效多了。原文
23:24The Rundown AI@therundownai74°OpenAI 发布第一代自研芯片 Jalapeño,专为运行 LLM 设计,声称能效比“大幅超越当前最先进水平”。该芯片与 Broadcom 合作,仅用 9 个月完成开发。OpenAI 还利用自身 AI 模型辅助芯片设计与优化。AI产品OpenAIJalapeñoBroadcomAI芯片10 个信源在谈推荐理由:OpenAI 自己造芯片了,叫 Jalapeño,专门跑大模型,能效比吊打目前最好的,9 个月就和 Broadcom 搞出来了。原文
23:23OpenRouter@OpenRouterAIOpenRouter 发布全新专用 Image API,支持类型化动态能力。该 API 统一接入来自 Google、OpenAI、Black Forest Labs、Recraft、ByteDance、Sourceful、Microsoft 和 xAI 共8家提供商的30多个图像生成模型。开发者可通过单一接口调用多种模型,简化多模型集成流程。AI产品OpenRouterImage API图像生成多模型接入模型聚合10 个信源在谈推荐理由:OpenRouter 把30多个图像生成模型集中到一个API里,开发者不用挨个对接不同的服务商,省事多了。原文
22:58eric zakariasson@ericzakariassonGergely Orosz指出Anthropic正从追求最佳模型转向构建工具生态,推出了Slack集成。该集成允许用户在Slack中随时切换不同模型(如GPT-4、Claude等),从而避免对单一模型供应商的依赖。这一策略帮助Anthropic在开发者及非开发者工作流中建立更广泛的集成。推文讨论的Agent目前虽未正式发布,但反映了Anthropic的生态方向。行业AnthropicSlack模型无关智能体10 个信源在谈推荐理由:想摆脱模型锁定?看看Anthropic在Slack里的这个集成,能随时切换模型,不用吊死在一棵树上。原文
22:54Geek@geekbbOpenAI宣布推出其首款自研AI芯片Jalapeño,专为LLM工作负载设计,用于支持ChatGPT、Codex、API及未来智能体产品。该芯片由OpenAI从零设计,并与Broadcom合作生产。Jalapeño是OpenAI全栈平台从产品到模型再到基础设施的扩展,旨在扩大AI服务的规模和访问。AI产品OpenAIJalapeñoBroadcomAI芯片10 个信源在谈推荐理由:OpenAI自己造芯片了,叫Jalapeño,专门跑ChatGPT之类的大模型,和Broadcom合作,以后能更快更便宜地提供服务。原文
22:46LangChain@LangChainAI精选Jeff Barg在Interrupt会议上透露,Clay每月运行3.5亿个GTM智能体。他指出,缓存可将LLM调用成本降低高达70%。限制工具调用范围不仅能节省成本,还能提升输出质量。在多租户负载下,引入公平队列机制至关重要。技巧ClayGTM agentsLLM成本缓存工具调用推荐理由:做AI智能体上线的小伙伴必看,Clay的AI负责人亲自讲了怎么降本70%和优化队列,干货12分钟。原文
22:40阿里通义 Qwen@Alibaba_Qwen精选Qwen发布Paradigm II,一种基于世界建模的Agent基础模型。它通过单轮环境预测直接测试于多轮工具调用任务,无需Agent强化学习或任务特定调优。在7项基准上均取得提升,域内Terminal-Bench 2.0提升6.3%、SWE-Bench提升3.4%、WideSearch提升12.8%。域外基准Claw-Eval提升11.3%、QwenClawBench提升9.7%、BFCL v4提升9.0%。世界建模将'先预测后行动'内化为可迁移的推理模式。AI模型QwenParadigm II推理模型智能体世界模型推荐理由:Qwen做了个新Agent模型Paradigm II,不用额外训练就在终端、编码、搜索和工具调用任务上全涨分,尤其没见过的任务也管用。原文
22:39阿里通义 Qwen@Alibaba_Qwen精选73°阿里Qwen团队开源了Qwen-AgentWorld-35B-A3B模型,采用MoE架构,总参数量35B,每次推理激活3B参数,支持256K上下文长度。同时发布了AgentWorldBench基准,用于评估智能体的世界建模能力。该模型在多个现实环境模拟任务上表现优于同等规模模型。相关论文已发布于arXiv,代码和模型权重在GitHub和Hugging Face上开放。AI模型QwenAgentWorldMoE智能体世界建模推荐理由:阿里新开源了35B参数的MoE模型,只激活3B,256K超长上下文,配合AgentWorldBench,研究智能体世界建模的赶紧试试。原文
22:39阿里通义 Qwen@Alibaba_Qwen精选71°Qwen-AgentWorld是阿里Qwen团队发布的原生语言世界模型,在单一模型中模拟MCP、搜索、终端、SWE、Web、OS和Android共7种智能体环境。环境建模被设定为训练目标,而非后处理适配。在AgentWorldBench基准上,该模型超越Claude Opus 4.8和GPT-5.4。可控SimRL利用此世界模型作为环境进行强化学习,效果超过在真实环境中训练。仅通过预测环境的预热训练,无需智能体特定微调,预测知识即可零微调迁移至智能体任务。AI模型Qwen-AgentWorld智能体世界模型模拟环境强化学习推荐理由:阿里Qwen造了个能模拟7种环境的AgentWorld,在AgentWorldBench上干掉了Claude和GPT最新版,训练智能体不用真实环境也能更强,零微调迁移呢。原文
22:36小互@imxiaohu字节跳动推出新 AI 音乐模型 SeedMusic 1.0 Preview,用户输入一句话提示词即可在 2-3 分钟内生成一首完整歌曲。该模型支持古风、流行等风格混合,效果流畅且节奏感强。测试提示词为“来一首古风歌曲,但有现代流行节奏感”,输出结果朗朗上口。AI模型SeedMusic字节跳动音乐生成AI创作推荐理由:字节跳动新出的 SeedMusic 1.0 Preview 能一句话生成完整歌曲,2-3分钟出活,古风混流行节奏的效果挺不错。原文