07:30ChatGPT@ChatGPTapp88°OpenAI 推出 GPT-5.5 Instant 模型,声称更智能、更直观、对话更有趣。模型首先面向 Pro 和 Plus 用户开放,免费用户预计明天可用。当前推文获得 141 条评论、115 次转发和 2149 个点赞。AI模型GPT-5.5 InstantOpenAI智能对话推理模型10 个信源在谈推荐理由:OpenAI 发了新的 GPT-5.5 Instant,对话更聪明更自然,Pro 和 Plus 用户现在就能用,免费用户明天也能体验到。原文
07:27Weaviate@weaviate_io精选Engram 是 Weaviate 的记忆系统,能主动协调冲突信息。当用户从机器学习工程师晋升为 CEO,Engram 不会简单叠加两条记忆,而是先用 LLM 工具调用判断行动:重写旧记忆为“用户曾是工程师,现升为 CEO”,并删除新重复记忆。这样避免了记忆冗余,保持历史连贯,防止智能体上下文被矛盾事实污染。AI产品EngramWeaviate记忆协调智能体上下文管理推荐理由:Weaviate 的 Engram 解决了 AI 记忆的一大致命伤——信息冲突。不是简单存两笔,而是主动合成新版本,对做多角色 Agent 的朋友很实用。原文
07:25AK@_akhaliq开发者将GLM-5.2模型集成到hf-claude环境,并基于Gradio框架创建了面向Krea-2-Turbo的工作流。该工作流提供交互界面,简化了从模型调用到结果展示的流程。项目代码已在社交媒体分享,获得初步关注。技巧GLM-5.2hf-claudeKrea-2-TurboGradio工作流推荐理由:有人把GLM-5.2塞进hf-claude,做了个给Krea-2-Turbo用的Gradio界面,挺实用的。原文
07:24elvis@omarsar0精选Eric Xing 等人在 arXiv(编号 2606.23991)发表论文,尝试界定 agent 与 agency 的边界。论文基于笛卡尔哲学和科幻作品,提出分析 agent 架构的五个维度:目标、身份、决策、自我调节和学习。作者认为真正的自主性要求这些结构以特定方式整合。该研究为区分简单的工具调用循环与真正的智能体提供了概念框架。论文Eric XingarXiv 2606.23991智能体Agent定义论文推荐理由:想搞清楚什么才算智能体?这篇论文给出了五个硬指标,比瞎猜管用多了。原文
06:56orange.ai@oran_ge程序员不愿为软件付费,但老板愿意为程序员购买 Claude 和 Codex。中国人不愿为软件付费,但老板愿意为抽卡员购买 Seedance。中国 2B 市场进入历史上最有趣的 2boss 时刻,老板买单意愿强烈甚至焦虑。独立开发者愿为 Codex 付费,自媒体和短剧 OPC 也愿为 SD 付费,因为他们自己就是老板。行业ClaudeCodexSeedanceAI商业化2B推荐理由:Oran Ge 指出 AI 挣钱的关键不是让程序员掏钱,而是让老板给程序员买工具。Claude、Codex 和 Seedance 就是例子。原文
06:29Ate-a-Pi@svpino作者指出大多数AI智能体在持久记忆方面表现不佳,包括ChatGPT和Claude,它们容易忘记重要细节或抓住无关信息。这种不可靠的持久记忆是这些智能体未能达到承诺效果的关键原因之一。如果Vida能解决记忆持久性问题,作者表示愿意关注。行业ChatGPTClaudeVida智能体持久记忆推荐理由:有人吐槽现在智能体记忆太拉胯,连ChatGPT和Claude都记不住重点,看看Vida能不能搞定。原文
06:28Ate-a-Pi@svpino精选Tripo AI 推出 Project Eden 世界模型,与传统逐帧预测方案不同,它先构建包含几何、物体位置等真实状态的地图,再根据地图生成画面。该架构解决了传统模型遗忘问题,物体离开视线后仍存在于地图中,并支持多人/智能体共存与编辑。公司刚完成两轮近 2 亿美元融资,将在 SIGGRAPH 2026 展示。AI模型Tripo AIProject Eden世界模型3D融资推荐理由:Tripo AI 搞了个新世界模型 Project Eden,先建好地图再渲染,物体不会消失,还能多人同在一个世界。刚融资 2 亿美元,值得关注。原文
06:22Ate-a-Pi@svpino精选Lena开源了一个RAG助手,用于导航航空公司政策,包含完整源代码和视频讲解。该应用使用LangChain构建检索管道,LangGraph管理对话状态,通过pgvector在Postgres中存储嵌入。项目还使用Terraform部署基础设施,索引文档以将答案锚定在源文本上。开发者可以从中学习具体的工程决策和实现细节。技巧LangChainLangGraphpgvectorRAG开源项目推荐理由:Lena把整个RAG应用的源码和讲解视频都开源了,用LangChain+LangGraph搭建,还用了pgvector和Terraform,想学RAG实战的可以直接拿走。原文
05:58Fireworks AI@FireworksAI_HQFireworks AI 宣布其平台现支持对开源编码模型 GLM 5.2 进行微调,涵盖 SFT、DPO 和 RL 三种方法。GLM 5.2 在多个编码基准上表现强势,但 Fireworks 指出排行榜赢家未必适合你的代码库,微调可缩小差距。训练后的模型可直接在同一生产栈上提供服务,无需切换或迁移。早期客户反馈热烈,目前开放私测申请。AI产品GLM 5.2FireworksSFTDPO微调推荐理由:想用最强开源编码模型但通用版不顺手?Fireworks 让你微调 GLM 5.2,SFT/DPO/RL 全包,训练完直接上线,不用折腾。原文
05:57a16z@a16z76°AI 初创公司 Mirendil 宣布完成 2 亿美元种子轮融资,由 a16z 和 Kleiner Perkins 共同领投,NVIDIA 等参投。公司由 Behnam Neyshabur 联合创立,团队 20 人来自 Anthropic、xAI、Google DeepMind 和 OpenAI。Mirendil 提出“自加速 AI”概念,让 AI 像科学家一样在特定领域积累深度专业知识,从而加速自身研发进程,并计划将这一能力开放给更多科研机构和企业。行业Mirendila16zNVIDIA融资自加速 AI10 个信源在谈推荐理由:Mirendil 刚融了 2 亿美元,要造能自己加速研发的 AI,团队全是前沿机构出来的,想法挺前沿。原文
05:56Guillermo Rauch@rauchgVercel 通过 AI Gateway 独家推出 GLM 5.2 Fast (via Wafer) 模型。内部基准测试显示,其 token 吞吐量比其他提供商快 2 倍。该模型可通过指定 'zai/glm-5.2-fast' 调用。开发者可在 Vercel 平台上直接使用,无需额外配置。AI模型GLM 5.2 FastVercel AI GatewayWafer推理模型高吞吐量推荐理由:Vercel 搞了个 GLM 5.2 Fast,速度是其他家的两倍,做推理任务可以试试。原文
05:54GitHub@githubGitHub 推出了 Copilot 独立应用,支持 iOS 和 Android 平台。用户可以直接在手机上使用 AI 编程助手,通过聊天方式获取代码建议、解释和调试帮助。该应用与 GitHub 账号关联,免费用户每月有 2000 条代码补全和 50 条聊天请求。下载后即可体验 Copilot 的核心功能。AI产品GitHub Copilot编程助手应用GitHub推荐理由:GitHub 出了 Copilot 的应用版,手机就能用,编程新手和老手都可以试试,免费额度也够玩。原文
05:39lmarena.ai@lmarena_ai71°GLM-5.2 (Max) 在 Code Arena: Frontend 排名第二,仅次于 Fable 5,但击败了 Claude Opus 4.8 (Thinking) 和 Opus 4.7 (Thinking)。对 Kimi-K2.6 胜率 61.0%,对 Sonnet 4.6 胜率 59.4%,对 Opus 4.7 (Thinking) 胜率 55.0%。最接近的挑战来自 GPT-5.5 (xHigh)(41.7% vs 40.0%)和 Opus 4.6(47.0% vs 42.4%)。与前任 GLM-5.1 打成平手(45.5% - 45.5%)。在 Brand & Marketing、Data & Analytics 等多项子类别中排名第一。AI模型GLM-5.2OpusKimi-K2.6代码生成前端开发推荐理由:GLM-5.2 在前端任务上干掉了 Claude Opus 系列,对 Kimi 和 Sonnet 胜率超 60%,开源模型里相当能打。原文
05:27Fireworks AI@FireworksAI_HQ精选Fireworks AI 宣布攻克了在前沿模型上使用强化学习时,保持训练和推理数值完全一致(零KLD)的难题。他们将该解决方案作为托管服务提供,首发支持 GLM 5.2 模型。这项服务确保端到端数值对齐,简化了RL训练流程。AI产品Fireworks AIGLM 5.2强化学习推理优化推荐理由:Fireworks AI 把强化学习里最头疼的数值一致性问题搞定了,还能直接托管GLM 5.2,省去自己搭基础设施的麻烦。原文
05:24Latent.Space@latentspacepod精选Databricks 联合创始人 Matei Zaharia 和 Reynold Xin 在播客中解释了公司为何切入企业智能体的基础设施层。他们介绍了 Omnigent 如何为编码智能体和自定义智能体创建共享框架。两人还讨论了 LTAP 和 Lakebase 如何重构操作型与分析型数据库的分离。此外,他们强调智能体安全需要上下文策略和支出控制,并认为未来软件的核心是让数据就绪并在此基础上运行智能体。行业DatabricksOmnigentLTAPLakebase企业智能体推荐理由:听听 Databricks 创始人亲自讲他们为什么要做企业智能体基础设施,还有 Omnigent、LTAP 这些新东西到底想解决什么实际问题。原文
04:58Y Combinator@ycombinatorTaktile 完成 1.1 亿美元 C 轮融资,由 Y Combinator 等支持。该公司为银行和保险公司提供 AI 代理,自动化交易风控、理赔处理和客户入职等决策流程。Taktile 表示,其方案能将原本耗时数周的任务缩短至几分钟。行业Taktile融资智能体金融风控推荐理由:Taktile 刚拿到 1.1 亿美元 C 轮,用 AI 代理把银行审批从几周缩到几分钟,做金融风控的老铁可以关注。原文
04:57Marc Andreessen@pmarca73°新创公司 Mirendil AI 今日宣布完成 2 亿美元种子轮融资,由 a16z 和 Kleiner Perkins 领投,NVIDIA 跟投。公司由 Behnam Neyshabur 等四位联合创始人领导,核心团队共 20 名研究者与工程师,来自 Anthropic、xAI、Google DeepMind 和 OpenAI。Mirendil 定位于构建自加速 AI 研发系统,目标是通过 AI 推动科学进步,并主张让更多实验室自主控制 AI 基础设施。行业Mirendila16zKleiner PerkinsNVIDIA融资10 个信源在谈推荐理由:a16z 和 Kleiner Perkins 联手投了两亿美元,团队全是大厂顶尖人才,就是要搞AI自己加快研究速度的路子,跟传统实验室玩法不同。原文
04:55Y Combinator@ycombinatorCoval 为企业提供模拟和可观测性平台,用于测试、监控和评估 AI 语音代理,每月处理数千万通电话。客户包括 Perplexity 和 Deepgram。公司刚完成 2820 万美元 A 轮融资。CEO Brooke Hopkins 此前在 Waymo 领导评估基础设施,发现经验可迁移至语音代理。她将广泛评估想法聚焦为企业平台,曾有客户在未写代码前就愿付费。行业CovalPerplexityDeepgram语音代理A轮融资1 个信源在谈推荐理由:Coval 刚拿了 2820 万美元,帮企业测语音代理,客户有 Perplexity 和 Deepgram,创始人从 Waymo 的经验移植过来,值得一看。原文
04:54Harrison Chase@hwchase17UnifyGTM 推出面向外向销售人员的聊天界面,集成 Claude 模型,可连接 40+ 数据源无需编程。公测前几周内产生 57,548 条查询,周环比增长 45%。产品面向 AEs 和 SDRs,支持自服务注册。AI产品UnifyGTMClaude销售自动化数据查询推荐理由:把 Claude 塞进销售数据查询,零代码连40+数据源,周增45%很猛,做外销的赶紧试试。原文
04:54Harrison Chase@hwchase17hwchase17 在 X 上分享了一个巧妙思路:用 tracing(追踪)来作为 AI 系统的 memory(记忆)。该推文获得 1461 次查看、7 个喜欢和 3 条回复。Strata 和 ChainZenit 等用户也参与了讨论。这种方法无需额外数据库,仅利用追踪日志即可实现上下文记忆。技巧hwchase17StrataChainZenit记忆追踪推荐理由:LangChain 创始人 hwchase17 分享了一个超聪明的做法——用 tracing 记录来当记忆用,省掉专门搭数据库的麻烦。原文
04:26Simon Willison@simonw用户 Simon Willison 反馈,Claude Code for Web 在执行包含 clone 命令的 prompt 时,系统报错“GitHub is blocked by egress policy”,导致无法访问 GitHub 仓库。该问题严重影响依赖 GitHub 的工作流,已被多位用户关注并 @ClaudeDevs 和 @claudeai 询问,疑似已知 bug,目前尚无官方回复。AI产品Claude CodeGitHubSimon Willison编程助手阻止访问推荐理由:Claude Code 连 GitHub 都连不上了,我 prompt 里全是 clone 仓库,这下全废了。别踩坑。原文
04:24elvis@omarsar0谷歌推出了Gemini 3.5 Flash模型,专注于计算机使用场景的智能体循环和长任务。该模型旨在满足对更强大计算机使用模型的需求,同时保持低成本。用户表示对Gemini 3.5 Flash的效率尚不确定,但赞赏其作为替代选项的出现。AI模型Gemini 3.5 FlashGoogle智能体工具使用推荐理由:谷歌新出了一个Gemini 3.5 Flash,专门优化了计算机使用场景,做长任务和智能体循环可能更划算,值得试试。原文
04:21a16z@a16z81°Mirendil AI 完成 2 亿美元种子轮融资,由 a16z 和 Kleiner Perkins 联合领投,NVIDIA 参与投资。该公司正构建一个专精 AI 研发的自主系统,类似为研究设计的编码智能体,可自行控制 GPU 并循环执行科研与工程任务。创始团队 20 人来自 Anthropic、xAI、Google DeepMind 和 OpenAI。行业Mirendila16zNVIDIA融资自主AI研究10 个信源在谈推荐理由:Mirendil 要做让 AI 自己搞 AI 研发的系统,2 亿美元种子轮,团队来自顶尖实验室,目标是打破大厂垄断。原文
04:17腾讯混元 Tencent Hunyuan@TencentCloud腾讯云将于2026年7月10日在东京举办“AI in Action: Building Enterprise AI with Tencent Cloud MaaS Workshop”邀请制活动。工作坊重点包括Tencent Cloud MaaS最新更新、AI Agent应用、工作流自动化,以及TokenHub的现场演示,旨在帮助企业从实验AI转向实际部署。RinFamily将分享TokenHub使用案例,活动还设有WorkBuddy和Miora AI工作站动手环节。行业Tencent CloudMaaSAI Agent企业AI腾讯云推荐理由:腾讯云在东京办了个闭门工作坊,专门讲怎么把AI塞进企业流程。有MaaS更新、TokenHub上手演示、还有AI Agent案例,适合想落地AI的公司。原文
03:54Notion@NotionHQ根据NotionHQ发布的数据,在AI成熟度最高的组织中,员工对AI输出的低信任度下降了8%,技能差距缩小了3%。但工具扩散率增加了14%,衡量实际影响的难度提高了9%,模型性能一致性下降了5%。这表明AI转型后期挑战从建立信任转向系统控制。行业NotionAI转型企业AI工具扩散AI治理推荐理由:Notion用具体数据告诉你:AI搞到后面更难管,工具多、效果难衡量、模型还不稳定,想避坑就快看。原文
03:54Harrison Chase@hwchase17LangSmith Engine 支持将智能体轨迹追踪到 LangSmith,通过后台分析轨迹自动生成记忆更新建议。更新后的记忆存储在 Context Hub 中,实现类似睡眠时间计算(sleep time compute)的离线记忆优化。该方法由 Harrison Chase 在教程中演示,视频地址附于推文。技巧LangSmith智能体记忆工作流推荐理由:Harrison Chase 教你用 LangSmith Engine 让智能体在后台自动更新记忆,看完就能上手操作。原文
03:51Greg Brockman@gdbJalapeño是一款全新设计的芯片,专为大语言模型推理优化,开发周期长达九个月。其能效比(perf/watt)根据发布方宣称表现惊人。目前尚未公布具体基准测试数据或对比结果。AI产品JalapeñoLLM推理芯片能效比推荐理由:gdb团队搞了个新芯片Jalapeño,专门跑大模型推理,说能效比特别猛,想了解硬件新动向的可以看看。原文
03:42Harrison Chase@hwchase17文章介绍了智能体记忆管理的三步流程:首先运行智能体,然后分析其运行轨迹,最后基于分析结果更新记忆。该方法由Jake Broekhuizen分享,适用于提升智能体在多次交互中的表现。流程强调了对历史行为的自动化反思和记忆调整,是构建持久性智能体的实用技巧。技巧智能体Agent记忆管理工作流推荐理由:Jake Broekhuizen分享了一个超实用的Agent记忆循环:跑Agent → 分析记录 → 更新记忆。简单三步,自己也能复现。原文
03:33Notion@NotionHQNotion对10个市场的6000名专业人士进行调研,发现虽然AI技术进展迅速,但大多数公司尚未有效应用。调查显示,只有少数企业将AI融入工作流,多数仍处于观望或试点阶段。报告指出,这种差距可能导致竞争分化,但同时也为后来者提供了学习机会。行业NotionAI采用行业调查企业级AI推荐理由:Notion做了个6000人的调查,说AI跑得快但公司没跟上,看看你公司属于哪一拨原文
03:27NVIDIA AI@NVIDIAAI精选NVIDIA 发布 Metropolis Blueprint for Video Search and Summarization (VSS) 3,允许用自然语言提示分析实时流和视频库。新版本包含16种智能体技能,如搜索、摘要、警报、报告和片段审查。提供统一开源仓库,附带 Docker 和 Helm 部署配置以加速部署。支持多视频报告,集成 Nemotron 3 Nano Omni 模型实现跨视频和音频的规模化洞察。3D 多摄像头追踪达到生产就绪级别,并取得 SOTA 性能。AI模型NVIDIAMetropolisVSS 3视频搜索智能体7 个信源在谈推荐理由:NVIDIA 刚发了 VSS 3,你的编程代理现在能用一句话搜索、总结视频了,新增16种技能和3D追踪,比以前好用得多。原文
03:24Genspark@genspark_aiGenspark 推出 Genspark Design,一款基于 Claude Opus 4.7 的 AI 设计工具。用户无需设计背景即可从草图生成专业设计,支持 UI 原型、视频、HTML 动画和海报。可上传 Figma 文件或保存设计复用于项目,并一键将设计转化为工作代码(基于 Genspark Code)。目前处于首发定价阶段。AI产品Genspark DesignClaude Opus 4.7设计工具代码生成Figma6 个信源在谈推荐理由:不用学设计软件,上传 Figma 或画个草图就能出 UI、视频、动画,还能一键转代码,设计师和产品经理都该试试。原文
03:03宝玉@dotey83°6月12日美国商务部以国家安全为由,对 Anthropic 的 Fable 5 和 Mythos 5 模型发布出口管制令,因亚马逊研究团队声称找到绕过安全护栏的方法。Anthropic 被迫关闭这两款模型,影响数亿用户。多轮谈判后,白宫态度转暖,原因之一是联合创始人 Tom Brown 取代了难以沟通的 Amodei。Tom Brown 是 GPT-3 首席工程师,目前负责计算基础设施。国会两党四名众议员要求商务部解释管制依据,回复截止 6 月 26 日。行业Fable 5AnthropicTom BrownAI安全出口管制10 个信源在谈推荐理由:Anthropic 为让 Fable 5 重新上线,换了谈判代表 Tom Brown。这次谈判可能影响未来 AI 出口管制。原文
03:01Nous Research@NousResearchNousResearch推出名为“creative-ideation”的技能,能分析用户提示词并通过22种来自艺术家和思想家的创意方法论进行路由。该技能旨在平衡可行性与创造力,为AI agent提供新鲜灵感。它解决了现有agent难以理解创意情境的问题,灵感来源涵盖毕加索、达芬奇等大师。AI产品NousResearchcreative-ideation提示词工程智能体推荐理由:你的AI agent总get不到创意?试试NousResearch这个新技能,用22种艺术家方法论帮你调提示词,让输出更有灵感。原文
03:00Waymo@WaymoWaymo 宣布其完全自动驾驶已累计行驶超过2.2亿英里,且安全性能数据始终一致。即使扩展到机场和新城市等复杂环境,安全优势仍在持续累积。详细分析可在 Waymo Safety Data Hub 查看。行业Waymo自动驾驶安全行驶里程1 个信源在谈推荐理由:Waymo 刚晒了成绩单:完全无人驾驶跑了2.2亿英里,安全表现一直很稳,还覆盖了机场和新区,想细看数据直接点 Safety Data Hub。原文
02:44Notion@NotionHQ精选Notion 宣布与 Cursor 集成,用户可在 Notion 中启动任务,然后跳转到 Cursor 继续。每个会话都会创建一个 Cursor Cloud Agent,保留用户的账户环境、权限和连接。Agent 可让用户在 Cursor 中从上次中断处无缝接续工作。该功能旨在提升跨工具协作效率。技巧NotionCursorCursor Cloud Agent工作流集成6 个信源在谈推荐理由:Notion 和 Cursor 打通了,你可以先在 Notion 里写草稿,再跳到 Cursor 让 Agent 接着干活,环境权限都给你留着。原文
02:43Notion@NotionHQNotion 宣布与 Cursor 集成,用户可在任务板上创建专用 Cursor 智能体,覆盖产品开发全生命周期。这些智能体可用于修复 bug、构建功能、审查代码。每次 Cursor 运行结果都会在 Notion 中保持可见、可审查,并与具体任务关联。这一功能将 AI 编程助手直接嵌入项目管理流程。AI产品NotionCursor编程助手智能体9 个信源在谈推荐理由:Notion 把 Cursor 集成进来了,你能在任务板上直接创建 AI 编程助手,修 bug、写功能、审代码一条龙,还很透明。原文
02:42Notion@NotionHQNotion团队将客户bug或功能请求分配给Cursor agent。agent读取任务简报,在代码库中工作并自动打开PR。该流程让非工程成员也能交接实际工程工作。Cursor作为AI编程助手,可理解上下文并生成代码变更。这展示了AI agent在协作中的实际应用。技巧CursorNotion编程助手工作流智能体9 个信源在谈推荐理由:Notion团队用Cursor自动处理bug和功能请求,连PR都自动开,省掉了手动交接的功夫,值得试试。原文
02:41DeepLearning.AI@DeepLearningAIDeepLearning.AI 发起7天语音AI构建挑战,教你用编码代理自动提醒而不必盯着终端。活动截止日期为6月30日。参与者将学习如何让AI主动呼叫你,解放监控终端的负担。技巧DeepLearning.AI语音AI编码代理挑战赛推荐理由:DeepLearning.AI 搞了个7天挑战,教你用语音AI让编码代理自动呼叫你,不用死守终端。活动到6月30日截止,想学赶紧上车。原文
02:37AK@_akhaliq阿里发布Qwen-AgentWorld,一个基于Qwen的语言世界模型,专为通用智能体设计。该模型旨在帮助智能体理解环境动态并做出决策。目前尚未公开具体的基准测试结果或性能数据。AI模型Qwen-AgentWorldQwen阿里智能体世界模型推荐理由:阿里出了AgentWorld世界模型,让智能体能更好地理解环境,做Agent开发的朋友可以关注一下。原文
02:35Notion@NotionHQNotion 宣布与 Claude 集成,用户可在文档中直接调用 Claude。Claude 能读取用户代码库,根据粗略的 PRD 自动补全技术细节,并原地更新文档。该功能支持团队成员在文档内编辑和评论,提升技术文档编写效率。AI产品NotionClaudePRD代码库文档协作4 个信源在谈推荐理由:Notion 这次把 Claude 直接嵌入文档,你给个毛坯 PRD,它读你代码库帮你填成精装版,团队还能直接改,写技术文档省事了。原文