03:37@koltregaskes@koltregaskesKolt Regaskes指出AI的真正价值不在于提笔速度,而在于缩小反馈循环。他提出了5条具体操作:从明确成果而非模糊提示出发;让AI通过检查表、例稿等方式自我校验;将任务拆分为研究者、起草者、审稿者、编辑者角色;用文档存储上下文而非依赖记忆;设定升级规则,AI卡壳2-3次后切换模型或简化步骤。这套方法能帮助知识工作者以“推理速度”产出决策、总结和计划,减少往返错误。技巧工作流提示词工程反馈循环AI效率推荐理由:别只把AI当打字机。试试这5条实操,让AI帮你还原真实工作流,更快拿到靠谱结果。原文
03:36@koltregaskes@koltregaskes用户Kolt Regaskes在X上爆料,他在通过Linear和Github连接器使用ChatGPT时,仅讨论了Anthropic的新闻,却发现ChatGPT的思考内容被审查。OpenAI未公开审查原因。该事件引发对AI内容监管和连接器权限的讨论。AI产品ChatGPTOpenAI内容审查连接器Anthropic10 个信源在谈推荐理由:ChatGPT居然在你用第三方工具时偷偷审查内容,连聊Anthropic都要管,这太离谱了,赶紧看看怎么回事。原文
03:36@koltregaskes@koltregaskes88°美国政府以国家安全和越狱漏洞为由,强制Anthropic关闭Fable 5和Mythos 5模型。指令仅基于口头证据,未提供具体技术细节。Anthropic声称该漏洞很窄,且GPT-5.5也能实现相同功能。同时禁止所有外国人访问,包括Anthropic的外籍员工。此事发生在Anthropic拒绝与五角大楼签订军事监控合同四个月之后。行业AnthropicFable 5Mythos 5GPT-5.5出口管制10 个信源在谈推荐理由:美国政府让Anthropic关了两个模型,理由含糊,还禁止外国人访问。有人猜是因为Anthropic之前没接五角大楼的军事合同。原文
03:35@koltregaskes@koltregaskesFable 5 在多个模型排行榜上表现突出,相较此前版本实现罕见的大幅提升。该模型在多项基准测试中显著碾压其他对手,但不是在所有任务上都优秀。这一成绩引发对 OpenAI 等竞争者如何应对的讨论。AI模型Fable 5模型排行榜基准测试10 个信源在谈推荐理由:Fable 5 在排行榜上把其他模型都压下去了,看看它到底强在哪原文
03:28AI Engineer@aiDotEngineerOpenAI、Anthropic、Google DeepMind、Amazon AGI Labs、Zai和MiniMax共六家前沿AI实验室确认参加2025年World's Fair。活动将于6月29日至7月2日在旧金山举行,由ai.engineer主办。这是模型开发者与基于这些模型构建应用的开发者首次同场交流。行业OpenAIAnthropicGoogle DeepMind行业活动World's Fair10 个信源在谈推荐理由:六家顶尖AI实验室要凑一块儿了,6月底旧金山,模型开发者直接和做应用的聊,机会难得。原文
03:28lmarena.ai@lmarena_aiAgent Arena 是一个智能体性能排行榜,现已在 arena.ai/leaderboard/ag... 上线。用户可通过按开放模型或按实验室(lab)筛选来查看详细数据。该排行榜为不同智能体模型提供了直接的性能对比基准。AI模型Agent Arena智能体排行榜基准测试开放模型推荐理由:想比对比不同智能体模型?去Agent Arena排行榜,能按开放模型或实验室筛选,帮你找到合适的。原文
03:05vLLM@vllm_project精选vLLM 发布 0.23.0 版本,为 Zai.org 的 GLM-5.2 模型提供 Day-0 支持。GLM-5.2 拥有 1M token 上下文窗口,专为长周期编码智能体设计,可承载从需求到部署的完整开发流程。该模型针对大规模代码实现、自动化研究和性能优化进行了调优,支持客户端和移动端内调试。用户即日起可通过 vLLM 运行该模型。AI模型vLLMGLM-5.21M token编程助手推理模型推荐理由:vLLM 刚发的 0.23.0 直接支持了 GLM-5.2,这个模型有 100 万 token 上下文,适合一口气写完整个项目代码,还能跨平台部署,写代码的可以试试。原文
03:05OpenRouter@OpenRouterAI精选智谱AI的GLM-5.2模型已在OpenRouter平台上线。该模型拥有100万token的上下文窗口。它专为长周期、混乱的编码代理任务设计,能保持可靠性。AI模型GLM-5.2Z.aiOpenRouter超长上下文智能体推荐理由:GLM-5.2在OpenRouter上架了,百万级上下文处理复杂编码任务,适合做长周期智能体。原文
03:04Satya Nadella@satyanadella微软宣布 Copilot Cowork 在全球范围正式可用,新增多模型支持。该工具允许企业部署长期运行代理,处理复杂多步任务,并结合组织内部知识进行决策。目前已在 Microsoft 平台上开放。AI产品Copilot Cowork微软多模型智能体企业应用推荐理由:微软刚发布了 Copilot Cowork,支持多模型,能自动跑复杂任务,用你公司的数据干活。原文
03:04OpenRouter@OpenRouterAI精选Z.ai 发布 GLM-5.2 模型,采用 MIT 开源许可。该模型在编码和智能体任务上有显著提升,支持最长 1M 标记的上下文窗口。提供两种推理强度:GLM-5.2 (max) 追求极限性能,GLM-5.2 (high) 平衡性能与 token 效率。API 定价与 GLM-5.1 保持一致。AI模型GLM-5.2Z.ai开源模型编码助手智能体推荐理由:Z.ai 新出的 GLM-5.2 模型,编码和智能体能力大幅增强,还有 1M 超大上下文,而且开源!API 价格没涨,值得试试。原文
03:03berryxia@berryxia73°NVIDIA开源了SOMA-X v0.2,一个使用单一骨架就能适配各种体型的3D人体模型。该模型具备关节扭转自动修正、骨骼自动缩放、高级姿态反转和超轻量数据特性,采用Apache 2.0许可证。它专为机器人和物理AI设计,可用于机器人训练、物理仿真和动作迁移,解决了不同机器人体型不统一导致动作数据难以复用的问题。AI模型SOMA-XNVIDIA3D人体模型机器人物理AI10 个信源在谈推荐理由:NVIDIA开源了SOMA-X v0.2,单一骨架就能适配不同体型,机器人动作数据复用门槛降低,训练效率提升。原文
03:02LangChain@LangChainAILangChain 推出新功能,支持多步骤工作流中状态跨工具调用持久化。提供突发容量,可在秒内扩展到数千个并行环境,适用于强化学习训练或评估。还增强了对用户输入可能被执行的场景的处理能力。这些特性面向需要可靠状态管理和高速扩展的复杂 Agent 与批量评测场景。AI产品LangChain工作流状态持久化并行扩展RL训练推荐理由:LangChain 终于解决了多步工作流状态丢失的痛点,还能秒级拉起数千个并行环境做 RL 训练,适合做复杂 Agent 和批量评测。原文
03:01LangChain@LangChainAILangSmith Sandboxes 允许 agent 在响应前验证生成的代码是否运行。适用于构建编码助手、CI agent 或数据管道等需要操作真实文件的场景。该功能解决了 agent 仅能描述而不能实际执行的问题。AI产品LangSmith智能体代码生成CI工具数据管道推荐理由:LangSmith 推出了 Sandboxes,让 agent 真正跑代码并验证结果。适合做编程助手、CI 自动化或数据处理。原文
03:01LangChain@LangChainAILangChain 推出 LangSmith LLM Gateway,将智能体治理直接嵌入开发平台。该网关允许开发者在构建、观察和评估智能体的同一界面中执行安全规则,无需事后额外配置。它支持对 LangChain 智能体进行实时治理,确保合规与安全。AI产品LangChainLangSmithLLM Gateway智能体治理智能体1 个信源在谈推荐理由:想给智能体加治理规则?LangChain 新出的 LLM Gateway 直接在开发平台里搞定了,不用再另外折腾。原文
03:01lmarena.ai@lmarena_ai精选72°GLM-5.2 (Max) 在 Agent Arena 排行榜上排名第10,得分接近 Claude-Opus-4.8(非推理模式)。它成为排名最高的开源模型,较去年发布的 GLM-5.1 从第13位上升3位。该模型在数百万真实长程任务上评测,可调用网页搜索、文件系统和终端工具。GLM-5.2 (Max) 输入/输出定价保持为每百万 token 1.4/4.4 美元,支持1M上下文窗口,权重采用 MIT 许可开源。AI模型GLM-5.2Zai_orgAgent Arena开源模型智能体推荐理由:Zai_org 发了 GLM-5.2,在 Agent 任务榜单上排第10,碾压所有开源模型,而且价格没变。跑复杂工作流、调工具效果明显进步。原文
02:58Arthur Mensch@arthurmenschArthur Mensch宣布与全球公司和政府合作,使用Forge工具确保AI系统远离外部控制并提升效率。Forge基于记录的人机交互持续训练模型,每次模型发布都会迭代改进。该工具强调成本结构优化,通过高效训练实现可控性。AI产品Forge微调智能体AI安全推荐理由:Forge让你用真实人机交互数据持续微调模型,成本低、可控性高,适合企业和政府部署AI。原文
02:43Google Gemini App@GeminiAppGoogle Gemini App 推出 Daily Brief 功能,可在每天早晨自动为你整理日程。用户可以通过点按 👍或 👎 直接反馈,让 Gemini 更了解你的偏好。你也可以通过“与 Gemini 聊天”进一步调整简报内容。点击简报条目下的‘更多’可查看 Gemini 引用的具体邮件、聊天或 Google 日历事件。这些技巧能帮你更好地利用 Daily Brief 管理日常事务。技巧GeminiDaily Brief智能体提示词工程推荐理由:Google Gemini 的 Daily Brief 能自动汇总你的日程、邮件和聊天记录,早上看一眼就心里有数。三个小技巧教你调教它,让 AI 越来越懂你。原文
02:37LlamaIndex@llama_index精选LlamaIndex 团队为 Claude 构建了自定义 PDF 解析技能,利用真实使用痕迹发现 AI agent 反复读取同一文件、不必要截图等浪费步骤。修复后,每问题成本降低 37%,回答质量全面提升且浪费步骤减少。该案例展示了如何通过分析 agent 痕迹来定位并修复性能瓶颈。技巧ClaudeLlamaIndex智能体PDF 解析成本优化推荐理由:LlamaIndex 手把手教你用 traces 优化 Claude 的 PDF 解析,成本直降 37%,答案还更准了,值得一试。原文
02:17kimmonismus@kimmonismus77°GLM-5.2 以 MIT 许可证开源,权重开放。该模型支持 1M token 上下文窗口。提供 max 和 high 两种推理模式。专门针对大规模部署、自动化研究、性能优化和复杂调试进行训练。API 定价与 GLM-5.1 保持一致。AI模型GLM-5.2智谱开源模型长上下文推理模型推荐理由:智谱开源了 GLM-5.2,1M 上下文还能选推理模式,做长代码任务更强了。原文
02:09kimmonismus@kimmonismusAxios报道称微软正考虑在Copilot Cowork中提供DeepSeek V4作为更便宜的模型选项。微软高管Charles Lamanna表示用户每周执行数百个任务导致成本过高,因此Copilot Cowork将转向基于使用量的定价模式。如果采用DeepSeek,该模型将是可选的、经过微调和安全防护,并完全托管在Azure上。此举意味着中国AI模型将进入微软的企业Copilot产品。行业MicrosoftCopilot CoworkDeepSeek V4Azure企业AI推荐理由:微软为了省钱,打算在Copilot里用DeepSeek V4,还改成了按用量收费。这对企业用户来说是个大变化。原文
02:00a16z@a16zCursor CEO Michael Truell在Lenny's Podcast中表示,目标是要发明新型编程方式。他认为编程语言将向伪代码演进,代码会看起来更像英语。未来软件逻辑表达会更简洁易读,不再是难以理解的百万行代码。同时,SpaceX宣布行使期权收购Cursor,将合作训练AI模型。行业CursorSpaceXAI编程伪代码编程助手10 个信源在谈推荐理由:程序员朋友注意了!Cursor的CEO亲口说未来写代码就跟写英文一样,而且SpaceX刚宣布要收购他们,这波操作很震撼。原文
01:59lmarena.ai@lmarena_aiAgent Arena 在其官方博客中介绍了用于智能体评估的因果追踪方法论。该方法可帮助研究人员分析智能体决策背后的因果链路。Agent Arena 平台本身支持多种智能体基准测试。AI模型Agent Arena智能体评估基准因果追踪推荐理由:Agent Arena 的因果追踪方法能帮你搞懂智能体为什么那么做,比单纯看分数更有用。原文
01:58Jim Fan@jimfan精选72°ENPIRE赋予8个Codex智能体机器人集群和GPU资源,自主完成高精度物理任务。系统能独立绑扎带、整理细针、安装GPU。实验显示8台机器人并行探索比少量效率显著提升。NVIDIA GEAR实验室已实现机器人彻夜自主改进。团队计划开源全部代码。AI产品ENPIRECodexNVIDIA智能体机器人10 个信源在谈推荐理由:NVIDIA让8个AI智能体自己控制机器人干活,还能绑扎带装显卡,而且要开源,你可以在家搭机器人实验室了!原文
01:57Jim Fan@jimfan76°NVIDIA联合CMU和伯克利推出ENPIRE系统,让AI智能体完全自主控制真实机器人循环,包括重置环境、搜索文献、实现想法、训练部署、自我验证等步骤。该系统在整理别针、安装GPU、绑扎带等灵巧任务上达到99%成功率。机器人通过自提出启发式成功信号进行爬坡优化,无需人类介入。AI模型ENPIRENVIDIA机器人智能体自主循环8 个信源在谈推荐理由:NVIDIA搞了个ENPIRE,让AI自己操控机器人反复试错,真实任务成功率干到99%,连GPU都能自己插。原文
01:37GitHub@githubGitHub 官方账号发布,开发者 @leereilly 利用 Copilot CLI 创建了一个终端游戏。该游戏能根据代码库结构生成地牢,将文件和目录映射为房间与怪物。玩家可在终端中探索自己的项目。该推文获得了 3955 次浏览。技巧GitHub Copilot CLIleereilly编程助手游戏开发推荐理由:GitHub 官推分享了一个好玩的东西:用 Copilot CLI 把你的代码库变成 Roguelike 游戏,想试试看吗?原文
01:31lmarena.ai@lmarena_ai精选MiniMax M3 在全新 Agent Arena 排行榜上位列第18,是排名第5的开源模型。相比 M2.7,M3 从第22名升至第18名,主要改进是任务成功确认和 bash 错误恢复能力。工具幻觉保持低位,与最佳模型并列第一。排行榜基于30万+任务、200万+工具调用和4000万行代码的代理会话评估。AI模型MiniMaxM3Agent Arena开源模型智能体推荐理由:MiniMax M3 在 Agent Arena 上排名上升了4位,是最强开源模型之一,能写代码、做PPT、查资料,幻觉控制也顶级。原文
01:31Martin Fowler@martinfowlerMartin Fowler 与 Bayer 合作,使用 AI 帮助制药研究人员从大量 PDF 报告中查询数十年的信息。Sarang Sanjay Kulkarni 描述了从关键词搜索到能够起草监管报告的研究助手的演进过程。该文章详细介绍了如何构建可靠的 AI 查询系统,提升制药研发效率。技巧BayerMartin FowlerRAGPDF查询监管报告推荐理由:Martin Fowler 分享了和 Bayer 合作的 AI 应用,能从海量 PDF 里找到信息甚至帮你写报告,挺实用的原文
01:28宝玉@dotey83°SpaceX宣布以600亿美元全股票交易收购AI代码编辑器Cursor的母公司Anysphere,这是SpaceX上市数天后的首笔大型收购。Cursor成立于2022年,年化收入已达26亿美元,此前估值293亿美元,这次溢价一倍。SpaceX表示过去几个月已用xAI的超算Colossus与Cursor联合训练模型,预计近期上线Cursor和Grok Build。交易预计第三季度完成,若告吹SpaceX需支付15亿美元现金加85亿美元算力资源的分手费。行业SpaceXCursorAnysphereAI代码编辑器收购10 个信源在谈推荐理由:SpaceX刚上市就花600亿美元买下Cursor,直接杀入Claude Code和OpenAI Codex的战场,Grok开发者工具这下有牌了。原文
01:28a16z@a16zSpaceX 宣布行使期权以全股票交易收购 AI 编程助手 Cursor,旨在构建最实用的 AI 模型。SpaceXAI 与 Cursor 已联合训练一个模型,将发布于 Cursor 和 Grok Build。Michael Truell(Cursor 创始人)认为软件自动化还处于早期,距离极限还有很长的“混乱中间地带”。他比喻市场已发生多次“iPod 时刻”,未来还将有更多“iPhone 时刻”。行业SpaceXCursor收购行业事件10 个信源在谈推荐理由:SpaceX 突然出手收购 Cursor,这可能是 AI 编程助手赛道格局变化的关键信号。听听创始人亲口说为什么还远没到终点。原文
01:23kimmonismus@kimmonismus英国首相Keir Starmer向特朗普政府请求豁免,允许英国国民和公司重新访问Anthropic的最先进AI模型。一位特朗普政府官员向《纽约邮报》表示,即使是G7盟友也不予例外,称给予豁免“完全不合逻辑”。美国正与Anthropic及其CEO Dario Amodei直接谈判解决禁令问题,但此举表明前沿AI模型已被视为战略国家安全资产,商业获取可能变为地缘政治特权。行业Anthropic前沿AI国家安全英国美国10 个信源在谈推荐理由:美国把前沿AI当战略资产,连英国盟友都吃闭门羹,这事关全球AI权力格局,你应该看看。原文
01:01歸藏(guizang.ai)@op7418SpaceX 宣布以全股票交易方式行使收购 AI 编程助手 Cursor 的选择权,交易估值约 600 亿美元。Cursor 团队仅几十人,但人效极高,除编码产品外还基于开源模型训练了自有编码模型。双方已在过去数月联合训练一个新模型,该模型将同时发布在 Cursor 和 Grok Build 中。此次收购旨在推进 SpaceX 构建最有用 AI 模型的目标。行业SpaceXCursorGrok收购编程助手10 个信源在谈推荐理由:SpaceX 用 600 亿美元股票换下只有几十人的 Cursor,这人效太猛了。Cursor 自带编码模型,还和 Grok 一起训练新模型,未来有戏。原文
00:59李继刚@lijigang_com作者认为C-c & C-v(复制粘贴)的场景切换是日常摩擦,消除它就有价值。他建议让大模型写插件或脚本自动化处理。例如,他用macOS自带的Notes,写了一个脚本:在任意地方复制内容,自动粘贴到指定笔记文件。每晚处理清空,第二天重新积累当天的复制内容。技巧脚本自动化macOS Notes复制粘贴工作流大模型推荐理由:别老觉得大模型只能聊天,让它帮你写个脚本,把复制粘贴自动化,省时省力。原文
00:59AK@_akhaliqJoyAI发布了JoyAI-VL-Interaction模型,这是一个实时视觉语言交互智能系统。该模型支持实时视觉理解与语言生成,能够处理视频帧序列并生成自然语言响应。目前尚未公布具体基准测试成绩或版本号。AI模型JoyAI-VL-InteractionJoyAI多模态实时交互推荐理由:JoyAI出了个能实时看懂画面并跟你聊天的模型,适合做交互式AI应用。原文
00:58Jerry Liu@jerryjliu0Jerry Liu 认为代码代理(如 Cursor)是计算机使用和知识工作的好代表,但 Cursor 在产品体验上仍有不足:长期不支持上传 PDF,需要更广的数据源接口(CRM、ERP 等),以及更好的非结构化文档编辑(如 Word、Excel)。Riley Brown 指出 Cursor 正成为 Codex 和 Claude Desktop 的竞争者,其内置浏览器和 Composer 模型性能优秀,但需完善文档渲染功能。AI产品CursorClaude CodeCodex编程助手智能体10 个信源在谈推荐理由:两位 AI 资深用户聊 Cursor 的现状和短板,说它离替代 Claude Desktop 就差文档支持了。非开发者可以看看它能不能当你的通用工作台。原文
00:58LangChain@LangChainAILangChain 发布 Deep Agents 深度解析第二部分,讲解上下文管理关键能力。Sydney Runkle 在不到2分钟视频中演示如何控制 Agent 长期记忆与状态。该方法可让 Deep Agents 在连续多轮对话中保持一致性,避免遗忘。技巧LangChainDeep Agents智能体上下文管理提示词工程推荐理由:如果你在用 LangChain 做智能体,这个2分钟视频教你怎么管理上下文,让 Agent 不跑偏。原文
00:58LangChain@LangChainAILangSmith Fleet 新增两种智能体类型:General Purpose Chat 和 Specialized Agents。LangChain 的 @BraceSproul 解释了为何提供两种选择以及各自适用场景。General Purpose Chat 适合日常对话,Specialized Agents 针对特定任务优化。这一设计让开发者根据需求灵活选用。AI产品LangSmithGeneral Purpose ChatSpecialized Agents智能体推荐理由:LangChain 的 Fleet 现在有两种智能体可选,通用聊天聊天专用,看需求挑就行,开发者福音。原文
00:43@OpenAIDevs@OpenAIDevs73°OpenAI宣布本周起向欧洲经济区、英国和瑞士的Codex用户推出多项新功能。新增功能包括Computer use(计算机操控)、Codex Chrome扩展、个性化记忆(personalized memory)以及Chronicle功能。这些功能此前已向部分地区开放,现在欧洲开发者可以使用。AI产品CodexOpenAI欧洲编程助手Chrome扩展10 个信源在谈推荐理由:OpenAI把Codex的电脑操控、Chrome扩展和个性化记忆带到欧洲了,开发者快去试试。原文
00:28向阳乔木@vista8Factory AI CEO在播客中表示,约80%到90%的任务可用开源模型完成,顶级模型更适合规划和决策。AI工具为高杠杆人员提供更高杠杆,而对低杠杆人员帮助有限。他认为未来最值钱的工程师是能端到端拥有业务结果的人,而非仅会写代码者。他还预测三年内Token支出中位数将与薪资处于同一数量级。行业Factory AI开源模型AI趋势Token工程师价值推荐理由:Factory AI CEO聊了开源模型和顶级模型怎么分工,还有未来什么样的工程师最值钱,挺有启发。原文
00:28elvis@omarsar0mattpocockuk 发布了新技能 /teach skill,功能类似于之前已有的 /learn skill。该技能在 Hermes Agent 的 academy 中免费开放使用,用户可通过 AI agent 进行互动学习。实验室当前保持免费,鼓励用户尝试。技巧Hermes Agentteach skilllearn skill智能体AI学习推荐理由:mattpocockuk 推了一个新教学技能,和 /learn skill 很像,在 Hermes Agent 里免费就能玩,试试用 AI 代理学习新东西。原文
00:28向阳乔木@vista8papr 是一款新开源的工具,其 GitHub 仓库地址为 github.com/l0ng-ai/papr。Mac 用户可通过 brew install --cask l0ng-ai/papr/papr 命令安装。目前项目已公开,吸引 683 次查看和少量互动。AI产品paprGitHubMac开源工具推荐理由:有人开源了papr,Mac上一条命令就能装,感兴趣可以试试看。原文