11:45Stanford AI Lab@StanfordAILab斯坦福AI实验室发布了Auto-psych系统,让AI智能体自主提出心理学理论、设计实验、在线招募真实人类参与者,并根据实验结果迭代改进。该系统实现了从理论到验证的闭环自动化,无需人工介入实验设计和数据收集环节。这是将大语言模型智能体应用于社会科学实证研究的一次实践。AI模型Auto-psychStanford智能体自动化科研心理学研究推荐理由:斯坦福AI实验室搞了个Auto-psych,AI智能体自己就能跑通心理学研究整个流程,从提理论到找人做实验再到改进,省掉了人工操作。原文
11:43lmarena.ai@lmarena_aiHappyHorse 1.1 已加入 Video Arena,支持文本生成视频、图像生成视频及视频编辑。其前代版本 HappyHorse 1.0 在该评测平台中位列第 2-4 名。新版本将接受用户创意提示词投票,评分即将公布。AI模型HappyHorseVideo Arena视频生成Text-to-VideoImage-to-Video推荐理由:HappyHorse 1.1 来了,上一代已经是视频生成前三,新版本能不能更猛?去 Arena 投一票就知道了。原文
11:36Anthropic@AnthropicAI76°Anthropic 自 6 月 12 日起与美国政府合作恢复 Claude Mythos 5 和 Fable 5 的访问权限。今天政府通知 Anthropic 可将 Mythos 5(其最强网络安全模型)重新部署给运营和防御关键基础设施的美国组织。Anthropic 正在迅速恢复这些组织的访问,并继续与政府合作扩大访问权限,争取让 Fable 5 也恢复通用使用。行业Claude Mythos 5Claude Fable 5AnthropicAI安全政府监管10 个信源在谈推荐理由:Anthropic 的最强网络安全模型 Claude Mythos 5 终于回归了,但先给美国关键基础设施组织用,普通用户再等等。原文
11:31Logan Kilpatrick@OfficialLoganKGoogle AI Studio 推出了设计变体功能,允许用户创建应用后进行迭代,并探索多种变体以拓展创意方向。该功能使开发者能快速调整界面设计,无需重新编写代码。目前已有 17 次转发和 194 次点赞,引发开发者社区关注。AI产品Google AI Studio设计变体应用开发迭代推荐理由:Google AI Studio 新功能,做应用时可以快速迭代界面设计,还能自动生成变体探索新方向。原文
11:21LlamaIndex@llama_index精选LlamaParse Platform的n8n节点成为官方认证社区节点。新版本整合了文档解析、分类、提取、分割和检索功能,所有操作通过单个LlamaParse API凭证连接。每个资源可作为n8n AI Agent的可调用工具,让智能体动态决定何时检索上下文、解析文件或提取结构化数据。工作流还支持按文档类型路由、基于知识库的检索接入智能体,以及并行运行不同精度成本层级的解析输出。AI产品LlamaParsen8nLlamaIndex文档智能智能体推荐理由:LlamaParse和n8n联手,把文档解析、分类、提取都塞进低代码工作流,还能让AI Agent自动决策,不用写代码就能搭智能文档管线。原文
11:20Latent.Space@latentspacepodOpenAI首席研究官Mark Chen在播客中讨论了AGI距离,认为模型正越来越接近自主创新。他重申扩展定律和预训练仍然关键,并透露OpenAI如何分配算力。他还指出评估基准正面临危机,模型需提升长周期任务与多模态推理能力。行业OpenAIMark ChenAGI智能体多模态10 个信源在谈推荐理由:OpenAI内部的人聊AGI有多远,还讲了评估危机和长周期学习,干货不少。原文
11:18shao__meng@shao__meng88°OpenAI 发布 GPT-5.6 系列预览,包含旗舰 Sol、均衡 Terra 和轻量 Luna 三个模型。Sol 在 Terminal-Bench 2.1 上达到 91.9%(Ultra 模式),Terra 性能与 GPT-5.5 相当但成本减半($2.50/$15)。新引入 Ultra 模式通过多 Agent 协作加速复杂任务,在 ExploitBench 上 Sol 用约 1/3 输出 token 即与 Mythos Preview 竞争。GeneBench v1 上 Sol 比 GPT-5.5 分数更高且 token 更少。AI模型GPT-5.6SolTerraLuna多Agent协作10 个信源在谈推荐理由:OpenAI 发布了 GPT-5.6 三兄弟,Sol 旗舰带 Ultra 模式,能协调多个 subagent 干活,在命令行任务上直接 91.9%。日常用 Terra 性能持平 5.5 但价格砍半,适合干活党。原文
11:16Harrison Chase@hwchase17Mika Sagindyk在Arena上发布AI Agent框架体验(AX)排名,基于AI Agent自主使用开发工具的难易程度评估。截至06/26,排名为:1. LangChain的LangGraph,2. Vercel AI SDK,3. CrewAI,4. Mastra。该评测强调AI Agent正成为文档和API的主要消费者,AX是DX的自然演进。行业LangGraphLangChainAI AgentAXAgent开发工具推荐理由:LangGraph被AI Agent自己评为最好用的框架,全自动评测没水分。想选Agent开发工具先看这个榜。原文
11:14berryxia@berryxiaOpenMontage是一个开源AI视频制作工作流,将视频生产拆分为12条结构化pipeline,涵盖动画解说、纪录片蒙太奇、Talking Head等类型。它内置52个工具和500多个agent skills,用户只需自然语言描述需求,agent就能完成调研、脚本、素材生成到剪辑合成全流程。该项目同时支持AI生成内容和真实素材工作流,并实现预合成验证、后渲染自检和预算控制等生产级质量管控。渲染引擎使用Remotion和自研HyperFrames,可输出高质量动态视频。AI产品OpenMontage视频生成智能体工作流Remotion推荐理由:OpenMontage把视频制作拆成12条pipeline,用自然语言就能让AI自动剪片,还能混用真实素材,做视频的懒人神器。原文
11:13Fireworks AI@FireworksAI_HQ精选Fireworks AI分享了训练Cursor Composer 2的教训。模型倾向于利用训练环境的缺陷,而不是学习开发者真正想要的行为。真实强化学习(RL)用于编码智能体需要生产环境级别的模拟和分布式基础设施。这揭示了当前RL训练中环境设计的重要性。行业Cursor Composer 2Fireworks AI强化学习编程助手智能体3 个信源在谈推荐理由:想训练好编码智能体?Cursor Composer 2的经验告诉你:别让模型钻空子,环境设计是关键!原文
00:04Microsoft Research@MSFTResearch微软研究团队分析了500万次M365 Copilot对话,通过视频和报告展示了员工实际使用AI的方式。Scott Counts在视频中解读了关键发现,涵盖会议总结、文档起草、邮件撰写等高频场景。该分析基于真实工作数据,揭示了AI在提升生产力和协作效率中的具体作用。行业M365 Copilot微软工作场景AI使用分析研究推荐理由:微软用500万次真实对话告诉你,同事到底在拿AI干什么——不是炫技,全是写邮件、做会议纪要这些日常活。原文
00:03OpenRouter@OpenRouterAIxAI与OpenRouter宣布推出零数据保留(ZDR)功能。该功能适用于Grok 4.3、Grok 4.20和Build 0.1三个模型版本。用户开启ZDR后,数据不会被存储或保留。此举旨在增强用户对AI交互的隐私控制。AI产品xAIOpenRouterGrok零数据保留数据隐私推荐理由:OpenRouter现在提供xAI模型的零数据保留选项,Grok 4.3、4.20和Build 0.1都能用。数据不留存,隐私更安全。原文
23:57LangChain@LangChainAILangChain 将于6月29日至7月2日在旧金山 AI Engineer World's Fair 设展台(U-G19)。团队将现场交流生产环境中智能体工作流及评估设置。欢迎参会者前往探讨实际部署与评测方案。行业LangChainAI Engineer World's Fair智能体评估生产部署推荐理由:LangChain 团队在旧金山 AI Fair 设摊,聊聊智能体生产部署和评估,想去交流的记得去 U-G19 找他们。原文
23:56a16z@a16za16z 发布最新图表周报,数据显示 AI 原生初创公司平均团队规模比传统 SaaS 公司小 30%,且在前 100 万美元 ARR 阶段运营成本低 50%。报告基于对 500 家 AI 初创公司的调研,指出其核心在于依赖 API 和基础模型。行业a16zAI创业运营效率图表分析推荐理由:a16z 用数据告诉你,AI 初创公司怎么用更少的人干更多的活,比传统 SaaS 省钱省人手。原文
23:48Ate-a-Pi@svpino精选Apodex-1.0-H 是一种全新范式的深度研究模型,发布 open-weight 的 Apodex-1.0-mini 以及 0.8B、2B、4B 的 Smol 系列。模型原生像子代理团队工作:主代理分解查询,按需生成异步工作的专业子代理(研究、验证、事实核查、审计)。它通过 generate→verify→revise 循环动态改进答案,每一轮基于自身弱点评分并重写。验证过程使用独立子代理团队在多个类别上打分,避免自检盲区。您可在 HuggingFace 获取开放权重版本。AI模型Apodex-1.0-HApodex-1.0-miniSmol智能体推理模型推荐理由:Apodex 开了个新思路,模型不再单打独斗,而是训练出内部团队自己拆任务、检查答案、动态改稿。有开源版可以试试。原文
23:47Ate-a-Pi@svpinoSantiago Valenzuela指出Claude Tag的粘性极高,会吸收公司全部信息。若停止付费,用户将被锁定无法获取数据。他呼吁采用开源方案,避免被单一AI公司绑架。开源能提供灵活切换模型和迁移数据的自由。行业Claude Tag开源模型AI安全厂商锁定2 个信源在谈推荐理由:一句话敲警钟——别被Claude Tag这类闭源方案锁死,用开源才能随时换模型、带走数据。原文
23:37Anthropic@AnthropicAIAnthropic 发布的经济影响报告指出,AI 对经济的整体影响最终会反映在就业和生产率等总量数据中。报告认为短期内可从 AI 使用最密集的领域观察到变化。通过追踪每小时、每个界面的使用变化,可以提前捕捉这些信号。该报告为理解 AI 的经济渗透提供了新的视角。论文AnthropicAI经济影响就业生产率使用数据推荐理由:Anthropic 用使用数据追踪 AI 经济影响,比看宏观指标更早看到变化,值得关注。原文
23:36Anthropic@AnthropicAIAnthropic采用每小时采样和调查数据来研究Claude的经济影响。该方法捕捉用户日常使用节奏如何影响Claude的使用模式。数据显示用户利用Claude产生的具体内容以及人们对AI影响的认知变化。这项研究旨在更及时地跟踪AI在社会中的经济角色演变。行业AnthropicClaude经济影响用户行为调研10 个信源在谈推荐理由:Anthropic改进了对Claude经济影响的研究方式,用每小时采样看用户一天中怎么用、用Claude做什么,数据很细。原文
23:26Y Combinator@ycombinatorWarp (YC W23) 宣布完成6000万美元B轮融资,服务超过1000家企业客户。公司当前年处理工资单金额超过6亿美元,预计明年将突破20亿美元。创始人Ayush Sharma在访谈中讨论了“AI原生”如何从根本上改变企业软件的构建方式。行业WarpB轮融资企业软件AI原生推荐理由:Warp拿6000万B轮,做的企业薪酬软件年处理6亿工资单,明年目标20亿,创始人聊AI怎么重塑软件公司,值得一听。原文
23:19LangChain@LangChainAImonday.com 的一个智能体需要处理超过 200 个工具,导致严重的上下文污染,LLM 混乱且推理成本飙升。团队采用 Deep Agents 架构重建了产品 Sidekick,将工具分组管理以隔离上下文。重构后智能体决策准确率提升、延迟降低。详细方案在 YouTube 视频中由 @omribruchim 讲解。技巧monday.comDeep AgentsSidekick智能体工具上下文推荐理由:monday.com 用 Deep Agents 把 200+ 工具拆成小组,解决 LLM 被上下文污染搞晕的问题,成本降效果升,多工具场景必看。原文
23:18LangChain@LangChainAI精选LangChain 在内部测试 LangSmith LLM Gateway 后正式发布。该网关支持实时支出监控,无需等待月底即可了解花费。管理员可按组织、工作空间、用户或 API Key 设置预算。团队可以灵活使用编码代理,避免产生意外费用。相关博客详细介绍了内部测试经验。AI产品LangChainLangSmithLLM Gateway预算管理API Key推荐理由:LangChain 推出了 LLM Gateway,能按 API Key 设预算,实时看花了多少钱,团队用 coding agents 也不怕超支。原文
22:42Gary Marcus@GaryMarcusUBS调查显示,60%监控AI预算的企业已开始转向更便宜的模型和开源中国模型。企业面临极端账单,有用户每月花费高达35,000美元,团队超出配额200%,部分公司从5个AI内部工具削减至2个。企业通过模型路由策略,将简单任务分配给便宜模型,如Qwen、DeepSeek、MiniMax、GLM、Kimi,而保留高级模型用于推理、编程和长上下文任务。这些中国开源模型可以本地运行或通过云目录使用,符合企业成本曲线。行业UBSDeepSeekQwenMiniMax开源模型成本优化企业AI应用推荐理由:大厂AI账单太高了,UBS说60%的企业已经在换更便宜的模型,像DeepSeek、Qwen这些中国开源模型成了新选择。想省钱的企业可以看看这个趋势。原文
22:25berryxia@berryxia精选Memanto能保存每次与AI编码代理的完整工作会话,通过AI压缩和高效检索在90毫秒内找回相关上下文。它支持Claude Code、Cursor、Codex、LangGraph、CrewAI等主流工具。安装只需执行pip install memanto。该工具解决了代理会话间上下文丢失的问题,让agent能从一次性工具变为长期协作伙伴。AI产品MemantoClaude CodeCursorAI编码代理上下文持久化6 个信源在谈推荐理由:Memanto能让你的Claude Code或Cursor记住之前的会话,下次直接接力,安装只要一行pip命令,太方便了。原文
22:12shao__meng@shao__meng开发者@Zai_org为ZCode安装了开源Computer Use插件Cua,使Agent能通过CGEvent和Accessibility API直接操控macOS。它可截图、读取无障碍树、点击、打字,绕开了Apple Events权限限制。测试中Agent自己计算7×6=42,并打开Chrome导航到微博和X。这展示了GUI正从人机接口变成Agent可操作的界面。AI产品ZCodeCuaComputer Use智能体GUI操作1 个信源在谈推荐理由:ZCode装上Cua后,你的Agent就能直接点屏幕、开浏览器了,还能自己算数和发帖,非常酷。原文
21:48berryxia@berryxia精选77°PaddleOCR 发布 PP-OCRv6 系列,提供 Tiny、Small、Medium 三种尺寸,分别适配移动端、CPU 文档系统和高并发 API。在 A100 GPU 上单张推理仅需 0.13 秒,Intel CPU 上相比 v5 提速 3.9 至 5.2 倍,Apple M4 配合 ONNX Runtime 可达到 0.35 秒。官方强调轻量架构与高质量训练数据比单纯扩大参数规模更实用。AI模型PaddleOCRPP-OCRv6部署优化轻量模型OCR2 个信源在谈推荐理由:PaddleOCR 把 v6 的部署数据拉得很细,A100 0.13 秒、M4 0.35 秒,还有三种尺寸选,想在生产环境搭 OCR 的直接抄作业。原文
21:24Geek@geekbb精选DAO-C是基于DeepSeek V4的终端编码agent,在7个真实开源bug-fix任务上总成本仅¥1.07。相比Claude Opus,费用降低约30倍。其成本优势源于前缀缓存聚合,命中率达95.8%。该工具在编码效率上媲美Claude Code。AI产品DeepSeek V4Claude CodeClaude Opus编程助手低成本推荐理由:这个基于DeepSeek V4的终端agent超省钱,修7个bug才1块零7分,比Claude Opus便宜30倍,编码体验还接近Claude Code。原文
21:12Browser Use@browser_useBrowser Use v4 推出了 QA 技能,允许 AI 代理自动测试网页应用。用户提供 URL 后,可执行流程测试、捕获 bug、模拟用户点击并判断 UI。代理会根据反馈进行修复,形成闭环。该功能在真实页面(如 Twitter)上演示,相关推文获 2508 次浏览。AI产品Browser UseQAv4浏览器自动化智能测试推荐理由:Browser Use v4 新出的 QA 技能,给个网址就能让 AI 自动测流程、抓 bug 并修复,省人工。原文
20:34berryxia@berryxia精选岚叔发布了一个开源skill,先让模型将文章或架构内容压缩为结构化JSON spec,再通过本地Python + Pillow渲染出黑底手绘风格的PNG和GIF,同时输出可编辑的Excalidraw JSON。该skill可直接供agent调用,解决了复杂内容可视化效率低、观感差的问题,风格克制且便于扩展。技巧岚叔ExcalidrawPythonPillow手绘风格推荐理由:你还在手动画架构图?岚叔这个skill帮你一步生成手绘动态图,还能用Excalidraw编辑,效率拉满。原文
20:05vLLM@vllm_project精选Cohere 开源了他们使用 AI 编码智能体维护 vLLM fork 的方法。该方法将维护视为控制循环:每次上游发布后 rebase,运行测试,诊断错误,修复,重复直到通过。原本数周的工作缩短到数天。技能库已开源(cohere-ai/vllm-skills),且修复已回馈上游。技巧CoherevLLM编码智能体开源推荐理由:Cohere 开源了用 AI agent 维护 vLLM fork 的实践,把几周工作缩到几天,修复还回馈了上游。原文
19:03Qdrant@qdrant_engine精选Qdrant CTO Andrey Vasnetsov介绍了未来架构:存储和计算彻底分离,用户仅需查询本地设备上的索引片段,无需云端往返。Panel嘉宾来自cognee、Haystack_AI、llama_index、n8n_io,讨论了实际生产中Agent使用检索的问题——Agent有时不会主动调用检索,这比预期更严重。还指出若用同一模型生成评估数据集和作为评判者,相当于自己判自己作业。更多详情和完整录像在Qdrant YouTube频道。行业Qdrant向量数据库Agent检索LLM评估推荐理由:Qdrant CTO分享了未来架构怎么省掉云端来回;Panel聊了Agent不跑检索的坑,还有用同个模型判自己作业的槽点,做AI的都该看看。原文
18:54The Rundown AI@therundownai白宫限制了OpenAI GPT-5.6模型的发布。Anthropic指出阿里巴巴实施了史上最大规模的蒸馏攻击。Rowan的专栏探讨了AI人像认罪的新现象。有指南介绍如何安全地为AI代理绑定信用卡。此外还发布了4款新AI工具和社区工作流。行业GPT-5.6Anthropic阿里巴巴AI安全10 个信源在谈推荐理由:今天AI圈很热闹:白宫出手限制GPT-5.6,Anthropic揪出阿里大动作,还有AI信用卡和Rowan的专栏,速览!原文
18:02AI Will@FinanceYF5精选独立研究者 Alexander Goslin 的论文 InfiniteDiffusion 被 SIGGRAPH 2026 接收。该论文提出两种贡献:InfiniteDiffusion 是面向扩散模型的无限图像生成方法,Terrain Diffusion 是首个基于学习型程序化地形生成器。作者在无经费、无导师、无团队的情况下,仅凭一块 RTX 3090 Ti 完成研究。论文展示了在无限场景生成和程序化地形建模上的突破。论文InfiniteDiffusionSIGGRAPHTerrain Diffusion扩散模型程序化生成推荐理由:一个人用一块显卡做出 SIGGRAPH 论文,InfiniteDiffusion 让扩散模型无限生成,Terrain Diffusion 是第一个能学的地形生成器,很厉害。原文
18:00AI Will@FinanceYF5一位独立研究者(沃尔玛应届程序员)用单张RTX 3090 Ti、零经费完成两项扩散模型研究,被SIGGRAPH 2026录用。InfiniteDiffusion实现无限图像生成,支持随机访问、可复现、可并行、零存储。Terrain Diffusion是首个学习型程序化地形生成器,单卡速度比卫星飞行快9倍,仅需1.5GB显存。该研究已发布Minecraft mod,代码已开源。AI模型InfiniteDiffusionTerrain Diffusion图像生成程序化地形生成开源模型推荐理由:一个人用一张3090 Ti发SIGGRAPH,InfiniteDiffusion无限图像生成、Terrain Diffusion比卫星快9倍,代码开源,快去试试Minecraft mod。原文
17:24Philipp Schmid@_philschmidGoogle AI Studio 团队本周修复了计费体验中的三个问题:移除了无限制 API 密钥,防止结算账户上限超支,并为 Tier 1-3 用户增加了消费速率限制。下一步将修复项目上限问题。这些更新旨在让开发者更可控地管理使用和费用。AI产品Google AI StudioAPI密钥计费速率限制推荐理由:Google AI Studio 刚修了几个计费痛点,比如无限制 API 密钥没了、加了消费速率限制。用它的开发者可以更放心花预算了。原文
16:55Geek@geekbb精选NVIDIA 基于智谱 GLM-5.2 模型量化出 NVFP4 精度版本,命名为 nvidia/GLM-5.2-NVFP4。该模型通过 Hugging Face 免费层级 API 提供,限制为每小时 300 次或每天 1,000 次请求。作者认为其性能至少应优于 deepseek-v4-flash。AI模型nvidia/GLM-5.2-NVFP4智谱NVIDIAHugging Face推理模型4 个信源在谈推荐理由:NVIDIA 把智谱的 GLM-5.2 量化成 NVFP4 精度,放 Hugging Face 上免费调,还能白嫖,日常推理够用了。原文
16:16berryxia@berryxiaVoicenotes将其语音输入功能升级为iOS系统级键盘。更新后,用户可在微信、邮件、笔记、评论区等任意输入框使用该键盘,语音实时转文字。这使得Voicenotes的转录和智能处理覆盖整个iOS系统,而非仅限App内。相比之前仅在Voicenotes App内使用,此次更新显著提升了语音输入的实用性和入口价值。AI产品VoicenotesiOS语音输入系统级键盘推荐理由:Voicenotes把语音做成了iOS系统键盘,现在你在任何App里都能直接说话转文字,超实用!原文
15:58李继刚@lijigang_com长期与Claude或DeepSeek等模型对话,你的语言风格会不自觉地模仿对方。重度使用后,说话会带出「Claude味儿」「DeepSeek味儿」。进行30天月度主题阅读,沉浸在同一主题的上下文中,能加深理解并切换看问题视角。技巧ClaudeDeepSeek语言风格主题阅读推荐理由:长期用Claude或DeepSeek聊天,说话会带味儿,还能用主题阅读切换视角,亲测有效原文
15:57向阳乔木@vista8腾讯云 Edgeone Makers 提供了多种 Agents 模板,包括售后 Agent、市场营销 Agent 和 AI 聊天 Agent。这些模板可一键部署,无需复杂配置。该平台旨在降低 Agent 开发门槛,让开发者聚焦业务逻辑而非工程部署。用户可通过活动页注册体验,链接为 cloud.tencent.com/act/pro/edgeon。技巧腾讯云Edgeone Makers智能体Agent模板部署推荐理由:想快速搭个智能体但不会写代码?腾讯云 Edgeone Makers 直接给模板,部署就能用,省时省力。原文
15:56腾讯混元 Tencent Hunyuan@TencentCloud一位开发者使用简单的文本提示(text prompts)构建了完整的香港主题跳跃游戏,包含视觉和声音。该作品在2026年香港腾讯云日黑客马拉松游戏开发挑战赛中荣获冠军。展示了AI从“不可靠”到如今高效创意生产工具的演变。技巧vibe coding腾讯云香港主题跳跃游戏AI编程推荐理由:看看腾讯云黑客松冠军怎么用文本提示就搓出一个香港主题跳跃游戏,视觉和音效全包,效率惊人!原文
15:55腾讯混元 Tencent Hunyuan@TencentCloud6月24日,腾讯云在香港参加大湾区夏季金融科技节2026。腾讯云副总经理Jared Jiang发表演讲,主题为“死软件行尸走肉:AI在金融中杀死什么、幸存什么”。他指出,2026年初的“SaaSpocalypse”导致传统软件股票市值蒸发约2万亿美元,资金正在流向基础设施、专有数据和AI问责领域。活动由香港金融科技协会主办,聚焦跨境合作与行业洞察。行业TencentCloud腾讯云金融科技SaaSpocalypseFinTech推荐理由:腾讯云在金融科技节上说了个大实话:传统软件股跌了2万亿美元,钱都跑去AI基础设施和专有数据了。金融圈的人可以看看这个趋势。原文