全部 AI 动态 · AI 热点

6月25日

23:46

OpenRouter@OpenRouterAI

OpenRouter 发布新功能，允许用户通过两条命令（claude mcp add --transport http openrouter mcp.openrouter.ai/mcp 和 claude mcp login openrouter）在一分钟内完成模型的选择、定价、测试和集成。该功能基于 MCP（Model Context Protocol），支持所有主流代理（如 Claude）。用户可在 openrouter.ai/mcp 立即使用。

推荐理由：OpenRouter 搞了个骚操作，两行命令就能把模型接到 Claude 等代理里，一分钟搞定测试和定价，省去一堆配置。

原文

23:45

OpenRouter@OpenRouterAI

精选

OpenRouter推出MCP（模型上下文协议），使AI智能体能够直接获取实时模型信息。该工具可动态评估模型价格、性能并测试，替代依赖6个月前训练数据的猜测。集成后智能体可为任务精准选型，提升效率。

AI产品 OpenRouter MCP 智能体模型选择实时模型

推荐理由：OpenRouter新出的MCP能让你的AI智能体实时选模型，不用瞎猜了，还能比价测试，直接集成。

原文

23:39

Geek@geekbb

GitHub项目'no-xxx'在代码推送前自动运行AI审查。审查通过标记为绿灯。只有绿灯更改才被推送到远程仓库。生成无垃圾代码的干净PR。该流程可集成到Git工作流中。

AI产品 AI代码审查 PR 自动化 GitHub

推荐理由：推送前自动跑AI审查，省心省力，再也不用手动清理垃圾代码了。

原文

23:37

berryxia@berryxia

Ornith-1.0 模型家族覆盖 9B 到 397B MoE 全尺寸。在 Terminal-Bench、SWE-Bench 等 agent coding 基准上达到当前开源模型顶尖水平。其训练方式使用 RL 同时优化任务脚手架和最终解决方案。模型全系列 MIT 开源，并提供了 GGUF 版本，可在 Ollama、Unsloth 等工具中直接运行。

AI模型 Ornith-1.0 Terminal-Bench SWE-Bench Ollama 智能体

推荐理由：Ornith-1.0 用 RL 教模型搭执行框架，在 SWE-Bench 上表现顶尖，本地党还有 GGUF 版本可玩。

原文

23:24

Guillermo Rauch@rauchg

精选

AI SDK 7正式发布，新增推理控制（reasoning control）和代理级工具审批（agent-level tool approval）功能。支持MCP应用、持久化工作流（durable workflows）和终端UI。还包含文件和技能上传、沙箱支持、测试框架集成及遥测等特性。

AI产品 AI SDK aisdk MCP/工具推理控制智能体

推荐理由：AI SDK 7来了，新增推理控制和代理工具审批，还支持MCP应用和持久化工作流。做AI应用开发的一定要看看。

原文

22:57

Viking@vikingmute

推文介绍了ponytail项目和一个Vibe Coding提示词技巧，建议在提示词末尾加入“如果GitHub/npm上有成熟开源方案，直接复用”。该技巧基于DRY理念，能有效减少GPT等模型生成冗余代码的现象。该技巧特别适合新手避免over-engineering。

技巧 ponytail GPT 提示词工程 Vibe Coding 编程助手

推荐理由：给用GPT写代码的人：提示词末尾加‘复用开源方案’能防止AI重复造轮子，亲测有效。

原文

22:55

向阳乔木@vista8

一位用户收到并分享了第一封由AI Agent自动生成的邮件，该邮件内容未经人工直接干预。邮件发送者未具体说明使用哪个Agent产品，但标志着AI驱动的自动化通信迈出实际一步。该推文获得460次浏览，引发对Agent应用场景的讨论。

行业 AI Agent 邮件自动化

推荐理由：朋友收到AI代理自己发的邮件了，挺新鲜，看看AI悄悄帮你干活的样子。

原文

22:39

向阳乔木@vista8

腾讯推出了一款专为Agent设计的邮箱服务，允许用户抢注邮箱名。注册后，用户会获得一段提示词，可将其发给Codex或其他Agent来完成命令行界面设置。该邮箱旨在简化Agent的通信与配置流程，无需手动编写脚本。目前该功能已开放注册，用户可通过评论区链接体验。

技巧腾讯 Agent 邮箱 Codex 提示词工程

推荐理由：腾讯出了个给Agent用的邮箱，注册后拿到提示词就能让Codex自动配好CLI，省得自己写命令，挺方便的。

原文

22:00

LangChain@LangChainAI

精选

LangChain 推文指出通用聊天适合一次性问答，答案出现即结束。专门智能体适合重复性、有固定形状的工作，使用相同工具和格式。智能体能记住线程可能遗忘的上下文，适合多次运行相同流程。

技巧 LangChain 智能体提示词工程

推荐理由：LangChain用一句话说清楚了选择原则：如果下次解释方式一样，就该用智能体，别放聊天里。

原文

21:57

shao__meng@shao__meng

GLM-5.5 据传将于八月发布，智谱尚未官方确认。该模型预计与 Claude Fable 5、GPT-5.6 等下一代模型正面竞争。目前无具体参数或基准数据公布，市场关注度较高。

AI模型 GLM-5.5 Claude Fable 5 GPT-5.6 智谱模型传闻

推荐理由：有传闻说智谱的 GLM-5.5 可能八月上线，要和 Claude 和 GPT 的新版硬刚，吃瓜群众可以蹲一下。

原文

21:54

Patrick Loeber@patloeber

Patrick Loeber 在 #GoogleIOConnect 上介绍了如何使用 AI Studio、Antigravity 2.0、新的 Interactions API、Gemini 3.5 Flash 以及 Gemma 开发应用。AI Studio 是 Google 的 AI 开发平台，Antigravity 2.0 提供新功能，Interactions API 支持更灵活的交互设计。Gemini 3.5 Flash 是高效推理模型，Gemma 是轻量开源模型。演讲内容已发布在 Google 官方博客。

行业 AI Studio Gemini 3.5 Flash Gemma Google I/O AI开发工具

推荐理由：Google 开发者生态又更新了，Patrick 讲了 AI Studio、Gemini 3.5 Flash 和新的 Interactions API，做应用开发可以看看。

原文

21:45

Thomas Wolf@Thom_Wolf

实验让100多个智能体协作一周，优化vLLM中Gemma 4推理速度，最终实现5倍提升。智能体自发拒绝人类社交工程尝试，发现验证漏洞并请求社区裁决。四智能体接力构建int4-lm_head检查点，经诊断配置错误后达到118 TPS（2.68×）。GPU富/贫分工、跨智能体内核调试、配额池化等行为涌现。智能体还指出127 TPS“墙”是假象，并讨论了int4-Marlin floor的循环证明问题。

AI模型 Gemma 4 vLLM 多智能体推理优化智能体协作

推荐理由：这个实验展示了100多个AI智能体像人类社区一样自发协作、互相监督，甚至发现了验证漏洞。一周将Gemma 4推理速度优化5倍，很酷。

原文

19:55

The Rundown AI@therundownai

Anthropic和OpenAI加入了由非营利组织牵头的一项5亿美元计划，目标是利用AI技术攻克普通感冒。该计划将重点通过机器学习加速抗病毒药物筛选和临床试验设计。项目时间表为五年，预计将投入大量计算资源。具体合作细节尚未披露，但两家AI公司承诺提供模型支持。

行业 Anthropic OpenAI 医疗AI 5亿美元感冒治疗

推荐理由：两家AI巨头联手砸5亿美元，想用AI治好感冒，挺新颖的。

原文

19:54

Geek@geekbb

精选

一个轻量Python脚本让Codex CLI反复回答同一道糖果数学题，用于对比不同模型的表现。脚本可调整reasoning effort参数并观察效果。代码开源于GitHub，便于复现和扩展。

技巧 Codex CLI reasoning effort Python脚本糖果数学题推理测试

推荐理由：想测不同模型对同一道题的推理差别？用这个脚本跑糖果题，还能调reasoning effort，很直观。

原文

19:39

Genspark@genspark_ai

ADK Marketing Solutions 最初只把 AI 当高级搜索引擎用。借助 Genspark，他们将 AI 嵌入研究、演示、会议和跟进流程。两年内，公司整体生产力飙升 250%。这一案例来自华尔街日报的报道，展示了深度集成 AI 工作流的效果。

AI产品 Genspark ADK Marketing Solutions 企业AI应用工作流集成生产力提升

推荐理由：别再把 AI 当搜索了，看看 ADK 怎么用 Genspark 把生产力翻了 2.5 倍，直接嵌入每个环节。

原文

18:57

shao__meng@shao__meng

火山引擎发布53页ArkClaw安全白皮书，将AI Agent安全归纳为三层问题：OpenClaw原生风险、云SaaS通用风险和企业治理新痛点。白皮书详细列出OpenClaw六大原生风险，包括Gateway/CDP绑定0.0.0.0、外部内容操纵LLM污染HEARTBEAT.md等。还提出安全责任共担模型、七项架构设计原则和四层安全保障体系。最后给出三个企业最佳实践模块：统一鉴权网关、网络边界管控、持续安全运营。

论文 ArkClaw 火山引擎 Agent安全安全白皮书原生风险

推荐理由：火山引擎发了份53页的安全白皮书，把AI Agent安全拆成三层六风险，还有架构原则和最佳实践，搞企业级Agent安全必读。

原文

18:15

shao__meng@shao__meng

73°

Anthropic指控阿里巴巴通过近25000个虚假账户大规模获取其Claude模型能力进行蒸馏。这一数字超过Anthropic此前指控DeepSeek、MiniMax和Kimi的数量总和。事件凸显了AI模型API被滥用于竞争对手蒸馏的风险。

行业 Anthropic Claude Alibaba 千问蒸馏

推荐理由：朋友，Anthropic说阿里用了2.5万个假账号偷偷薅Claude的羊毛，比之前告DeepSeek他们加一起还多，这操作挺猛。

原文

17:56

Anton Osika@antonosika

一家巴西初创公司完全基于Lovable平台构建和运营，在不到一年内达到了1800万美元的年运行率。该公司通过AI帮助其他企业加速业务流程。Lovable是一个无代码AI应用构建平台，这个案例展示了其快速商业化的能力。

AI产品 Lovable 巴西无代码AI开发

推荐理由：巴西一家公司全靠Lovable做产品，一年就做到1800万美金年收入，太猛了。

原文

17:28

berryxia@berryxia

这篇帖子介绍了构建AI智能体的6个核心架构支柱和1个人机协同机制。MCP由Anthropic提出，作为通用标准让智能体即插即用外部工具。智能体循环包括感知→思考→行动→观察→重复的流程。单体与多智能体架构两种模式可灵活选择。智能体驱动的RAG动态路由查询并验证上下文。人机协同机制（HITL）在关键操作前插入人工检查点。

技巧 MCP Anthropic 智能体智能体循环 RAG

推荐理由：想搭AI智能体但怕底层理论？这篇用7个点讲透架构，从MCP到记忆系统，普通开发者也能快速落地。

原文

17:27

Stanford AI Lab@StanfordAILab

精选

Stanford AI Lab发布OpenThoughts-Agent-v2和OpenThinkerAgent-32B，两者均基于Qwen-3开源数据。在计算控制比较中，该模型在全部训练规模下领先，并在7个agent基准测试上平均得分44.8%。模型在终端使用和编码任务上表现突出，且泛化能力强。

AI模型 OpenThoughts-Agent-v2 Qwen-3 Stanford AI Lab 开源模型智能体

推荐理由：斯坦福开源了新agent模型，基于Qwen-3在7个基准上平均44.8%，小模型也能打，值得一试。

原文

17:26

berryxia@berryxia

Unsloth团队将GLM-5.2模型压缩至1-bit量化版本，在Mac Studio M3 Ultra（256GB RAM）上实现约21 tok/s的推理速度。该量化模型在创意输出任务（如HTML/设计生成）上，能与Claude Opus和GPT-5.5正面对比且不落下风。这显示极端量化后的大模型仍能保留较强表现，展示了开源模型通过优化缩小与闭源前沿模型在实际可用性上的差距。

AI模型 Unsloth GLM-5.2 量化开源模型本地部署

推荐理由：Unsloth把GLM-5.2压到1-bit，Mac Studio上跑21 tok/s，创意性居然不输Claude Opus，本地部署党有福了。

原文

17:08

腾讯混元 Tencent Hunyuan@TencentCloud

腾讯云与明报在2026年学习与教学博览会上联合发布WorkBuddy学习解决方案。该方案基于AI智能体能力，覆盖备课、评分、行政自动化和课堂体验等环节。旨在通过自动化提升学校效率，让教师腾出时间专注于教学核心。

AI产品 TencentCloud Ming Pao WorkBuddy 智能体教育科技

推荐理由：腾讯云和明报联手，WorkBuddy用AI智能体帮老师搞定备课、批改和行政，省时间专心教学。

原文

17:07

腾讯混元 Tencent Hunyuan@TencentCloud

城市大学一名学生使用WorkBuddy，仅通过输入文字就将环保想法转化为一款名为“farmer saving chickens”的冒险游戏。WorkBuddy是一款AI工具，无需编程即可快速构建可玩应用。该案例展示了AI如何降低游戏开发门槛。

技巧 WorkBuddy 城市大学无代码游戏开发 AI应用

推荐理由：看看CityU学生怎么用WorkBuddy一句话就做出个游戏，太有意思了！

原文

15:18

Cursor@cursor_ai

Cursor 发布了 Notion 集成功能，基于 Cursor SDK 构建。每个云代理使用与 Cursor 相同的模型和运行时。用户可以在 Notion 中 @Cursor 并分配任务，它能自动打开一个 PR 供团队审查。该功能让开发者无需切换工具即可启动代码任务。

AI产品 Cursor Notion Cursor SDK 编程助手团队协作

推荐理由：Cursor 的 Notion 插件能让你直接在项目管理里跑代码任务，自动开 PR，团队协作更方便。

原文

14:45

Fireworks AI@FireworksAI_HQ

精选

Fireworks AI 与 Harvey 合作研究发现，将前沿闭源模型（如 Opus 4.8）作为顾问代理，与微调的开源工作代理结合，在三个基准测试中均取得更优结果。相比全部使用 Opus 4.8，该混合方案成本降低40-67%。该方法简单部署即可提升效果，为模型调用提供新思路。

AI模型 Fireworks AI Harvey Opus 4.8 开源模型推理模型

推荐理由：Fireworks AI 的实验证明，把闭源大模型当参谋、开源模型当打手，效果更好还省40%-67%的钱，值得关注。

原文

12:54

Naval@naval

Naval 在推文中提出核心原则：当 AI 承担写作任务时，也应承担阅读任务，以形成完整的信息处理闭环。这条推文获得了 86 条评论和 25 次转发，引发业界对 AI 角色分工的讨论。观点暗示当前 AI 写作常依赖人类过滤输入，而理想状态应是 AI 自主处理输入与输出。

行业 Naval AI写作 AI阅读自动化

推荐理由：Naval 说了句大实话：AI 写东西就该自己读，别老让人替它筛信息。

原文

12:03

Pika Labs@pika_labs

精选72°

Pika Labs发布Seedance 2.0版本，支持原生4K分辨率视频生成。新版本通过Pika MCP接口提供，无需额外插件。该功能面向所有用户开放，无需等待名单。

AI产品 Pika Seedance 2.0 视频生成 4K

推荐理由：Pika 出了 Seedance 2.0，直接生成原生4K视频，效果比之前更清晰，用 MCP 就能用，快去试试。

原文

12:00

Yangyi@Yangyixxxx

用户分享使用AI学习《说文解字》的经验，指出AI能清晰解释“读若”和“反切”等音韵概念。AI从上古声、中古声到平上去入四声的演变，以及清浊声母导致阴阳平声的演化过程，都讲得十分清楚。用户建议通过多追问保持独立思考，可规避AI的幻觉。

技巧说文解字读若反切音韵学古籍辅助

推荐理由：有人试了用AI学《说文解字》的音韵，从反切到声调演变，讲得比百度清楚多了，还能追问防幻觉，值得试试。

原文

11:59

shao__meng@shao__meng

Liblib 和 GenSpark 被认为是两个难以理解的 AI 应用团队，他们依靠极快的迭代速度在模型能力的夹缝中保持领先。这种策略要求团队全速前进，无法分心从事 side project 或研究，否则会与速度要求产生矛盾。观察者担忧，他们要么在夹缝中撞线成功，要么被模型本身的进化速度所碾压。

行业 Liblib GenSpark AI应用创业竞争策略

推荐理由：看看 Liblib 和 GenSpark 怎么在模型巨头夹缝里狂奔，速度就是一切，但能跑多远谁也不知道。

原文

11:54

Geek@geekbb

ChatHub项目推出融合模式，允许一组模型并行作答，再由评审模型综合生成更优答案。该模式支持16家LLM提供商的免费额度，合计约每月17亿Token。用户需要逐个添加API key，项目暂不支持批量导入。

技巧融合模式多模型并行免费额度 API key 评审模型

推荐理由：这个项目能同时调用多个模型并行答题，再由评审模型挑最优，还能把各厂商免费额度凑一起用，每月17亿Token呢。

原文

11:48

宝玉@dotey

88°

Anthropic 指控阿里巴巴旗下通义千问实验室在4月22日至6月5日期间，通过约25,000个虚假账号对 Claude 进行了超过2880万次交互，目标锁定 Claude 的软件工程和 Agent 推理能力。这一规模是今年2月 Anthropic 点名的 DeepSeek、MiniMax 和 Moonshot AI 三家总交互量（1600万次）的近两倍。所谓蒸馏攻击指利用对手模型输出训练自有模型，绕过独立研发成本。Anthropic 称这是系统性、工业化规模的能力收割。该事件恰逢美国商务部以国家安全为由限制 Anthropic 的 Fable 5 和 Mythos 5 模型访问，Anthropic 处境复杂。

行业 Anthropic Claude 通义千问阿里巴巴蒸馏攻击推理模型

推荐理由：Anthropic 跑出来告状了，说阿里用了两万多个假账号狂薅 Claude 的羊毛，次数比之前三家加起来还多一倍，还牵扯到美国商务部自己的限制令，挺拧巴。

原文

11:36

AI Will@FinanceYF5

Reflection 与 SpaceX 签署了一项价值 63 亿美元的算力协议。根据协议，Reflection 将立即获得 GB300 资源用于训练开源模型，并从 2026 年 7 月 1 日起至 2029 年每月向 SpaceX 支付 1.5 亿美元。该协议由 CNBC 首次披露，涉及 SpaceX 在 AI 算力领域的重大商业合作。

行业 SpaceX Reflection 算力协议 GB300 开源模型

推荐理由：SpaceX 和 Reflection 签了 63 亿美元的大单，提供 GB300 算力给训练开源模型，从 2026 年每月付 1.5 亿，挺大的动静。

原文

11:35

AI Will@FinanceYF5

91°

OpenAI 新语音模型 Bidi 1 首次曝光，支持双向语音交互：用户说话时模型同时监听，中途打断可立刻切换任务。实时翻译能力与上下文记忆均优于现有 Advanced Voice（高级语音模式）。该模型已小范围推送，ChatGPT 设置中可选，气泡变黄色即为 Bidi 1。后续将推出 Codex 版本。

AI模型 Bidi 1 OpenAI 语音模型实时翻译 ChatGPT

推荐理由：OpenAI 出了新语音模型 Bidi 1，你说它听，还能打断换话题，实时翻译也更强，快去 ChatGPT 设置里试试。

原文

11:34

AI Will@FinanceYF5

76°

据TestingCatalog爆料，OpenAI正在测试名为Bidi 1的双向语音模型。该模型支持用户在说话时同时说话并继续监听，可在句子中间来回切换任务。Bidi 1能更好地处理打断和停顿，并保持对话上下文记忆。模型有持续时间上限，但可连续计数到23不暂停。Bidi 1尚未可用，但预计很快登陆ChatGPT和Codex。

AI模型 Bidi 1 OpenAI ChatGPT Codex 语音模型

推荐理由：OpenAI的新语音模型Bidi 1能边听边插话，还能中途换任务，比现在强多了。

原文

11:34

AI Will@FinanceYF5

Higgsfield在2025年4月上线网页平台，围绕“镜头控制”重构产品。5月加入特效库，首月实现$10M ARR。这标志着AI视频从单纯生成转向更可控的方向。

AI产品 Higgsfield 视频生成镜头控制

推荐理由：Higgsfield这次聚焦镜头控制，网页平台加特效库，首月就做到1000万美元ARR，AI视频终于能精准操控画面了。

原文

11:33

AI Will@FinanceYF5

81°

Gemini 3.5 Flash 现在能直接看屏幕、理解内容，并跨浏览器、手机、桌面执行操作，无需额外接入其他模型。安全方面加入了 prompt injection 对抗训练，敏感操作需用户确认，检测到注入攻击时自动停止任务。企业可用它做自动化测试和跨平台知识工作。

AI模型 Gemini 3.5 Flash AI Agent 跨平台屏幕理解 AI安全

推荐理由：谷歌给 Gemini 3.5 Flash 加了个能直接操控电脑屏幕的智能体，跨平台执行任务，还自带防注入安全机制，挺实用。

原文

11:27

向阳乔木@vista8

谷歌在六月推出了Open Knowledge Format（OKF）规范。该规范使用Markdown加YAML frontmatter将知识组织成可版本控制的文件包。这种格式被设计为AI Agent可直接消费的格式。Codex将一篇文章中的项目整理成OKF格式并添加到系统记忆索引中。

AI产品 Google Open Knowledge Format Markdown YAML Codex

推荐理由：谷歌搞了个OKF规范，用Markdown加YAML打包知识，Agent直接就能用，Codex已经开始用它整理项目了。

原文

10:56

Geek@geekbb

名为 pi-atlas 的扩展从本地会话日志生成交互式仪表盘，展示成本、语言、模型、项目、工具调用和 Token 用量。支持今日、7天、30天和全部时间范围。用户可在 pi 终端内直接查看 AI 使用统计，无需离开命令行。

AI产品 pi pi-atlas AI 仪表盘 Token用量成本追踪

推荐理由：在终端里就能监控自己用了多少 AI Token 和花了多少钱，不用切网页，很方便。

原文

10:55

Geek@geekbb

一个开源项目整合了16家LLM提供商的免费额度，合计每月约17亿Token。其中Google AI Studio提供Gemini 2.5 Flash和Pro的免费API，速率限制高达1M tokens/min，无需信用卡。该工具可避免支付高额API费用，适合批量测试和轻量级应用。

技巧 Gemini 2.5 Flash Gemini 2.5 Pro Google AI Studio 开源项目免费API额度

推荐理由：把各大厂的免费额度集中起来用，尤其Google那1M tokens/min的免费API太香了，零成本搞推理。

原文

10:54

宝玉@dotey

decode-codex 是一个开源项目，包含两个 Skills：codex-app-ref-refresh 用于解包已安装的 Codex.app（app.asar）到 ./ref 目录；deobfuscate-javascript 用于将 ref/webview/assets 中的 JS 反混淆为可读代码并输出到 ./restored。使用时需先确保本地安装 Codex App，然后依次执行两个 Skills，其中 deobfuscate-javascript 步骤需配合 /goal 参数才能还原大部分文件。项目地址在 GitHub，建议 fork 后自己测试。

技巧 Codex decode-codex 反编译 JavaScript 反混淆编程助手

推荐理由：如果你 token 多到没处花，又想研究闭源 coding agent 的内部代码，这个项目让你亲自动手反编译 Codex App，把混淆的 JS 变成人能读懂的代码。

原文

仅展示最近 2000 条内容。更早的内容请查阅 AI 日报存档（侧边栏 → AI 日报 → 顶部「往期日报」）。