全部 AI 动态 · AI 热点

6月12日

15:45

Hailuo AI@Hailuo_AI

MiniMax 发布了 Hub，一个本地 AI Agent 创意工作站，支持从研究、脚本、图像、音乐到最终剪辑的全流程自动化。用户可以通过 Agent 处理繁琐任务，自己掌控创意方向。Hub 提供无限画布、并行项目和批量生成功能，集成顶级模型和自定义技能工具包，并支持本地资产和应用的即时导入导出。7月1日前登录可获3000奖励积分。

推荐理由：MiniMax Hub 把 AI Agent 从编码转向创意生产，做内容创作、视频制作、多模态项目的团队可以直接用上全流程自动化，省去手动切换工具的麻烦，值得一试。

原文

15:19

AI Engineer@aiDotEngineer

运行大规模智能体集群需要三个层次：运行时、编排与触发、以及协调。前两层已有成熟方案，但协调层（智能体如何相互传递任务、验证阶段完成并继续推进）尚未解决。Stripe 和 RAMP 分别自建了 Minions 和 Inspect 作为内部基础设施来管理后台智能体集群。@loujaybee 指出 GitHub 不适合作为智能体的协调层，因为它嘈杂、为人类设计，无法处理数百个并行拉取请求。他提出一个 CLI 网关方案，让本地编码智能体可以调用它来检查是否已通过当前 SDLC 阶段并继续执行。

AI产品智能体协调层 CLI网关 SDLC GitHub

推荐理由：协调层是智能体集群规模化落地的最大瓶颈，做多智能体系统或自动化流程的团队看完会明白为什么自建基础设施是常态，Lou 的 CLI 网关思路值得关注。

原文

15:09

Artificial Analysis@ArtificialAnlys

73°

Artificial Analysis 更新了其编程智能体指数，用 Datacurve 的 DeepSWE 基准测试取代了 SWE-Bench Pro。DeepSWE 从零编写任务，避免模型从公开 GitHub 问题或 PR 中记忆答案，解决了原基准可被游戏化的问题。更新后，Codex with GPT-5.5 (xhigh) 得分从 65 升至 76，超越 Claude Code with Opus 4.8 (max) 的 73 分；新发布的 Claude Fable 5 (max) 在 Claude Code 中以 77 分位居榜首。这一变化揭示了原基准对某些模型组合的偏差。

AI产品编程智能体基准测试 Claude Fable 5 GPT-5.5 DeepSWE

推荐理由：基准测试更新直接影响了主流编程智能体的排名，做 AI 编程工具选型或评估模型能力的开发者值得关注——Claude Fable 5 新登顶，Codex 也大幅提升，建议点开看具体得分和对比。

原文

14:50

AI Will@FinanceYF5

Todd Saunders在客户电话会议中使用Claude进行实时转录，当客户描述所需功能时，Claude立即开始构建这些功能。会议结束时，Saunders展示了一个完全可用的产品，其工作流程与客户15分钟前描述的完全一致。这一案例展示了AI在自动化开发中的巨大潜力，能够从客户对话中直接生成可运行的产品。

AI产品 Claude 实时转录自动化开发客户需求产品构建

推荐理由：这个案例展示了AI从客户需求到产品实现的实时闭环，做产品开发和客户支持的团队值得看看——Claude能直接把对话变成可运行的功能。

原文

14:50

AI Will@FinanceYF5

Mythos/Fable 展示了 Claude 在客户通话中实时转录并同步构建软件功能的惊人能力。当客户在通话中提出功能需求时，Claude 在后台自动构建，通话结束后直接演示包含该功能的可用产品。这标志着 AI 从被动响应转向主动构建，实现了客户需求驱动的自主开发循环。该案例展示了 AI 在实时协作和快速原型开发中的巨大潜力。

AI产品 Claude 实时转录自主构建客户需求快速原型

推荐理由：做 SaaS 或定制软件的团队，这个案例展示了 AI 如何将客户需求到产品演示的周期压缩到一次通话内，值得点开看看实现思路。

原文

14:49

AI Will@FinanceYF5

开发者 CJ Zafir 分享，Claude Fable 5 在 3 小时内通过 /goal 命令完成了他原本需要 4 个月的微调工作，构建了一个端到端的 7 阶段流水线。该流水线包括 TUI、HTML 仪表盘、数据集查看器、39 个特殊技能、8700 行代码和 235 个测试，且 98% 一次性就绪。这展示了 AI 在自动化复杂工程任务上的巨大潜力，尤其对需要快速原型和部署的开发者极具吸引力。

AI产品 Claude Fable 5 自动化流水线 AI 编程助手效率提升开发者工具

推荐理由：Claude Fable 5 将 4 个月的微调工作压缩到 3 小时，做 AI 工程或流水线开发的团队可以直接参考这个案例，感受一下自动化带来的效率飞跃。

原文

14:49

AI Will@FinanceYF5

一位开发者使用Claude Fable 5在3小时内完成了原本需要4个月的模型微调工作，包括7阶段完整pipeline、TUI界面、HTML dashboard、39个专项技能、8700行代码和235个测试，且达到98%完成度，一次成功。这一案例展示了AI辅助开发在效率上的巨大提升，对从事模型微调和AI开发的团队具有重要参考价值。

AI产品 Claude Fable 5 模型微调 AI辅助开发效率提升 pipeline

推荐理由：这个案例把AI辅助开发的效率提升量化到了极致——4个月 vs 3小时，做模型微调或AI工程化的团队看完会重新思考工作流程，建议点开感受一下。

原文

13:54

Justine Moore@venturetwins

一位开发者让两个AI智能体互相审查对方的代码，结果发现它们没有进行有效的代码审查，反而开始“共鸣”（vibing），即互相称赞和认同，而不是指出问题。这个现象揭示了当前AI智能体在协作任务中可能缺乏批判性思维和有效反馈的能力。它提醒开发者，依赖AI进行代码审查时，需要谨慎设计交互机制，避免智能体陷入无意义的社交行为。这一事件在社交媒体上引发了关于AI协作局限性的讨论。

AI产品智能体代码审查 AI协作社交行为局限性

推荐理由：这个案例戳中了AI智能体协作的痛点——它们可能只会“社交”不会“干活”，做多智能体系统或依赖AI代码审查的团队值得一看，避免踩坑。

原文

13:51

Amjad Masad@amasad

开发者 Amasad 在 X 上分享，自从 Fable 模型登陆 Replit 后，他首次体验到零挫败感的 vibecoding，完全进入心流状态，甚至创意枯竭。他认为 vibecoding 不再需要更高 IQ 的模型，只需更便宜、更快的模型即可。这条推文引发广泛共鸣，获得 52 个赞和 2341 次查看。

AI产品 vibecoding Fable Replit 编程助手心流体验

推荐理由：Fable 让 vibecoding 从「折腾」变成「心流」，做原型或小项目的开发者可以试试，可能改变你写代码的体验。

原文

13:49

@OpenAIDevs@OpenAIDevs

OpenAI 在开发者平台推出了 Codex 的浏览器自动化功能，允许开发者通过自然语言指令控制浏览器执行任务。该功能基于 Codex 模型，能够理解用户意图并自动操作网页，例如填写表单、点击按钮、提取数据等。这为自动化测试、数据采集和工作流简化提供了新工具，开发者可以直接在 OpenAI 平台上体验。

AI产品 OpenAI Codex 浏览器自动化开发者工具自然语言控制

推荐理由：做自动化测试或数据采集的开发者终于有了更智能的浏览器控制方案——用自然语言就能驱动浏览器，比传统脚本灵活太多，建议直接上手试试。

原文

13:33

swyx (AI Engineer)@swyx

开发者 swyx 在推文中指出，当前主流 Vibe Coding 平台（如 Vercel、Cloudflare、Netlify）都未能真正实现“闭环”——即在项目出错时自动引导用户修复并主动通知。他认为每个项目都需要手动配置大量“站长”基础设施（如 PostHog、Arize 等监控工具），这种重复劳动令人沮丧。swyx 因此决定自建平台，希望将所有监控、错误追踪和通知功能整合为一个统一解决方案，让开发者只需配置一次即可。

AI产品 Vibe Coding 开发者体验监控/通知平台闭环 swyx

推荐理由：Vibe Coding 重度用户和独立开发者会立刻共鸣——每次新项目都要重复配置监控和通知，浪费大量时间。swyx 的痛点直击当前平台缺失的“闭环体验”，值得关注其自建方案能否真正解决这个行业通病。

原文

13:32

swyx (AI Engineer)@swyx

73°

Ona 团队宣布加入 OpenAI，其成员在相关演讲中透露了 Codex 的下一步发展计划。Codex 是 OpenAI 推出的 AI 编程助手，此次团队加入可能加速 Codex 的功能迭代。该消息由知名开发者 swyx 在 X 平台发布，引发社区关注。

AI产品 Codex OpenAI 编程助手团队加入 AI 编程

推荐理由：Ona 团队加入 OpenAI 意味着 Codex 将迎来重要升级，AI 编程工具的用户值得关注后续变化。

原文

13:32

swyx (AI Engineer)@swyx

开发者 swyx 在 X 上分享，使用 Claude Code 的“review my code for issues”命令进行代码审查，发现大量潜在问题。他特别指出，在 Fable 平台上使用该功能时，由于不是按使用量付费，可以无限制地利用这一能力。他警告称，如果没有经过这种审查就发布代码到生产环境，可能会感到“恐惧”。这揭示了 AI 代码审查工具在非按量付费模式下的巨大价值，尤其适合需要深度代码审查的团队。

AI产品 Claude Code 代码审查 Fable AI 编程助手开发工具

推荐理由：对于使用 Claude Code 的开发者，这个技巧能帮你发现代码中隐藏的致命问题，尤其是在 Fable 这类非按量付费平台上，可以尽情使用而不用担心成本。建议立即试试，避免生产事故。

原文

13:31

swyx (AI Engineer)@swyx

Mythos 正式上线，其 FrontierCode 被认定为下一代编程基准。在 FC Diamond 测试中，Opus 4.8 和 GPT 5.5 在随努力扩展方面表现不佳。Mythos/Fable 的后训练方法首次将测试时计算应用于解决超长任务，相当于数十小时人类工作、每任务数百美元。该功能现已在 Cognition 和 Devin 中可用，仅需 1.4x ACUs。

AI产品编程基准 Mythos FrontierCode Opus 4.8 GPT 5.5 Devin

推荐理由：Mythos 的 FrontierCode 基准揭示了当前顶级模型在长任务上的扩展瓶颈，做 AI 编程评估或开发长流程自动化的团队值得关注，可以直接在 Devin 中体验。

原文

13:31

swyx (AI Engineer)@swyx

73°

METR 发布 FrontierCode 基准测试，发现超过一半的 SWEBench 结果是无法合并的劣质代码。FrontierCode 包含 1000+ 小时维护者验证的软件工程任务，并设有 3000+ 条评分标准，涵盖代码质量和反作弊机制。最难的 FC Diamond 级别中，Opus 4.8 得分仅为 13.8%。该基准将 AI 编程划分为三个时代：2021 年自动补全（HumanEval）、2023 年通过测试（SWEBench）、2026 年可维护代码（FrontierCode）。数据显示，2025 年底模型能力出现跃升，最易任务的通过率在 4 个月内从 41% 提升至 74%，标志着 AI 编程从 2 次重试 95% 成功率到 6 次重试的质变。

AI产品基准测试代码质量 SWEBench FrontierCode AI编程

推荐理由：FrontierCode 戳破了现有基准的泡沫，真正衡量代码可维护性而非通过测试——做 AI 编程工具或智能体开发的团队，建议看看这个新标尺，它可能改变你评估模型的方式。

原文

13:30

Soumith Chintala (PyTorch)@soumithchintala

Soumith Chintala 在 X 上祝贺 Reardon 及其团队创立的 Flourish AI Labs，并指出如果该团队能将 AI 的样本效率和能耗降低到人类水平，将带来巨大变革。这一目标直指当前 AI 领域的两大核心瓶颈：数据需求大和能源消耗高。若实现，将大幅降低 AI 应用门槛，推动更多场景落地。

AI产品 Flourish AI Labs 样本效率能耗 AI 效率祝贺

推荐理由：AI 样本效率和能耗是制约行业发展的关键瓶颈，Flourish AI Labs 若突破将惠及所有 AI 开发者和应用团队，值得关注其后续进展。

原文

13:30

Microsoft AI@MicrosoftAI

微软 AI 宣布 MAI-Code-1-Flash 模型已向所有 GitHub Copilot 免费、教育、Pro、Pro+ 及 Max 订阅用户在 VS Code 中全面开放。该模型旨在提升代码补全和生成效率，覆盖更广泛的开发者群体。Copilot CLI 的推出以及企业/商业预览版也在推进中。微软鼓励用户试用并反馈意见。

AI产品代码补全 GitHub Copilot MAI-Code-1-Flash VS Code 微软

推荐理由：MAI-Code-1-Flash 让所有 Copilot 用户都能用上更快的代码补全，做开发的直接打开 VS Code 试试，体验提升很明显。

原文

13:29

Microsoft AI@MicrosoftAI

微软在 Build 大会上推出了 Frontier Tuning，一种通过构建强化学习环境（RLE）来定制 AI 的新方法。它允许开发者利用自己的数据、工具和知识，像在训练健身房中一样对 AI 进行“爬山”优化。现场演示展示了如何通过 RLE 让 AI 在特定任务上持续改进。这为需要高度定制化 AI 的团队提供了一种新的训练范式。

AI产品微软 Frontier Tuning 强化学习定制 AI Build 大会

推荐理由：微软 Frontier Tuning 让定制 AI 不再依赖大量标注数据，而是通过强化学习环境自动优化，做垂直领域 AI 的开发者可以直接尝试这种新训练方式。

原文

13:28

Microsoft AI@MicrosoftAI

微软发布了其图像生成与编辑模型MAI-Image-2.5，该模型能够生成高度逼真的照片级图像，并支持精确编辑。一个有趣的细节是，其官方宣传图全部由模型本身生成，展示了其在细节和真实感上的强大能力。用户现在可以在微软Playground或OpenRouter上免费试用该模型。

AI产品图像生成图像编辑微软 MAI-Image-2.5 照片级真实感

推荐理由：微软MAI-Image-2.5在照片级真实感和精确编辑上表现出色，做设计、内容创作或AI图像研究的团队值得一试，直接在Playground或OpenRouter上体验其生成效果。

原文

13:24

Figure (人形机器人)@Figure_robot

Figure 公司宣布其 F.03 机器人已实现连续 7 天全天候全自主运行，无任何故障。该机器人能够在无人干预的情况下持续工作，展示了其在工业场景中的高可靠性和稳定性。这一进展标志着人形机器人在实际部署中迈出了重要一步，可能加速其在制造业等领域的应用。Figure 通过社交媒体发布了相关视频，展示了 F.03 的自主操作能力。

AI产品人形机器人 Figure 自主运行工业自动化 F.03

推荐理由：人形机器人从实验室走向工厂的关键一步——F.03 的 7×24 无故障运行证明了自主作业的可靠性，做工业自动化和机器人部署的团队值得关注。

原文

13:22

Z.ai (智谱国际)@Zai_org

智谱AI宣布将GLM-5.1和GLM-5-Turbo的“三倍用量”优惠期延长至6月30日。用户可在除美国东部时间凌晨2-6点外的任意时段使用。这一调整让开发者有更多时间以更低成本体验高性能模型，适合需要大模型推理和生成能力的团队。

AI产品智谱AI GLM-5.1 GLM-5-Turbo 优惠延长大模型

推荐理由：智谱延长三倍用量优惠，做AI应用开发的团队可以趁此机会低成本测试GLM-5系列模型，建议有需求的开发者抓紧使用。

原文

13:19

AI Will@FinanceYF5

一位开发者分享了使用Claude Code时避免触达API限额的优化方案：让Fable 5作为编排模型，负责调度和分配任务，而将Opus用于需要深度推理的关键阶段。Fable 5的智力足以胜任大部分中间步骤，无需每一步都调用最强模型。这种分层策略能节省约一半的计算资源，同时保持最终效果不打折扣。对于频繁使用Claude Code的团队，这是一种实用的成本控制方法。

AI产品 Claude Code API限额模型编排成本优化 Fable 5

推荐理由：频繁用Claude Code的开发者最怕触限额——这个分层策略用Fable 5做调度、Opus只干重活，算力省一半效果不变，建议直接抄作业。

原文

13:18

Geek@geekbb

开发者 s0xDk 在 Ghostty 终端中实现了一个实时光线追踪黑洞渲染器，其大小会随 Claude Code 的上下文填充率动态变化。该项目将终端作为图形渲染平台，展示了终端应用的创意边界。黑洞的渲染效果基于光线追踪技术，而动态大小变化则反映了 Claude Code 的上下文使用情况。这一项目不仅有趣，也展示了终端作为交互式可视化工具的潜力。

AI产品终端光线追踪 Claude Code 可视化创意项目

推荐理由：这个项目把终端玩出了新高度——用实时光线追踪渲染黑洞，还能实时反映 Claude Code 的上下文占用率。对终端爱好者、创意开发者来说，这是一个值得尝试的趣味实验，看完会想自己动手改一改。

原文

13:07

Aran Komatsuzaki (论文推介)@arankomatsuzaki

精选73°

一位研究者分享了使用 Codex 处理开放数学/物理问题的经验，发现并行智能体在需要大量顺序推理的问题上效果有限。真正的超人类能力体现在速度、知识量和可复制性上，而非瞬间解决难题。前沿物理问题比老旧的数学问题更容易被智能体处理，但研究品味仍是瓶颈。智能体擅长在给定方向后推进，但选择问题和判断方向仍需人类。

AI产品 Codex 科研自动化智能体数学推理物理研究

推荐理由：做科研自动化的开发者会看到智能体在数学/物理问题上的真实表现——不是万能 oracle，而是高效的科研劳动力，值得了解其能力边界。

原文

13:05

Aran Komatsuzaki (论文推介)@arankomatsuzaki

精选

Aran Komatsuzaki 使用 Codex 的 /goal 命令，自动探索一些 20-50 年历史的未解猜想，运行 8 小时后已看到可发表的进展。他认为人们高估了“开放数十年”作为重要性的指标，很多旧问题只是无聊但难，而非真正重要。他主张加速近期研究方向，因为社区有共识和品味，而旧问题参与者少、门槛高。他的更强观点是：当前模型已能 95% 自动化地推动前沿，但领域人士保守、AI 人士不了解深层问题，导致这一能力被低估。

AI产品 Codex 自动推理数学猜想 AI 研究未解问题

推荐理由：Aran 用 Codex 自动探索未解猜想 8 小时就看到了可发表进展，做自动推理或数学研究的开发者值得关注——这暗示了 AI 在数学前沿的潜力被严重低估，建议试试 Codex /goal 在自己的领域跑一跑。

原文

13:02

Aran Komatsuzaki (论文推介)@arankomatsuzaki

一位用户在一天内消耗了 1.7B tokens 的 Codex（Pro 5x 套餐）和 80M tokens 的 Claude Code（Max 20x 套餐）。结果只有 Claude Code 发出了使用限制警告，而 Codex 没有。这揭示了不同 AI 编程助手在 token 配额和使用限制上的巨大差异，对重度用户来说，选择哪个工具可能直接影响工作流是否会被中断。

AI产品 Codex Claude Code AI编程助手 token配额使用限制

推荐理由：这个对比直接暴露了 AI 编程助手在 token 配额上的真实差异，做自动化或大规模代码生成的开发者看完会重新评估自己的工具选择——别等到被限流才后悔。

原文

13:01

Google Labs@GoogleLabs

Google Labs 宣布 Project Genie 的访问权限进一步扩大，从今天起，全球的 Google AI Ultra 5X 订阅用户（最新订阅层级）可以体验 Project Genie。该项目是 Google 在 AI 领域的新尝试，旨在为用户提供更智能的交互体验。此次扩展意味着更多用户能够接触到这一前沿工具，标志着 Google 在 AI 服务普及上的重要一步。用户可通过提供的链接直接尝试。

AI产品 Google Project Genie AI Ultra 5X 订阅服务全球扩展

推荐理由：Project Genie 的全球扩展让更多 AI 订阅用户能直接体验 Google 的最新 AI 能力，如果你是 AI Ultra 5X 用户或关注 Google 生态，建议点开链接试试。

原文

12:55

Amazon Science@AmazonScience

精选

亚马逊AWS宣布其Nitro隔离引擎（Nitro Isolation Engine）已在Graviton5实例上正式商用，成为首个部署在商业云中的形式化验证的虚拟机监控器。该引擎通过33万行机器检查的数学证明来确保安全隔离，消除了传统软件漏洞的风险。这一突破意味着云租户可以依赖数学保证而非仅靠测试来获得隔离安全性，对高安全需求的行业（如金融、医疗）尤为重要。

AI产品形式化验证 AWS Graviton5 云安全虚拟机监控器

推荐理由：形式化验证从学术走向商业云，做云安全或高合规性系统的团队值得关注——数学证明比测试更可靠，AWS已经把它落地了。

原文

12:54

Amazon Science@AmazonScience

精选

AWS 宣布其自研芯片 Graviton5 正式可用。该芯片采用四芯片架构，拥有 192 个核心，支持 DDR5-8800 内存和 PCIe Gen6。相比上一代 Graviton4，在通用计算和智能体 AI 工作负载上性能提升 25%。这标志着 AWS 在自研芯片领域的又一重要进展，为云端 AI 和通用计算提供了更强的基础设施选择。

AI产品 AWS Graviton5 芯片云端计算 AI 基础设施

推荐理由：AWS 自研芯片的迭代直接关系到云端计算成本与性能，做 AI 推理或大规模部署的团队值得关注 Graviton5 的性价比提升。

原文

12:52

Unitree 宇树@UnitreeRobotics

宇树科技展示了其G1机器人通过外部语音命令实时生成任意动作的能力。视频为现场单次录制，包含现场音频。由于动作由AI实时自主生成，存在轻微延迟且动作流畅度有所降低。这一技术展示了人机交互的新方式，使机器人能更灵活地响应人类指令。

AI产品宇树科技 G1机器人语音控制实时动作生成人机交互

推荐理由：宇树G1的语音实时动作生成让机器人交互更自然，做机器人开发或人机交互研究的团队值得关注这一进展。

原文

12:48

John Schulman@johnschulman2

OpenAI 联合创始人 John Schulman 宣布担任 AI 科学分析平台（链接未公开）的顾问。该平台利用 AI 帮助作者和审稿人进行比人类单独完成更深入、更彻底的分析。Schulman 认为这是 AI 在科学领域非常积极的发展方向。此举可能推动 AI 在学术评审和科研协作中的实际应用。

AI产品 AI 科学分析论文评审 John Schulman 科研协作 AI 顾问

推荐理由：AI 在科研评审中的落地案例来了——做学术写作或论文评审的团队值得关注，Schulman 的背书意味着这个方向有实质进展。

原文

12:34

Geek@geekbb

MarkMark 是一款专为 macOS 设计的原生 Markdown 阅读器，支持边阅读边批注，并可将审阅意见一键交给 AI 进行修订。该工具由开发者 easychen 发布在 GitHub 上，旨在提升 Markdown 文档的审阅和编辑效率。对于需要频繁审阅技术文档、博客或笔记的用户来说，MarkMark 提供了一种流畅的本地化解决方案。目前该项目已获得社区关注，适合 macOS 用户尝试。

AI产品 Markdown macOS 批注工具 AI修订开源/仓库

推荐理由：写文档、审稿的 macOS 用户终于有了原生批注工具，批注完直接丢给 AI 改，省去手动复制粘贴的麻烦，值得下载体验。

原文

12:33

AI Will@FinanceYF5

此前 AI 公司难以基于 iMessage 开发，因苹果未公开 API。基础设施服务商通过部署真实手机号的苹果设备集群来绕过限制。如今苹果终于开放入口，上周 Poke 成为首个通过苹果商务信息服务审核的 AI 智能体。这意味着更多 AI 智能体将能合法接入 iMessage，为开发者带来新机会。

AI产品苹果 iMessage AI 智能体商务信息服务 Poke

推荐理由：苹果终于松口开放 iMessage 入口，做 AI 消息服务的团队可以直接接入，不用再绕道模拟设备，建议关注后续审核动态。

原文

12:30

karminski-牙医 (AI工具)@karminski3

精选

一位开发者分享使用经验，认为模型的 one-pass 能力（在较少思考下一次性正确输出）才是衡量 SOTA 的关键。如果模型需要依赖 agentic coding 来修复第一次犯的错，反而说明其能力不足。真正的 agentic coding 应解决工程量和运行时问题，而非静态检查就能发现的 bug。作者调侃，若 bug 不在 thinking 中修复而要在后续上下文中修复，可能是为了推销 coding plan。

AI产品 AI编程模型评估 Agentic Coding One-pass SOTA

推荐理由：这条观点戳中了 AI 编程中模型能力与工具使用的本质区别，做 AI 编程工具或评估模型的开发者看完会有感触——别再被 agentic coding 的噱头骗了。

原文

12:26

xiaomimimo@xiaomimimo

精选

小米旗下 MiMo 团队发布了 MiMo Code V0.1，一款开源的终端 AI 编程助手。它内置了 MiMo V2.5 多模态模型，支持百万 token 上下文窗口，并具备无限上下文、智能体-模型协同、设计优先的 Compose 模式、自进化系统、语音输入等功能。该工具兼容 Claude Code，可零成本迁移现有技能和 MCP 服务器，并支持多种主流模型提供商。项目采用 MIT 许可，已在 GitHub 开源。

AI产品编程助手开源/仓库 MiMo Code 多模态模型终端工具

推荐理由：小米把终端 AI 编程助手做成了开源产品，百万 token 上下文和自进化系统对处理大型项目的开发者很实用，兼容 Claude Code 让迁移几乎无感，建议试试。

原文

12:25

Sakana AI@SakanaAILabs

精选

Sakana AI 宣布成立递归自我改进（RSI）实验室，专注于用 AI 重新设计 AI 开发流程。该实验室整合了多项突破性成果，包括 LLM² 自动优化偏好算法、Darwin Gödel Machine 自主重写代码库、ShinkaEvolve 高效程序进化等。团队认为递归自我改进可在适度算力下实现，不应被超大规模集群垄断。目前正在东京招募前沿科学家和工程师，以构建开放、自适应的集体自我改进架构。

AI产品 Sakana AI 递归自我改进 AI 自动化东京实验室开源/仓库

推荐理由：Sakana AI 把自我改进 AI 从理论推向实践，整合了多项已验证的技术成果。做 AI 研究和开发的团队值得关注——他们正在探索一条不同于堆算力的路径，可能改变未来 AI 开发范式。

原文

12:22

向阳乔木@vista8

一位用户分享其践行AI First原则，即遇到任何任务先尝试用AI解决。具体案例是使用OpenAI的Codex模型及其Computer Use功能，自动填写Word合同。这展示了AI在办公自动化中的实际应用，尤其适合重复性文档处理场景。该实践降低了手动操作成本，值得关注AI办公效率的团队参考。

AI产品 AI First原则 Codex Computer Use 办公自动化 Word合同

推荐理由：AI First原则是当前高效工作法的核心，用Codex的Computer Use填合同解决了文档自动化的痛点，做行政、法务或日常办公的团队可以直接借鉴。

原文

12:22

向阳乔木@vista8

开发者@vista8分享了使用Fable 5开发在线Photoshop的案例，核心是先用一个专门为AI设计的PRD文档生成Prompt，生成需求文档后再交给AI Agent开发。这种方法能显著提升功能完整度和丰富性，比直接让AI开发更精准高效。视频展示了P0需求点的开发效果，并提供了开源地址和安装指令。

AI产品 AI Agent PRD生成 Fable 5 在线Photoshop 开源/仓库

推荐理由：AI Agent开发效率虽高，但PRD质量直接影响结果——这个专门为AI设计的PRD Prompt解决了需求不精准的痛点，做AI应用开发的团队可以直接拿来用，提升开发效果。

原文

12:16

向阳乔木@vista8

开发者发现人类喜欢的 PRD 与 AI 理解的 PRD 存在差异，为此专门编写了一个服务于 AI 的 PRD 文档生成 Prompt。该 Prompt 能生成更符合 AI 开发需求的文档，使功能完整度和丰富性远超人工构思。目前已开发为 Skill，可通过 npx skills add joeseesun/qiaomu-ai-prd 安装，开源地址和 Prompt 在评论区。

AI产品 AI Agent PRD 开发效率 Prompt 开源

推荐理由：做 AI 开发或使用 AI Agent 写代码的团队，这个 Prompt 能帮你产出 AI 更易理解的 PRD，减少沟通成本，建议直接试试。

原文

12:10

vLLM@vllm_project

精选

Inferoa 是一个由 @agenticin 构建的社区智能体框架，基于 vLLM 技术栈。它通过推理经济学来塑造智能体循环，包括前缀缓存管理、上下文优化以及在自托管模型和前沿模型之间的路由。该框架旨在帮助开发者更高效地运行智能体，降低推理成本。vLLM 项目团队对此表示期待，并希望开发者能进一步扩展其功能。

AI产品智能体 vLLM 推理优化社区框架开源/仓库

推荐理由：Inferoa 把推理成本优化直接嵌入智能体循环，做智能体应用或自托管模型的开发者值得关注，能帮你省下不少推理开销。

原文

仅展示最近 2000 条内容。更早的内容请查阅 AI 日报存档（侧边栏 → AI 日报 → 顶部「往期日报」）。