全部 AI 动态 · AI 热点

AITOP

6月15日

11:12

Google AI Developers@googleaidevs

Google AI研究员与工程师在Kaggle推出5天Vibe Code课程。学员将学习用自然语言编写可扩展的智能体系统。课程包含一个实践性的结业项目（capstone project）。

推荐理由：Google AI的Kaggle课程，学用自然语言写代码

原文

11:12

idoubi@idoubicc

精选

CCOnline是一个基于WebSocket和xterm.js仿真终端的在线Claude Code运行环境。其核心采用存算分离架构，使用Cloudflare Sandbox作为临时容器而非常驻。用户生产资料存储在R2上，Sandbox内置ShipAny模板和skills，还需解决计费、预览、部署、防注入等问题。作者利用ShipAny + TanStack + Claude Code这套组合快速搭建了系统，框架提供了80%的SaaS基础设施。

行业 CCOnline Claude Code ShipAny Cloudflare Sandbox 存算分离

推荐理由：拆解CCOnline的存算分离架构

原文

11:12

shao__meng@shao__meng

72°

微软CEO Satya Nadella指出，企业真正的资产不是模型本身，而是人类资本与token资本相互强化的学习闭环。他提出企业需要构建可替换的通用模型加不可丢失的"公司老兵"经验的新架构，并引入Private Evals（私有评测）和Private RL Environments（私有强化学习环境）等工具。Nadella将这套闭环称为"爬山机"（hill climbing machine），认为它会自我复利，成为企业新的IP。他还警告，若少数AI模型攫取全部经济价值，将重演全球化第一阶段的产业空心化风险。

行业 Satya Nadella 微软企业AI策略 AI生态知识管理

推荐理由：纳德拉的企业AI战略观

原文

11:12

elvis@omarsar0

动态工作流可以将任务分发给不同的LLM或智能体。推文作者认为LLM Councils在此场景下能发挥很大作用。这种设计允许不同模型协作完成任务。

行业动态工作流 LLM Councils 智能体

推荐理由：聊聊用LLM议会做动态分发

原文

11:12

Guillermo Rauch@rauchg

skills.sh 上的技能数量已超过 70 万。所有技能均由社区用户自发创建，无任何官方推广。这一数字在开放 AI 生态系统中持续增长。平台目前收录 70 万+ 实用 AI 技能，覆盖多种使用场景。

AI产品 skills.sh 社区驱动 AI技能

推荐理由：社区共创70万AI技能

原文

11:11

elvis@omarsar0

Omar Sanseviero分享了一个名为llm-council的开源技能，用于在Claude Code中组合多个LLM组成委员会进行深度研究。该技能默认使用Fireworks AI的API，但可轻松适配OpenRouter。项目托管在github.com/dair-ai/dair-ai仓库，目前支持Claude Code，但可能兼容其他智能体。作者表示可用此技能执行复杂的研究任务，并计划未来扩展到更多领域和动态工作流。

技巧 llm-council Fireworks Claude Code 智能体研究任务

推荐理由：分享了一个LLM委员会技能，能组合多个模型做研究

原文

11:11

Viking@vikingmute

精选

Viking分享了一个省钱的工作流，灵感来自shadcn的improve skills思路。先让GPT-5.5 High出包含Metadata、Scope和Steps的plan，不写一行代码。再用Composer 2.5和DeepSeek v4 pro分别实现，效果都不错。最后用review-forge审查提高代码质量，整体花费非常少。这个repo 4天获得3.7K stars。

技巧 GPT-5.5 High Composer 2.5 DeepSeek v4 pro review-forge shadcn 工作流省钱

推荐理由：省钱开发新功能的实际方法

原文

11:10

Tw93@HiTw93

Waza 是一套包含8项工程习惯技能（规划、审查、调试等）的工具，可在 Claude Code、Codex 等编码工具上运行。用户切换底层模型后仍能保持相同工作流程。Waza 帮助开发者延续熟悉的工程习惯，无需因模型变更而重新学习。该工具已在GitHub开源。

技巧 Waza Claude Code Codex 编程助手工作流

推荐理由：用Waza在多个编码工具间切换模型

原文

11:10

shao__meng@shao__meng

精选

Codex Mobile 将手机作为远程开发机的控制中心，代码执行仍在桌面端完成。任务启动时可配置主机、工作区、Git 分支，并创建独立 worktree 隔离变更。Side Chat 提供与主线程关联的轻量对话，不打断主工作流。Plan 模式用于高风险任务，Goal 模式设定可验证终态，Mobile 端支持完整操作。Mobile 独有优势包括拍照/选图、语音录制 prompt，以及通过行内评论审查代码变更。

技巧 Codex Mobile OpenAI 编程助手远程开发代码审查

推荐理由：手机远程编码实战技巧

原文

11:08

orange.ai@oran_ge

精选

橙线插画 skill 是一款将长文自动生成插图的工具，作者用它为一篇7.5万字的文章制作了20张插图。Agent 会为每个场景生成2套方案供选择，最终未对任何图片进行修改。该skill已开源，下载地址在github.com/orange2ai/oran…。

技巧 Orange AI 橙线插画 skill 智能体提示词工程

推荐理由：能帮长文秒变漫画，省时省力

原文

10:23

shao__meng@shao__meng

精选

Databricks 基于自身实践（5000+ 工程师使用 coding Agent、对外交付 Genie 等产品）推出 Omnigent，这是一个 meta-harness，旨在解决多 Agent 组合、治理与协作的痛点。它提供三大能力：Composition（一行配置切换 Claude Code、Codex、Pi 等 harness）、Control（按 session 追踪 LLM 花费，每 $100 暂停并请求继续；支持 OS 沙箱和上下文安全策略）、Collaboration（通过 URL 共享 live session，支持终端、Web、macOS、移动端访问）。Omnigent 已在 Databricks 内部使用，并以 Apache 2.0 开源。

AI产品 Omnigent Databricks 智能体 Agent编排

推荐理由：多Agent管理新方案

原文

10:22

Gary Marcus@GaryMarcus

精选

一篇arXiv论文（2601.22436）发现，当前LLM智能体系统存储过去任务时包含原始步骤历史或总结规则。研究者通过将正确提示替换为随机垃圾文本来测试记忆使用情况：当步骤历史被破坏时，AI表现显著下降；但当总结规则被破坏时，AI性能无变化。这表明AI并未真正应用抽象规则，而是依赖复制精确历史动作。

论文 LLM智能体推理模型记忆机制抽象推理

推荐理由：论文实锤AI只会照搬历史

原文

10:20

向阳乔木@vista8

精选

该工具输入任意App名称即可自动抓取AppStore用户评价，并通过DeepSeek进行四类信息挖掘：用户正面/负面评价、问题与版本更新的关联、产品机会识别、可视化图表输出。产品预计下周开源，可帮助产品经理快速从评论中提取 actionable 信息。

技巧 DeepSeek AppStore 产品经理用户评论挖掘数据分析

推荐理由：帮你用DeepSeek挖掘AppStore评论，找出产品机会

原文

6月14日

22:25

Gary Marcus@GaryMarcus

Peter Thiel 和 Balaji Srinivasan 资助的平台 Objection.ai 允许用户以2000美元起价投诉记者报道。平台由人类调查员审查后，提交给 OpenAI、Anthropic、Grok、Google 的 AI 模型组成的“陪审团”发布真实性裁决，并排名记者在真相讲述和更正方面的指标。记者若不回应辩护，裁决仍会在线发布。该系统将匿名来源视为不可信，排名靠后，而匿名来源是五角大楼文件等重大问责报道的关键。民权律师称其为“富人的高科技保护费”。

行业 Objection.ai Peter Thiel AI陪审团媒体问责 AI安全

推荐理由：揭露AI被用来压制记者

原文

22:25

shao__meng@shao__meng

76°

Bloomberg 深度纪录片采访 Anthropic 联合创始人 Dario & Daniela Amodei 及 Claude Code 负责人 Boris Cherny，揭示公司从 OpenAI 出走后的发展历程。Anthropic 估值约 9650 亿美元，2026 年 Q1 年化增长约 80 倍，API 调用量同比 17 倍，首次盈利主要靠 Claude Code 等企业工具。Dario 维持 AI 可能在 1-5 年内消除约 50% 初级白领岗位的判断，并支持对华芯片出口管制。纪录片还披露了 Claude Mythos 发现数千个高危漏洞、与五角大楼冲突（拒绝无护栏使用后遭黑名单）等内幕。

行业 Anthropic Claude Dario Amodei AI安全地缘政治

推荐理由：Bloomberg 挖出 Anthropic 安全红线与五角大楼冲突

原文

21:55

idoubi@idoubicc

ShipAny TanStack 发布了 CCOnline，一款在线 vibe coding 工具，内置模型且开箱即用。其终端运行在 sandbox 环境中，实现零依赖启动。该工具旨在简化编程流程，无需本地配置即可直接使用。目前该推文获得 9 个点赞和 1572 次查看，引发社区讨论。

AI产品 ShipAny TanStack CCOnline vibe coding 编程助手

推荐理由：在线编码，零依赖开箱即用

原文

20:56

Geek@geekbb

illo-sketch是一个AI技能，可将文章或创意转化为印刷风格的社论插图。它内置十套画风，包括riso印刷、蓝图、黏土和像素等。用户可使用一只可重复使用的吉祥物来演绎创意点子。该项目托管在GitHub上，由tmchow开发。

技巧 illo-sketch GitHub 印刷风格插图生成吉祥物

推荐理由：十套画风加吉祥物，创意插图神器

原文

17:39

Geek@geekbb

GitHub 项目 pulkitxm/claude-fable-5-demos 收录了 60 多个由 Claude Fable 5 生成的落地页和交互原型。每个项目附带原始 prompt 和运行录屏，可作为 LUI 设计灵感本和作品集。项目展示了 Fable 5 在 UI 生成方面的能力，适合设计师和开发者参考。

AI产品 Claude Fable 5 落地页交互原型 LUI设计

推荐理由：60 多个落地页原型，每个都带 prompt 和录屏

原文

16:21

Yangyi@Yangyixxxx

Ponytail插件通过YAGNI原则和检查stdlib、平台原生功能、已有依赖等步骤，让AI coding agent避免过度工程。基准测试显示代码量减少80-94%，成本降低47-77%，速度提升3-6倍。支持Hermes、Claude Code、Codex、Cursor等Agent。

技巧 Ponytail AI编程助手智能体提示词工程代码优化

推荐理由：让AI agent少写80%代码

原文

16:21

宝玉@dotey

Phoenix Yin指出，过去在GPT-3.5提示词中让其冒充GPT-4只能获得性能提升的错觉。Fable 5的真正实力来自Mythos-class底层权重、海量新训练数据和复杂agent架构，而非简单提示词复制。泄露prompt与老模型最多cosplay出味道像的lite版，性能差距巨大。Fable 5在长时程复杂分析、工具链、自验证等硬核任务上直接甩老模型几条街。

AI模型 GPT-3.5 GPT-4 Fable 5 提示词工程推理模型

推荐理由：别信提示词能偷实力，Fable 5靠的是真功夫

原文

16:14

Z.ai (智谱国际)@Zai_org

精选

智谱 AI 发布新旗舰模型 GLM-5.2，现已面向所有 GLM 编程计划用户（包括 Lite、Pro、Max 和 Team 计划）开放。该模型具备强大的编码能力，支持 100 万 token 上下文，并在长周期任务中表现持续强劲。API 和聊天机器人服务将于下周上线，模型也将于下周以 MIT 许可证正式开源。

AI模型 GLM-5.2 智谱AI 开源模型编程助手

推荐理由：智谱开源新旗舰，百万上下文

原文

16:09

Viking@vikingmute

Shadcn 的 /improve 思路主张用最强大的模型（如 GPT-6）深入理解代码库、发现问题并产出高质量计划，而将实际执行交给更便宜的模型完成。Skill 本身绝不直接修改代码，只负责产出计划，主 Skill 包括快速和全面等多种模式。该 repo 发布 4 天即获 3.7K stars，作者认为 skills 是目前最容易获得 stars 的方式。

技巧 shadcn /improve 编程助手开源模型智能体

推荐理由：Shadcn 教你用最强模型出计划

原文

15:38

Sebastian Raschka@rasbt

精选

Cohere 推出了一款新的轻量级 30B 开源模型，基于 Command A+ 的并行 Transformer 架构，层数几乎翻倍。该模型专为智能体编程任务优化，在 Terminal-Bench 和 SWE-Bench 等基准测试中表现优于 Gemma 4。在 Terminal-Bench 中，模型需使用终端、检查环境、运行命令并读取输出；在 SWE-Bench 中，模型需处理真实 GitHub 软件问题，理解仓库、定位文件、生成补丁并通过测试。在 SciCode 和 LiveCodeBench 等传统代码基准上，模型也具备竞争力，但整体性能略低于 Qwen3.6。

AI模型 Cohere Command A+30B 智能体编程助手

推荐理由：Cohere 新 30B 模型专攻智能体编程，比 Gemma 4 强

原文

12:51

宝玉@dotey

宝玉在推文中指出，模型能力是根本，而Harness层（工具链）相对容易补齐，且不需要过多垂直领域定制。他透露Claude Design很快就会合并到Claude Desktop。对于Codex，他认为在下一代或几代模型能力足够后，Codex App会以Plugin方式集成Codex Design。他还回应了关于开源Open Design的提问，认为若其使用Claude Code的模型，可能达到类似工程能力。

行业 Claude Design Claude Desktop Codex Harness 模型能力

推荐理由：宝玉聊模型和Harness的底层逻辑

原文

12:51

宝玉@dotey

设计师dotey分享用AI Agent辅助设计后，修改字型字号颜色的新方式。首先，使用设计系统规范按钮圆角、字号、间距，避免3px、5px等随意值。其次，设计师通过文字指令指挥Agent修改，Opus 4.8+结合设计系统可做到“言出法随”。最后，设计师负责把控大方向和验收结果，Agent执行具体调整。

技巧 AI Agent 设计系统 Opus 4.8 提示词工程

推荐理由：设计师用Agent改设计的新思路

原文

11:53

Browser Use@browser_use

Browser Use 宣布其插件已可在 Claude Code 中使用。用户可通过命令 `claude plugin marketplace add browser-use/plugins` 安装。该插件旨在增强 Claude Code 的浏览器自动化能力。该消息在 X 平台发布，获得 11 个点赞和 575 次查看。

AI产品 Browser Use Claude Code 插件浏览器自动化

推荐理由：Claude Code 能控制浏览器了

原文

11:52

小互@imxiaohu

该视频中，一位前OpenAI员工分享了他离开公司的原因，包括对AI安全方向的担忧以及公司内部文化的变化。他提到OpenAI从非营利转向商业化的过程中，优先考虑产品发布速度而非安全研究。视频还讨论了AGI发展路径上的分歧，以及他个人对AI风险的不同看法。

行业 OpenAI AI安全 AGI 商业化前员工

推荐理由：前员工亲述离开OpenAI内幕

原文

11:51

小互@imxiaohu

彭博社采访中，Anthropic CEO Dario Amodei 透露公司有一个未发布的模型 Mythos，存在上千个漏洞，能黑银行、撬国家机密。他预测 AI 一到五年内将砍掉一半入门级白领工作。他还首次说明离开 OpenAI 的原因是信任崩了而非安全分歧。Amodei 认为文明崩溃概率为 10% 到 25%，并呼吁政府对所有 AI 公司加强监管。

行业 Anthropic Dario Amodei Mythos AI安全监管

推荐理由：Anthropic 老板亲述 Mythos 模型有多危险

原文

10:52

Clement Delangue@ClementDelangue

Hugging Face CEO Clement Delangue 在推文中强调 AI 发展没有必然性，所有人都有选择权。他对比两条路径：封闭 API 导致权力集中，或开源 AI 让所有人参与。他引用 SemiAnalysis 的案例：里约热内卢市基于 Qwen 7/2 后训练了 Rio 3.5 Open 397B 模型，该模型采用 SwiReasoning 框架，动态切换标准链式推理和隐空间推理，通过熵置信信号提升 token 效率。

行业 Clement Delangue Hugging Face 开源模型 Qwen SwiReasoning

推荐理由：开源 vs 封闭，里约市用 Qwen 做示范

原文

10:08

Geek@geekbb

精选

Pi Studio 是从 Tau 代码库分出的独立分支，专为 Pi 编码代理打造了一个 Codex 风格的图形客户端。它直接将 Pi 运行时打包进应用，安装后即可使用，省去了传统命令行工具的配置步骤。该工具旨在降低使用门槛，让开发者能快速上手 Pi 编码代理。

AI产品 Pi Studio Tau Pi Codex 编程助手

推荐理由：一键启动 Pi 代理，不用敲命令行

原文

09:52

Geek@geekbb

精选

一个名为 Archify 的开源项目展示了通过 LLM（如 pi 和 DeepSeek）将自然语言描述转换为结构化 JSON，再经 Node.js 渲染器用纯几何算法生成 SVG 并注入自包含 HTML 的流程。该方法无需依赖任何生图模型，仅利用 LLM 的指令遵循能力即可实现从文本到矢量图形的转换。项目代码托管在 GitHub 上，提供了一种轻量级的 AI 绘图新思路。

技巧 DeepSeek pi Archify SVG 开源模型

推荐理由：不用生图模型也能画图

原文

08:53

宝玉@dotey

黄赟分享了一个与AI Agent交互的习惯：先让Agent写出coding plan，反复确认后汇总task列表，最后再编程并标记已完成。核心原则是交代任务时明确验证标准，之后无需关注中间过程。这种方法能提升Agent任务执行的效率和准确性。

技巧 Agent 提示词工程编程助手

推荐理由：Agent交互技巧，省心省力

原文

08:53

宝玉@dotey

Codex 内建的前端修改功能比 Claude Design 更强，在模型能力相近时 Codex 胜出。当模型能力有差距时，用户宁愿手动操作。设计师认为 Claude Design 作为网页版极反常理，应与 coding agent 集成。该讨论基于 X 平台用户 @Xxi5olc 和 @dotey 的对话。

AI产品 Codex Claude Design 前端修改编程助手

推荐理由：Codex 前端修改比 Claude Design 强

原文

08:52

宝玉@dotey

精选73°

宝玉分享了一个用Claude Design更新视频字幕编辑器UI的案例：将标题文字从单行改为两行布局。他在Claude Design中修改设计稿后导出zip，用git diff查看变更，然后给Claude Code一句提示“参考设计稿design目录下的相关变更，对UI进行变更”，Claude自动分析diff并修改了Swift代码。整个过程主要在设计端操作，代码端自动同步。

技巧 Claude Design Claude Code UI设计编程助手工作流

推荐理由：手把手教你用Claude Design改UI

原文

08:08

Simon Willison@simonw

Simon Willison宣布了将Python扩展（C、C++、Rust等）编译为WebAssembly并通过PyPI分发的方法。Pyodide可以直接安装这些编译后的包，无需额外构建步骤。这利用了Pyodide的包管理机制，使纯WebAssembly的Python生态扩展成为可能。该流程依赖Pyodide的特定配置和构建工具，包括PyO3和maturin等。

技巧 Pyodide WebAssembly PyPI Python扩展

推荐理由：教你如何让Python扩展跑在浏览器里

原文

07:51

Gary Marcus@GaryMarcus

Gary Marcus在X上发问，质疑Andrej Karpathy是否真的被Anthropic雇佣来负责“递归自我改进”（RSI）。Liron Shapira回应称，Anthropic一边推动RSI一边警告其带来灾难性风险，存在虚伪。Marcus指出，All-In播客成员可能不了解内部逻辑，但认为这种做法疯狂。该推文获得4条回复、2次转发和11个赞。

行业 Anthropic Andrej Karpathy Gary Marcus AI安全递归自我改进

推荐理由：Marcus质疑Anthropic的RSI矛盾

原文

07:44

MiniMax_AI@MiniMax_AI

MiniMax的M3模型在NousResearch的Hermes Agent上运行。Hermes Agent是一个开源智能体框架，M3模型为其提供推理能力。该组合展示了M3在智能体任务中的表现。

AI模型 MiniMax M3 Hermes Agent NousResearch 智能体

推荐理由：看看M3模型在智能体上的表现

原文

07:01

rohanpaul_ai@rohanpaul_ai

Vinod Khosla在SparX播客中警告，传统IT服务和BPO业务在AI时代将消失。他建议印度转向部署AI以保持竞争力。该言论引发对印度IT外包行业未来就业的讨论。

行业 Vinod Khosla 印度 BPO IT服务 AI部署

推荐理由：Khosla说印度BPO要没了

原文

06:09

rohanpaul_ai@rohanpaul_ai

83°

据路透社报道，亚马逊CEO Andy Jassy本周向特朗普政府高级官员表达了对Anthropic最新模型Fable 5的安全担忧。亚马逊研究人员通过一系列提示词成功诱导Fable 5泄露了本不应分享的、可辅助网络攻击的信息。这一事件发生在美国政府即将对AI模型安全进行更严格监管之前。

行业 Anthropic Fable 5 亚马逊 AI安全监管

推荐理由：亚马逊CEO亲自警告Anthropic新模型安全漏洞

原文

06:09

rohanpaul_ai@rohanpaul_ai

精选

一项新研究提出了HLL基准测试，要求AI智能体完成10种CAPTCHA任务，包括识别页面元素、正确点击或拖动、跟踪状态变化并提交答案。测试发现，即使强大的智能体在静态任务中表现良好，但在页面杂乱、任务复杂或系统验证操作有效性时仍会失败。该基准旨在评估智能体在真实人机验证场景中的能力，结果显示当前AI智能体难以通过此类验证。

论文 HLL CAPTCHA 智能体基准测试 AI安全

推荐理由：看看AI怎么被CAPTCHA难倒的

原文

仅展示最近 2000 条内容。更早的内容请查阅 AI 日报存档（侧边栏 → AI 日报 → 顶部「往期日报」）。