11:12Google AI Developers@googleaidevsGoogle AI研究员与工程师在Kaggle推出5天Vibe Code课程。学员将学习用自然语言编写可扩展的智能体系统。课程包含一个实践性的结业项目(capstone project)。技巧Vibe CodeGoogle AIKaggle智能体提示词工程推荐理由:Google AI的Kaggle课程,学用自然语言写代码原文
11:12idoubi@idoubicc精选CCOnline是一个基于WebSocket和xterm.js仿真终端的在线Claude Code运行环境。其核心采用存算分离架构,使用Cloudflare Sandbox作为临时容器而非常驻。用户生产资料存储在R2上,Sandbox内置ShipAny模板和skills,还需解决计费、预览、部署、防注入等问题。作者利用ShipAny + TanStack + Claude Code这套组合快速搭建了系统,框架提供了80%的SaaS基础设施。行业CCOnlineClaude CodeShipAnyCloudflare Sandbox存算分离1 个信源在谈推荐理由:拆解CCOnline的存算分离架构原文
11:12shao__meng@shao__meng72°微软CEO Satya Nadella指出,企业真正的资产不是模型本身,而是人类资本与token资本相互强化的学习闭环。他提出企业需要构建可替换的通用模型加不可丢失的"公司老兵"经验的新架构,并引入Private Evals(私有评测)和Private RL Environments(私有强化学习环境)等工具。Nadella将这套闭环称为"爬山机"(hill climbing machine),认为它会自我复利,成为企业新的IP。他还警告,若少数AI模型攫取全部经济价值,将重演全球化第一阶段的产业空心化风险。行业Satya Nadella微软企业AI策略AI生态知识管理推荐理由:纳德拉的企业AI战略观原文
11:12elvis@omarsar0动态工作流可以将任务分发给不同的LLM或智能体。推文作者认为LLM Councils在此场景下能发挥很大作用。这种设计允许不同模型协作完成任务。行业动态工作流LLM Councils智能体推荐理由:聊聊用LLM议会做动态分发原文
11:12Guillermo Rauch@rauchgskills.sh 上的技能数量已超过 70 万。所有技能均由社区用户自发创建,无任何官方推广。这一数字在开放 AI 生态系统中持续增长。平台目前收录 70 万+ 实用 AI 技能,覆盖多种使用场景。AI产品skills.sh社区驱动AI技能推荐理由:社区共创70万AI技能原文
11:11elvis@omarsar0Omar Sanseviero分享了一个名为llm-council的开源技能,用于在Claude Code中组合多个LLM组成委员会进行深度研究。该技能默认使用Fireworks AI的API,但可轻松适配OpenRouter。项目托管在github.com/dair-ai/dair-ai仓库,目前支持Claude Code,但可能兼容其他智能体。作者表示可用此技能执行复杂的研究任务,并计划未来扩展到更多领域和动态工作流。技巧llm-councilFireworksClaude Code智能体研究任务推荐理由:分享了一个LLM委员会技能,能组合多个模型做研究原文
11:11Viking@vikingmute精选Viking分享了一个省钱的工作流,灵感来自shadcn的improve skills思路。先让GPT-5.5 High出包含Metadata、Scope和Steps的plan,不写一行代码。再用Composer 2.5和DeepSeek v4 pro分别实现,效果都不错。最后用review-forge审查提高代码质量,整体花费非常少。这个repo 4天获得3.7K stars。技巧GPT-5.5 HighComposer 2.5DeepSeek v4 proreview-forgeshadcn工作流省钱3 个信源在谈推荐理由:省钱开发新功能的实际方法原文
11:10Tw93@HiTw93Waza 是一套包含8项工程习惯技能(规划、审查、调试等)的工具,可在 Claude Code、Codex 等编码工具上运行。用户切换底层模型后仍能保持相同工作流程。Waza 帮助开发者延续熟悉的工程习惯,无需因模型变更而重新学习。该工具已在GitHub开源。技巧WazaClaude CodeCodex编程助手工作流推荐理由:用Waza在多个编码工具间切换模型原文
11:10shao__meng@shao__meng精选Codex Mobile 将手机作为远程开发机的控制中心,代码执行仍在桌面端完成。任务启动时可配置主机、工作区、Git 分支,并创建独立 worktree 隔离变更。Side Chat 提供与主线程关联的轻量对话,不打断主工作流。Plan 模式用于高风险任务,Goal 模式设定可验证终态,Mobile 端支持完整操作。Mobile 独有优势包括拍照/选图、语音录制 prompt,以及通过行内评论审查代码变更。技巧Codex MobileOpenAI编程助手远程开发代码审查9 个信源在谈推荐理由:手机远程编码实战技巧原文
11:08orange.ai@oran_ge精选橙线插画 skill 是一款将长文自动生成插图的工具,作者用它为一篇7.5万字的文章制作了20张插图。Agent 会为每个场景生成2套方案供选择,最终未对任何图片进行修改。该skill已开源,下载地址在github.com/orange2ai/oran…。技巧Orange AI橙线插画 skill智能体提示词工程推荐理由:能帮长文秒变漫画,省时省力原文
10:23shao__meng@shao__meng精选Databricks 基于自身实践(5000+ 工程师使用 coding Agent、对外交付 Genie 等产品)推出 Omnigent,这是一个 meta-harness,旨在解决多 Agent 组合、治理与协作的痛点。它提供三大能力:Composition(一行配置切换 Claude Code、Codex、Pi 等 harness)、Control(按 session 追踪 LLM 花费,每 $100 暂停并请求继续;支持 OS 沙箱和上下文安全策略)、Collaboration(通过 URL 共享 live session,支持终端、Web、macOS、移动端访问)。Omnigent 已在 Databricks 内部使用,并以 Apache 2.0 开源。AI产品OmnigentDatabricks智能体Agent编排1 个信源在谈推荐理由:多Agent管理新方案原文
10:22Gary Marcus@GaryMarcus精选一篇arXiv论文(2601.22436)发现,当前LLM智能体系统存储过去任务时包含原始步骤历史或总结规则。研究者通过将正确提示替换为随机垃圾文本来测试记忆使用情况:当步骤历史被破坏时,AI表现显著下降;但当总结规则被破坏时,AI性能无变化。这表明AI并未真正应用抽象规则,而是依赖复制精确历史动作。论文LLM智能体推理模型记忆机制抽象推理推荐理由:论文实锤AI只会照搬历史原文
10:20向阳乔木@vista8精选该工具输入任意App名称即可自动抓取AppStore用户评价,并通过DeepSeek进行四类信息挖掘:用户正面/负面评价、问题与版本更新的关联、产品机会识别、可视化图表输出。产品预计下周开源,可帮助产品经理快速从评论中提取 actionable 信息。技巧DeepSeekAppStore产品经理用户评论挖掘数据分析推荐理由:帮你用DeepSeek挖掘AppStore评论,找出产品机会原文
22:25Gary Marcus@GaryMarcusPeter Thiel 和 Balaji Srinivasan 资助的平台 Objection.ai 允许用户以2000美元起价投诉记者报道。平台由人类调查员审查后,提交给 OpenAI、Anthropic、Grok、Google 的 AI 模型组成的“陪审团”发布真实性裁决,并排名记者在真相讲述和更正方面的指标。记者若不回应辩护,裁决仍会在线发布。该系统将匿名来源视为不可信,排名靠后,而匿名来源是五角大楼文件等重大问责报道的关键。民权律师称其为“富人的高科技保护费”。行业Objection.aiPeter ThielAI陪审团媒体问责AI安全10 个信源在谈推荐理由:揭露AI被用来压制记者原文
22:25shao__meng@shao__meng76°Bloomberg 深度纪录片采访 Anthropic 联合创始人 Dario & Daniela Amodei 及 Claude Code 负责人 Boris Cherny,揭示公司从 OpenAI 出走后的发展历程。Anthropic 估值约 9650 亿美元,2026 年 Q1 年化增长约 80 倍,API 调用量同比 17 倍,首次盈利主要靠 Claude Code 等企业工具。Dario 维持 AI 可能在 1-5 年内消除约 50% 初级白领岗位的判断,并支持对华芯片出口管制。纪录片还披露了 Claude Mythos 发现数千个高危漏洞、与五角大楼冲突(拒绝无护栏使用后遭黑名单)等内幕。行业AnthropicClaudeDario AmodeiAI安全地缘政治10 个信源在谈推荐理由:Bloomberg 挖出 Anthropic 安全红线与五角大楼冲突原文
21:55idoubi@idoubiccShipAny TanStack 发布了 CCOnline,一款在线 vibe coding 工具,内置模型且开箱即用。其终端运行在 sandbox 环境中,实现零依赖启动。该工具旨在简化编程流程,无需本地配置即可直接使用。目前该推文获得 9 个点赞和 1572 次查看,引发社区讨论。AI产品ShipAny TanStackCCOnlinevibe coding编程助手推荐理由:在线编码,零依赖开箱即用原文
20:56Geek@geekbbillo-sketch是一个AI技能,可将文章或创意转化为印刷风格的社论插图。它内置十套画风,包括riso印刷、蓝图、黏土和像素等。用户可使用一只可重复使用的吉祥物来演绎创意点子。该项目托管在GitHub上,由tmchow开发。技巧illo-sketchGitHub印刷风格插图生成吉祥物推荐理由:十套画风加吉祥物,创意插图神器原文
17:39Geek@geekbbGitHub 项目 pulkitxm/claude-fable-5-demos 收录了 60 多个由 Claude Fable 5 生成的落地页和交互原型。每个项目附带原始 prompt 和运行录屏,可作为 LUI 设计灵感本和作品集。项目展示了 Fable 5 在 UI 生成方面的能力,适合设计师和开发者参考。AI产品ClaudeFable 5落地页交互原型LUI设计10 个信源在谈推荐理由:60 多个落地页原型,每个都带 prompt 和录屏原文
16:21Yangyi@YangyixxxxPonytail插件通过YAGNI原则和检查stdlib、平台原生功能、已有依赖等步骤,让AI coding agent避免过度工程。基准测试显示代码量减少80-94%,成本降低47-77%,速度提升3-6倍。支持Hermes、Claude Code、Codex、Cursor等Agent。技巧PonytailAI编程助手智能体提示词工程代码优化7 个信源在谈推荐理由:让AI agent少写80%代码原文
16:21宝玉@doteyPhoenix Yin指出,过去在GPT-3.5提示词中让其冒充GPT-4只能获得性能提升的错觉。Fable 5的真正实力来自Mythos-class底层权重、海量新训练数据和复杂agent架构,而非简单提示词复制。泄露prompt与老模型最多cosplay出味道像的lite版,性能差距巨大。Fable 5在长时程复杂分析、工具链、自验证等硬核任务上直接甩老模型几条街。AI模型GPT-3.5GPT-4Fable 5提示词工程推理模型10 个信源在谈推荐理由:别信提示词能偷实力,Fable 5靠的是真功夫原文
16:14Z.ai (智谱国际)@Zai_org精选智谱 AI 发布新旗舰模型 GLM-5.2,现已面向所有 GLM 编程计划用户(包括 Lite、Pro、Max 和 Team 计划)开放。该模型具备强大的编码能力,支持 100 万 token 上下文,并在长周期任务中表现持续强劲。API 和聊天机器人服务将于下周上线,模型也将于下周以 MIT 许可证正式开源。AI模型GLM-5.2智谱AI开源模型编程助手2 个信源在谈推荐理由:智谱开源新旗舰,百万上下文原文
16:09Viking@vikingmuteShadcn 的 /improve 思路主张用最强大的模型(如 GPT-6)深入理解代码库、发现问题并产出高质量计划,而将实际执行交给更便宜的模型完成。Skill 本身绝不直接修改代码,只负责产出计划,主 Skill 包括快速和全面等多种模式。该 repo 发布 4 天即获 3.7K stars,作者认为 skills 是目前最容易获得 stars 的方式。技巧shadcn/improve编程助手开源模型智能体1 个信源在谈推荐理由:Shadcn 教你用最强模型出计划原文
15:38Sebastian Raschka@rasbt精选Cohere 推出了一款新的轻量级 30B 开源模型,基于 Command A+ 的并行 Transformer 架构,层数几乎翻倍。该模型专为智能体编程任务优化,在 Terminal-Bench 和 SWE-Bench 等基准测试中表现优于 Gemma 4。在 Terminal-Bench 中,模型需使用终端、检查环境、运行命令并读取输出;在 SWE-Bench 中,模型需处理真实 GitHub 软件问题,理解仓库、定位文件、生成补丁并通过测试。在 SciCode 和 LiveCodeBench 等传统代码基准上,模型也具备竞争力,但整体性能略低于 Qwen3.6。AI模型CohereCommand A+30B智能体编程助手推荐理由:Cohere 新 30B 模型专攻智能体编程,比 Gemma 4 强原文
12:51宝玉@dotey宝玉在推文中指出,模型能力是根本,而Harness层(工具链)相对容易补齐,且不需要过多垂直领域定制。他透露Claude Design很快就会合并到Claude Desktop。对于Codex,他认为在下一代或几代模型能力足够后,Codex App会以Plugin方式集成Codex Design。他还回应了关于开源Open Design的提问,认为若其使用Claude Code的模型,可能达到类似工程能力。行业Claude DesignClaude DesktopCodexHarness模型能力1 个信源在谈推荐理由:宝玉聊模型和Harness的底层逻辑原文
12:51宝玉@dotey设计师dotey分享用AI Agent辅助设计后,修改字型字号颜色的新方式。首先,使用设计系统规范按钮圆角、字号、间距,避免3px、5px等随意值。其次,设计师通过文字指令指挥Agent修改,Opus 4.8+结合设计系统可做到“言出法随”。最后,设计师负责把控大方向和验收结果,Agent执行具体调整。技巧AI Agent设计系统Opus 4.8提示词工程5 个信源在谈推荐理由:设计师用Agent改设计的新思路原文
11:53Browser Use@browser_useBrowser Use 宣布其插件已可在 Claude Code 中使用。用户可通过命令 `claude plugin marketplace add browser-use/plugins` 安装。该插件旨在增强 Claude Code 的浏览器自动化能力。该消息在 X 平台发布,获得 11 个点赞和 575 次查看。AI产品Browser UseClaude Code插件浏览器自动化推荐理由:Claude Code 能控制浏览器了原文
11:52小互@imxiaohu该视频中,一位前OpenAI员工分享了他离开公司的原因,包括对AI安全方向的担忧以及公司内部文化的变化。他提到OpenAI从非营利转向商业化的过程中,优先考虑产品发布速度而非安全研究。视频还讨论了AGI发展路径上的分歧,以及他个人对AI风险的不同看法。行业OpenAIAI安全AGI商业化前员工10 个信源在谈推荐理由:前员工亲述离开OpenAI内幕原文
11:51小互@imxiaohu彭博社采访中,Anthropic CEO Dario Amodei 透露公司有一个未发布的模型 Mythos,存在上千个漏洞,能黑银行、撬国家机密。他预测 AI 一到五年内将砍掉一半入门级白领工作。他还首次说明离开 OpenAI 的原因是信任崩了而非安全分歧。Amodei 认为文明崩溃概率为 10% 到 25%,并呼吁政府对所有 AI 公司加强监管。行业AnthropicDario AmodeiMythosAI安全监管10 个信源在谈推荐理由:Anthropic 老板亲述 Mythos 模型有多危险原文
10:52Clement Delangue@ClementDelangueHugging Face CEO Clement Delangue 在推文中强调 AI 发展没有必然性,所有人都有选择权。他对比两条路径:封闭 API 导致权力集中,或开源 AI 让所有人参与。他引用 SemiAnalysis 的案例:里约热内卢市基于 Qwen 7/2 后训练了 Rio 3.5 Open 397B 模型,该模型采用 SwiReasoning 框架,动态切换标准链式推理和隐空间推理,通过熵置信信号提升 token 效率。行业Clement DelangueHugging Face开源模型QwenSwiReasoning推荐理由:开源 vs 封闭,里约市用 Qwen 做示范原文
10:08Geek@geekbb精选Pi Studio 是从 Tau 代码库分出的独立分支,专为 Pi 编码代理打造了一个 Codex 风格的图形客户端。它直接将 Pi 运行时打包进应用,安装后即可使用,省去了传统命令行工具的配置步骤。该工具旨在降低使用门槛,让开发者能快速上手 Pi 编码代理。AI产品Pi StudioTauPiCodex编程助手推荐理由:一键启动 Pi 代理,不用敲命令行原文
09:52Geek@geekbb精选一个名为 Archify 的开源项目展示了通过 LLM(如 pi 和 DeepSeek)将自然语言描述转换为结构化 JSON,再经 Node.js 渲染器用纯几何算法生成 SVG 并注入自包含 HTML 的流程。该方法无需依赖任何生图模型,仅利用 LLM 的指令遵循能力即可实现从文本到矢量图形的转换。项目代码托管在 GitHub 上,提供了一种轻量级的 AI 绘图新思路。技巧DeepSeekpiArchifySVG开源模型推荐理由:不用生图模型也能画图原文
08:53宝玉@dotey黄赟分享了一个与AI Agent交互的习惯:先让Agent写出coding plan,反复确认后汇总task列表,最后再编程并标记已完成。核心原则是交代任务时明确验证标准,之后无需关注中间过程。这种方法能提升Agent任务执行的效率和准确性。技巧Agent提示词工程编程助手推荐理由:Agent交互技巧,省心省力原文
08:53宝玉@doteyCodex 内建的前端修改功能比 Claude Design 更强,在模型能力相近时 Codex 胜出。当模型能力有差距时,用户宁愿手动操作。设计师认为 Claude Design 作为网页版极反常理,应与 coding agent 集成。该讨论基于 X 平台用户 @Xxi5olc 和 @dotey 的对话。AI产品CodexClaude Design前端修改编程助手1 个信源在谈推荐理由:Codex 前端修改比 Claude Design 强原文
08:52宝玉@dotey精选73°宝玉分享了一个用Claude Design更新视频字幕编辑器UI的案例:将标题文字从单行改为两行布局。他在Claude Design中修改设计稿后导出zip,用git diff查看变更,然后给Claude Code一句提示“参考设计稿design目录下的相关变更,对UI进行变更”,Claude自动分析diff并修改了Swift代码。整个过程主要在设计端操作,代码端自动同步。技巧Claude DesignClaude CodeUI设计编程助手工作流1 个信源在谈推荐理由:手把手教你用Claude Design改UI原文
08:08Simon Willison@simonwSimon Willison宣布了将Python扩展(C、C++、Rust等)编译为WebAssembly并通过PyPI分发的方法。Pyodide可以直接安装这些编译后的包,无需额外构建步骤。这利用了Pyodide的包管理机制,使纯WebAssembly的Python生态扩展成为可能。该流程依赖Pyodide的特定配置和构建工具,包括PyO3和maturin等。技巧PyodideWebAssemblyPyPIPython扩展推荐理由:教你如何让Python扩展跑在浏览器里原文
07:51Gary Marcus@GaryMarcusGary Marcus在X上发问,质疑Andrej Karpathy是否真的被Anthropic雇佣来负责“递归自我改进”(RSI)。Liron Shapira回应称,Anthropic一边推动RSI一边警告其带来灾难性风险,存在虚伪。Marcus指出,All-In播客成员可能不了解内部逻辑,但认为这种做法疯狂。该推文获得4条回复、2次转发和11个赞。行业AnthropicAndrej KarpathyGary MarcusAI安全递归自我改进10 个信源在谈推荐理由:Marcus质疑Anthropic的RSI矛盾原文
07:44MiniMax_AI@MiniMax_AIMiniMax的M3模型在NousResearch的Hermes Agent上运行。Hermes Agent是一个开源智能体框架,M3模型为其提供推理能力。该组合展示了M3在智能体任务中的表现。AI模型MiniMaxM3Hermes AgentNousResearch智能体推荐理由:看看M3模型在智能体上的表现原文
07:01rohanpaul_ai@rohanpaul_aiVinod Khosla在SparX播客中警告,传统IT服务和BPO业务在AI时代将消失。他建议印度转向部署AI以保持竞争力。该言论引发对印度IT外包行业未来就业的讨论。行业Vinod Khosla印度BPOIT服务AI部署推荐理由:Khosla说印度BPO要没了原文
06:09rohanpaul_ai@rohanpaul_ai83°据路透社报道,亚马逊CEO Andy Jassy本周向特朗普政府高级官员表达了对Anthropic最新模型Fable 5的安全担忧。亚马逊研究人员通过一系列提示词成功诱导Fable 5泄露了本不应分享的、可辅助网络攻击的信息。这一事件发生在美国政府即将对AI模型安全进行更严格监管之前。行业AnthropicFable 5亚马逊AI安全监管10 个信源在谈推荐理由:亚马逊CEO亲自警告Anthropic新模型安全漏洞原文
06:09rohanpaul_ai@rohanpaul_ai精选一项新研究提出了HLL基准测试,要求AI智能体完成10种CAPTCHA任务,包括识别页面元素、正确点击或拖动、跟踪状态变化并提交答案。测试发现,即使强大的智能体在静态任务中表现良好,但在页面杂乱、任务复杂或系统验证操作有效性时仍会失败。该基准旨在评估智能体在真实人机验证场景中的能力,结果显示当前AI智能体难以通过此类验证。论文HLLCAPTCHA智能体基准测试AI安全推荐理由:看看AI怎么被CAPTCHA难倒的原文