11:27Tw93@HiTw93中国开发者因不满 Electron 应用占用大量内存,4 年前开发了 Pake 工具。最新两个版本新增 --safe-domain 以支持企业 SSO(OAuth 登录),认证流程不再跳出到系统浏览器。同时提供了原生 Arch Linux .zst 包,并在 GitHub Action 中加入 --min-width、--min-height、--app-version 参数。修复了 macOS 认证弹窗崩溃、Linux 标题栏和 Wayland 输入问题。Pake 依然保持一条命令、任意网页、体积小于 10 MB 的特点。AI产品PakeElectronSSO开源工具桌面应用3 个信源在谈推荐理由:这位开发者因为自己烦 Electron 吃内存,就做了 Pake 小工具,现在更新后企业也能用 SSO 了,还修了 Mac 和 Linux 的毛病,依然不到 10MB,挺实用。原文
11:23idoubi@idoubicccodefree.cafe推出AI编程小桌课,周六广州南沙开课,限5人,用Claude Code和Codex从想法到项目上线,6小时结对编程。收费¥4096,含ShipAny会员(¥1999)、1024社群会员(¥1024)和MCP书籍(¥49),同行者半价。赠送权益价值¥3072,已有权益者同行仅¥512。技巧Claude CodeCodexShipAny编程助手Vibe Coding推荐理由:想用Claude Code和Codex做项目但卡配置?这个六小时小桌课帮你从想法到上线,还送ShipAny会员和MCP书。原文
10:25shao__meng@shao__mengAddy Osmani发布深度文章,以Chromium为主线解析现代浏览器内部机制。文章覆盖页面加载完整管线、V8 JavaScript引擎内部原理、模块加载与Import Maps、多进程架构与安全。对比三大引擎:Chromium、Gecko (Firefox)与WebKit (Safari)。面向开发者给出优化实践:减少网络往返、避免深度DOM、使用transform/opacity实现合成动画等。技巧ChromiumV8WebKit浏览器架构性能优化推荐理由:Addy Osmani写的浏览器底层指南,覆盖V8、多进程、三大引擎对比,还有实用的DevTools优化技巧,搞前端必读。原文
08:45shao__meng@shao__meng精选73°前Meta/Microsoft/Atlassian主任工程师Kun Chen分享了一套完整的Agentic工程工作流,每天可ship 40-50个经测试的生产级PR。核心框架分为四层:造船(终端中心主义,使用WezTerm+tmux+Neovim)、训练船员(Memory+Skills,全局memory仅27行以避免token浪费)、与单个船员协作(语音输入OpenSuperWhisper,自创AXI标准比MCP节省3倍token和2倍延迟)、并行指挥(treehouse管理worktree,First Mate大副编排器)。验证环节采用no-mistakes流水线,在隔离worktree中执行对抗式review和E2E测试,大幅减少人工review耗时。该工作流强调将时间花在任务开头和结尾,中间全交给AI,瓶颈从agent执行力转移到战略思考。技巧Kun ChenAgentic工程工作流编程助手提示词工程推荐理由:想每天轻松发几十个PR?前Meta主任工程师把整套工作流拆开了讲,从终端配置到agent训练到并行管理,全是实战细节,比泛泛而谈的教程强多了。原文
07:24elvis@omarsar0开发者 Omar 分享经验:他几乎不再手动提示或与代理对话,而是通过循环(loops)让代理自主执行。他花更多时间编写验证器(verifiers),提供文本、音频、图片等丰富指令来填补代理的不足。Guinness Chen 建议用户按住听写键随意讲10分钟,将碎片、例外、示例、氛围都喂给模型,利用语言模型擅长从语言中重构潜在意图的能力。这些方法改变了人与代理的交互方式,减少了手工编辑提示的负担。技巧agentsloopsverifiers智能体工作流提示词工程推荐理由:别手写提示词了,试试按住录音键讲十分钟,让代理自己干活。Omar 分享了用循环和验证器省力的实战技巧。原文
07:23Browser Use@browser_useBrowser Harness 云版(beta)正式上线,基于 Browsercode、AWS AgentCore 和自定义控制平面构建。用户可在 UI 中直接试用,或评论 API V4 获取早期 API 访问权限。团队邀请用户尝试并报告问题,以便修复。AI产品browser_useBrowser HarnessAWSAgentCore云服务推荐理由:browser_use 发布了云端版 Browser Harness,基于 AWS 架构,现在就能试,快去搞崩它提反馈。原文
06:54@koltregaskes@koltregaskes据传闻,GPT-5.6将在前端开发方面有显著提升,类似于Claude Design的Codex设计工具。5.6和5.6 Pro版本可能在下周四发布。同时,用户也在期待Sonnet 5和Gemini 3.5 Pro的更新。AI模型GPT-5.6Sonnet 5Gemini 3.5 Pro前端开发编程助手推荐理由:GPT-5.6据说前端开发更强了,还有5.6 Pro,下周四可能发布。原文
04:23Guillermo Rauch@rauchgVercel CEO Guillermo Rauch 发帖称编程代理(coding agents)会充分利用用户的宜家效应。该帖子已获得 48 次点赞、2028 次查看和 9 次书签。Rauch 没有具体说明工具或模型,但暗示用户容易高估自己参与编写的代码。这一观点引发开发者对 AI 辅助编码心理影响的讨论。行业rauchgVercel编程助手宜家效应开发者工具推荐理由:看看 Vercel 老板 Rauch 怎么吐槽编程代理让你沉迷自己写的烂代码,有数据有观点。原文
03:49@koltregaskes@koltregaskesX用户koltregaskes分享的截图显示,ChatGPT在一段对话中回复需要更多时间进行检查,暗示GPT-5.6可能引入更严格的安全机制。目前OpenAI官方未对此消息确认。GPT-5.6是传闻中的下一代模型,但具体发布时间与功能细节仍未公布。AI模型GPT-5.6OpenAIAI安全10 个信源在谈推荐理由:OpenAI可能推出的GPT-5.6会增加安全检查,想提前了解变化可以看看这个讨论。原文
03:49@koltregaskes@koltregaskesAnthropic正在准备更新Claude Mythos模型,版本可能从当前跳至5.1。升级到版本6的可能性较低,除非Sonnet和Opus也同步升级。目前尚不确定是否公开发布。AI模型AnthropicClaude Mythos5.1模型更新版本升级10 个信源在谈推荐理由:Anthropic又在迭代模型了,这次可能是Mythos 5.1,跟Sonnet和Opus版本联动,不知道会不会公开。原文
03:48Greg Brockman@gdb用户 Tom Osman 利用 Codex 的 "/goal" 循环功能,将提示词设为“遍历应用中每个功能,根据代码创建用户故事和期望行为,维护单一电子表格追踪状态”,随后自动切换到测试每个用户故事并记录所有错误,最终修复逻辑或 UX 错误后再次测试。整个过程无需人工干预,自动处理成百上千的用户故事。该案例展示了 Codex 在自动化测试与修复工作流中的实际应用。技巧Codex编程助手自动化测试工作流推荐理由:试试在 Codex 里贴一段类似的循环指令,它就能自动帮你测完整个 App 的每个功能,连修 bug 都包了。原文
03:36Jerry Liu@jerryjliu0精选74°LiteParse v2.1 发布,可将PDF转换为Markdown,速度比Screen Studio放大动作还快。它在olmOCR0-bench、opendataloader-bench、ParseBench三个基准测试上准确率超过pymupdf4llm、opendataloader等工具。完全开源(Apache 2.0),支持CLI、Rust、Node、Python、WASM。可从LlamaIndex官网或GitHub获取。AI产品LiteParseLlamaIndexPDF解析开源Markdown2 个信源在谈推荐理由:LiteParse v2.1又快又准,开源免费,解析PDF转Markdown比同类强,值得一试。原文
03:23HeyGen@HeyGen_OfficialPeter Yang 与 HyperFrames 开发者 @liu8in 和 @JakeFromHeyGen 深入拆解了 HyperFrames 的工作机制。该工具提供 5 步法:收集资产并创建 frame.md、编写 storyboard.md、从 HyperFrames 库拉取动画、生成静态帧审查、在 Studio 中合成视频。内置 /website-to-video 技能可将任意 URL 一键转成视频。HyperFrames 完全免费,支持在 Codex 和 Claude Code 中使用。技巧HyperFramesCodexClaude CodeHeyGen视频生成推荐理由:HyperFrames 免费开源,用 5 步模板就能把产品视频从 $30K 成本降到零,连网址都能直接变视频,适合不会剪片的团队。原文
02:54Harrison Chase@hwchase17Deep Agents 被描述为模型无关(model agnostic)且通用(general purpose)的 agent 工具。它被提出作为 Codex 和 Claude Code 的替代品。该工具不绑定特定模型后端,支持灵活切换。根据 x 上的讨论,Deep Agents 可能提供类似代码生成和 agent 执行能力。AI产品Deep AgentsCodexClaude Code智能体模型无关推荐理由:如果你在用 Codex 或 Claude Code,可以试试 Deep Agents,它是模型无关的,兼容更多模型,更灵活。原文
02:23elvis@omarsar0论文提出Human-on-the-Bridge方法,将人类判断前置到可复用的评估资产中,用于生产环境下的AI Agent评估。Agent作为行为系统需要跨轮推理、调用工具、保持上下文和遵循策略,现有方法如静态Benchmarks、LLM-as-judge、红队测试各有局限。该方法由专家在测试前策划可复用的评估智能,而非在循环中逐条审查输出。论文编号2606.16871,展示了提升可扩展性的具体路径。论文智能体评估Human-on-the-Bridge可扩展评估推荐理由:跑Agent生产评估的看过来,这篇把人类专家放在上游,评估资产能复用,不用每次输出都人工审,效率高多了。原文
02:21Greg Brockman@gdb精选Tom Osman展示了一个在Codex中运行的自动化循环,用于遍历应用所有功能并生成用户故事与预期行为。该流程维护一个单源电子表格跟踪功能状态,然后切换到测试每个用户故事并记录所有错误。最后修复逻辑或UX错误后,再次测试所有用户行为。这个循环能处理数百个用户故事,展示了Codex的自动化测试能力。技巧CodexTom Osman自动化测试工作流智能体推荐理由:Tom Osman用Codex搞了个自动化循环,从生成用户故事到测试修复一条龙,省人工还管几百个功能,太实用了。原文
00:42@koltregaskes@koltregaskes78°X用户koltregaskes发现字符串"claude-sonnet-5"出现在某个位置,暗示Anthropic可能即将发布新模型。Claude Sonnet系列是Anthropic的中端模型,上一代为Claude Sonnet 4(2024年发布)。本次发现意味着Sonnet 5可能已在内部测试或即将进入公开阶段。目前Anthropic尚未官方确认该模型的存在或发布时间线。AI模型Claude Sonnet 5Anthropic模型更新10 个信源在谈推荐理由:有用户在X上扒到了Claude Sonnet 5的名字,说明Anthropic可能马上要出新模型了,关注Claude的朋友可以看看这个线索。原文
00:24向阳乔木@vista8DeepSeek Harness组作为新部门,正在大规模招聘三种职位:Harness研究员(实习/全职)、Harness工程师(实习/全职)、Harness产品经理(限全职)。招聘流程与其他部门一致,包含一轮笔试和三轮面试,终面由Tianyi Cui负责。职位空缺较大,简历可直接私信发送。行业DeepSeekHarness组Tianyi Cui招聘推荐理由:DeepSeek Harness组在招研究员、工程师和产品经理,门槛不低但机会难得,想加入国产大模型核心团队的朋友可以试试看。原文
23:57宝玉@dotey推文作者认为 Gemini 3.1 Pro 的翻译质量最佳,Opus-4.8 因写作能力不足导致翻译生硬。回复中分享了使用 Claude Code 并设置 /effort 为 ultracode 后的多智能体翻译流程:先让 3 位风格各异的译者各出一稿,再由双语编辑对照原文评审,综合定稿后逐句校对。作者强调这个过程实际触发了 Claude Code 的 dynamic workflow 并自动写提示词执行。用户提供的经验来自对翻译工作流的长期探索。技巧Gemini 3.1 ProOpus-4.8Claude Code翻译工作流提示词工程1 个信源在谈推荐理由:别再用 Opus-4.8 硬翻了,试试 Claude Code 的 ultracode 模式+多智能体流水线,实测翻译质量能提升不少。原文
23:55Lenny Rachitsky@lennysanAnthropic的Fiona Fung在访谈中透露,她领导的Claude Code团队通过AI实现了8倍代码输出。她曾在微软参与Visual Studio和TypeScript开发,在Meta创建了Facebook Marketplace(年GMV超1000亿美元)。她还负责Meta的VR/AR眼镜和Instagram基础设施。她认为AI将改变工程师的上下文切换和孤独问题,并讨论了AI未来对产品团队角色的影响。行业Claude CodeAnthropicFiona Fung编程助手10 个信源在谈推荐理由:Anthropic的Claude Code负责人亲自聊团队用AI写了8倍代码,还有25年工程经验里的独特视角,值得一听。原文
23:28shao__meng@shao__mengGreg Eisenberg和Theo Tabah在60分钟对谈中提出AI Native组织的三层架构:人、Agent和上下文。人退守两端负责战略与评审,Agent需满足Clear Goal、Skills、Tools、Context四要素才能自治。上下文层通过Capture-Curate-Store-Execute-Experience五阶段循环构建护城河。两个Live Demo展示成效:提案微站系统为LCA带来数百万美元收入,10分钟产品闭环生成高保真原型。Skill Chain(技能链)串接多个技能形成剧本,是对抗幻觉的关键机制。技巧AI Native智能体Skill Chain工作流上下文推荐理由:Greg和Theo用真实案例拆解了AI Native组织的落地方法,三层系统比“用ChatGPT”具体得多,还有百万美元收入证明。原文
23:28Harrison Chase@hwchase17社区文章演示了如何借助Deep Agents框架构建一个类似Claude Code的编程智能体。文章特别提到GLM-5.2模型表现强劲,可作为该智能体的底层推理引擎。通过3个步骤即可完成部署,无需从头开发复杂Agent系统。技巧Deep AgentsClaude CodeGLM-5.2智能体开源模型推荐理由:教你用Deep Agents自己搭一个Claude Code同款智能体,还顺带体验GLM-5.2的威力,实操性很强。原文
23:25berryxia@berryxiaxAI 为 SuperGrok 用户新增了 work folder 功能。用户可以在 SuperGrok 界面中直接创建和访问工作文件夹。该功能有助于用户更高效地组织和管理项目文件。SuperGrok 是 xAI 推出的产品,支持 Grok 模型。AI产品xAISuperGrokwork folderGrok文件管理推荐理由:xAI 给 SuperGrok 加了 work folder,管理项目文件更方便,用 Grok 的用户可以试试。原文
23:24berryxia@berryxia一位开发者花一小时整理了散落在各处的实践经验,形成了完整的Agentic Engineering Workflow。该工作流涵盖任务拆解、工具调用、记忆管理、错误恢复等环节,每一步都在真实项目中跑通。相比多数AI开发者还在手动写prompt,这套工作流已能教机器自主写prompt,强调差距在于工程方法而非模型能力。技巧Agentic Engineering Workflow智能体工作流AI编程推荐理由:一位开发者把让AI像工程师一样自己写代码的工作流整理出来了,覆盖从拆任务到恢复错误的全流程,不是理论是真实跑通的路径。原文
23:00shao__meng@shao__meng精选72°OpenAI Codex 推出 Record & Replay 功能,允许用户通过录制一次操作来创建可复用的 AI Skill。录制阶段会捕获用户演示的步骤、隐性偏好和变量,Codex 自动分析并生成包含使用条件、输入参数、操作步骤和验证规则的 Skill。回放时,Codex 可根据当前环境工具(如 Computer Use、浏览器插件)适应性地执行,支持不同参数输入。功能遵循“演示即规格”设计哲学,并给出五条高质量录制原则,如短而完整、提前声明变量、及时停止等。相比传统 Plugin,Record & Replay 更适合个人快速技能化,成本低。技巧OpenAI CodexRecord & ReplayAI Skill工作流自动化编程助手10 个信源在谈推荐理由:OpenAI 给 Codex 加了录技能功能,演示一次就能固化工作流,下次回放还能自适应,适合重复性任务。原文
22:27shao__meng@shao__mengDeepSeek 新成立的 Harness 组由 Tianyi Cui 带队,目标远大、工作繁重,目前仍非常缺人。招聘共三种职位:Harness 研究员(实习/全职)、Harness 工程师(实习/全职)、Harness 产品经理(限全职)。招聘流程为一轮笔试加三轮面试,终面由 Tianyi Cui 负责。该组专注于 Agent Harness 研究和工程,职位空缺较大但门槛与 DS 其他组一致。行业DeepSeekHarness招聘Agent工程推荐理由:DeepSeek Harness 组在招人,研究员、工程师、产品经理都要,做 Agent Harness 的可以直接投简历。门槛不低但机会大。原文
22:25Viking@vikingmute这是一个名为vikingmute/rev的GitHub项目,使用AI进行代码审查,目前已获得超过100个star。作者还写了一篇说明文章《我是怎样使用AI来做Code Review的?》,详细介绍了使用方法。项目以AI辅助提升代码审查效率为核心,适合开发者和团队参考。技巧vikingmuteGitHub代码审查AI编程助手Code Review推荐理由:这个项目用AI帮你做Code Review,实测挺好用,GitHub上已经100多星了,文章也写得清楚,可以试试。原文
22:24Viking@vikingmute用户反馈OpenAI Codex中GPT-5.5模型token消耗速度突然增加10-20倍。Plus用户原本5小时额度仅用2-3个prompt就耗尽,Pro账户也比原来快很多。该问题在X平台引发大量点赞和讨论,目前尚未有官方回应。AI产品CodexGPT-5.5OpenAI编程助手token消耗10 个信源在谈推荐理由:Codex的GPT-5.5最近token消耗飞快,Plus额度几下就用完,Pro用户也受影响,快看看你的账户。原文
22:03Clement Delangue@ClementDelangueHugging Face CEO Clement Delangue分析指出,2016-2024年美国在开源AI领域领先,2024-2027年将在通用AI领域领先并受益。2024-2026年中国在开源AI方面领先,2026-2030年未知。他认为开源AI是通用AI的基础,能加速国家技术生态进步,OpenAI/Google从开放科学和开源AI起步,主导了AI领域。Meta由于改变策略,失去了类似机遇。行业开源AI通用AIHugging FaceOpenAIGoogle10 个信源在谈推荐理由:Hugging Face老大用历史时间线论证为什么开源先于通用AI,中国和美国在这波AI竞赛里的角色有了新视角。原文
21:33berryxia@berryxia一位开发者利用几个周末时间,借助AI辅助编程(vibe code)完成了一款iOS App。该App玩法与Pokemon Go完全相同——打开摄像头拍摄真实流浪猫,AI会将照片转成90年代复古卡通插画并收入图鉴。全球约有6亿只流浪猫,App让用户不再错过任何一只。作者称无融资、无团队、无市场预算,纯个人项目。AI产品AI辅助编程vibe codePokemon Go流浪猫AR推荐理由:一个人花几个周末用AI编程就做出了抓真实猫的Pokemon Go,全球6亿流浪猫等你收集,想法超有爱。原文
18:24Anton Osika@antonosikaLovable创始人Anton Osika在X上发文,分享过去一周与欧洲研究者、创业者交流的感悟。他指出许多人认为要建严肃AI公司就得去旧金山,但Lovable选择扎根欧洲且从未后悔。平台已有数百万用户将想法转化为产品,其中大量是欧洲人。他认为欧洲不缺人才,缺的是“可以从这里建”的信念和匹配的区域基础设施。行业Lovable欧洲AI创业人才基础设施推荐理由:Lovable创始人亲述为什么选择欧洲做AI,还提到数百万用户和欧洲工程师回流,值得一看。原文
17:54shao__meng@shao__meng社交媒体上发起LLM对比投票,比较GLM-5.2和Gemini 3.5 Flash。投票结果倾向GLM-5.2,用户认为Gemini 3.5 Flash表现不佳。评论指出Google DeepMind自Gemini 3.0多模态发布后缺乏亮眼进展。讨论焦点集中在国产模型与Google模型的性能差距。AI模型GLM-5.2Gemini 3.5 FlashGoogle DeepMind模型对比推理模型推荐理由:看看大家投票选GLM-5.2还是Gemini 3.5 Flash,很多人觉得Gemini近期的模型不太能打。原文
17:39Geek@geekbbClaudian是Obsidian社区插件,可嵌入Claude Code、Codex、Opencode、Pi等AI编码代理。它把笔记知识库直接变成代理的工作目录。该插件在GitHub上已获13K Star,成为Obsidian接入大模型的热门扩展。AI产品ClaudianObsidianClaude CodeCodex编程助手推荐理由:想用Claude Code这些AI代理做笔记?Claudian能直接嵌到Obsidian里,把知识库当工作目录,GitHub 13K星。原文
15:25@koltregaskes@koltregaskesGLM-5.2 在 DeepSWE 编程基准上取得 44% 的得分,超过 Kimi-K2.7 Code,成为目前最强的开源模型。不过它的运行成本更高,且每次输出更多 tokens。与封闭模型相比,Claude Fable 5 以 70% 的得分领先,差距明显。AI模型GLM-5.2Kimi-K2.7DeepSWE开源模型代码生成推荐理由:智谱的 GLM-5.2 代码上刚赢了 Kimi 的 K2.7,但更贵输出也更多,离顶级闭源还有距离。原文
15:24Geek@geekbbGitHub 项目 EdgeFlowingLight 为 Claude Code、Hermes Agent 等 AI 编程工具添加屏幕边缘流光效果,通过颜色和动画区分“思考中”与“已完成”。项目基于 Rust 编写,仅 200 多行代码,支持自定义颜色和速度。用户无需轮询终端即可一眼感知状态,提升编程效率。技巧Claude CodeHermes Agent编程助手开源工具状态提示1 个信源在谈推荐理由:一个开源小工具,让你斜眼就知道 Claude Code 是否还在跑,不用切窗口看命令行。原文
15:19berryxia@berryxia钟二信开源了Cowart插件,将Codex与无限画布工具结合,用户可直接在画布上用自然语言标注和修改图片。该插件支持GPT Image 2,操作方式类似设计软件:选中区域、给出修改意见、实时反馈迭代,替代传统多次prompt的流程。项目已开源,可免费使用。AI产品CodexCowartGPT Image 2图片编辑自然语言交互推荐理由:给用Codex和GPT Image 2画图的兄弟安利这个插件,画布上直接点选区域说修改,比来回敲prompt爽多了,还带历史痕迹。原文
15:18AI Will@FinanceYF5精选Anthropic在2月完成新模型Mythos的训练。Mythos悄然改变了整个研发节奏。过去5个月AI能力跃升部分源于Mythos。领先模型正帮助训练下一代模型,该循环已启动。AI模型MythosAnthropic推理模型模型迭代8 个信源在谈推荐理由:Anthropic悄悄练成了Mythos,据说它直接改变了研发节奏,领先模型开始帮训练下一代模型了。原文
15:15AI Will@FinanceYF5一位用户分享了他评价Fable模型的方法:不看benchmark数字,只关注模型的思维形状。Fable在理解用户意图和迭代思考方面表现突出,让他感到对面有真人。他比喻这种感受就像回到了2023年。技巧Fable推理模型模型评估推荐理由:有人分享了一个评价模型的新角度:别看数字,看它能不能让你感觉像在跟真人聊天。Fable就做到了。原文
15:13Guillermo Rauch@rauchgGLM-5.2 是 zai_org 发布的新模型,在编码任务上表现极佳。网友 rauchg 在 X 上表示“几乎震惊”,认为这改变了局面。该推文获得 127 赞和 25 次分享。GLM-5.2 的编码能力被认为堪比顶级模型。AI模型GLM-5.2zai_org编程助手编码推荐理由:zai_org 的 GLM-5.2 在编码上强到让人震惊,跟之前版本比进步很大,值得试试。原文
15:11@koltregaskes@koltregaskes据 X 平台用户 koltregaskes 发帖,OpenAI 可能正在测试 GPT-5.6,以便在下周推出。OpenAI 员工 Derya 对此表现兴奋。目前尚未有官方确认,属于市场猜测。行业GPT-5.6OpenAIDerya模型发布传闻10 个信源在谈推荐理由:有人在猜 GPT-5.6 下周就来,OpenAI 内部人也在嗨,看看是不是真的。原文