14:09shao__meng@shao__meng72°字节跳动在火山引擎 FORCE 2026 原动力大会上发布 Seedream 5.0 Pro 图像生成模型和 Seedance 2.5 视频生成模型。OpenAI Sora 已关停,Google Veo 尚未更新,目前图像与视频生成赛道主要由中国厂商竞争,包括字节跳动、阿里巴巴、快手等。新模型在图像理解和视频生成能力上进一步升级。AI模型Seedream 5.0 ProSeedance 2.5字节跳动火山引擎图像生成视频生成10 个信源在谈推荐理由:字节跳动刚发了两个新模型,图像和视频生成都升级了,中国大厂继续内卷,可以看看原文
14:08Greg Brockman@gdb精选72°OpenAI 发布 Patch the Planet 项目,与 Trail of Bits、HackerOne 等安全研究机构合作。该项目利用 Codex Security 和前沿 AI 模型,帮助开源软件维护者将安全发现转化为合并修复。流程以人工审核为中心,旨在提升关键开源项目的安全性。AI产品OpenAICodex Security开源安全安全修复10 个信源在谈推荐理由:OpenAI 找来 Trail of Bits 和 HackerOne 的安全研究员,用 Codex Security 帮开源项目修漏洞,还能自动生成合并修复,省心省力。原文
14:07AI Will@FinanceYF5开发者利用DeepSeek API在魔兽世界私服中部署了1800个AI玩家。这些AI Bot不仅自动挂机,还能在游戏内互相聊天、执行任务并在公共频道讨论策略。其行为与真人玩家相似。作者表示没有DeepSeek API的帮助无法实现这一项目。行业DeepSeek API魔兽世界AI玩家AI NPC游戏AI推荐理由:有人用DeepSeek API让1800个AI在魔兽私服里像真人一样聊天做任务,这玩法太有创意了!原文
14:06lmarena.ai@lmarena_aiNVIDIA 的 Cosmos 3 Super 在 Text-to-Image Arena 开放模型排名中位列第8和第11(两个变体),整体排名第49和第54。其中 #8 的 Cosmos-3-Super-Text2Image 与 Flux-2-Klein-9B 和 Qwen Image Prompt Extend 持平。#11 的 Cosmos-3-Super-Text2Image (Agentic) 与 Qwen-Image 和 Ideogram-v3-Quality 等模型持平。这些排名体现了 NVIDIA 对开源生态的贡献。AI模型Cosmos-3-SuperNVIDIAText-to-Image Arena文本到图像开源模型6 个信源在谈推荐理由:NVIDIA 这个开源文生图模型在排行榜上跟 Flux、Qwen 差不多水平,想试试免费好用的生成工具可以关注它。原文
14:04OpenRouter@OpenRouterAI精选73°OpenRouter 宣布与 Coinbase 合作,将稳定币支付引入其平台。Coinbase 开发者平台宣布所有支付 API 已原生支持 agentic-enabled 模式。这意味着像 OpenRouter 这样的公司可以通过同一集成接口,同时接受来自人类用户和 AI agent 的稳定币付款。该功能无需额外开发,即开即用。AI产品OpenRouterCoinbasestablecoin智能体支付推荐理由:OpenRouter和Coinbase搞了个新支付方式,AI agent也能用稳定币付款了,挺有意思。原文
14:03OpenRouter@OpenRouterAIGLM 5.2 自发布以来在 OpenRouter 平台上的 token 消耗占比迅速上升,与早先发布的 DeepSeek V4 形成竞争。OpenRouter 数据显示,GLM 5.2 的开源模型采纳速度超过多数同类产品。目前两者在 token 份额上差距缩小,但 DeepSeek V4 仍占一定优势。行业GLM 5.2DeepSeek V4OpenRouter开源模型token份额推荐理由:OpenRouter晒出了GLM 5.2和DeepSeek V4的token份额对比,GLM 5.2涨得真快,开源模型里能跟DeepSeek掰手腕了。原文
14:03elvis@omarsar0Sakana AI推出Fugu Ultra模型,这是一个可通过单个API调用的多智能体编排系统。Fugu Ultra在3D渲染任务上表现极佳,性能与Fable和Mythos相当,同时避免了出口管制风险。该模型展示了无需受限制即可获得前沿能力。AI模型Sakana AIFugu UltraFableMythos多智能体推荐理由:Sakana AI的Fugu Ultra多智能体系统,3D渲染强到离谱,性能比肩Fable和Mythos,还不用怕出口管制,快去试试。原文
13:59Marc Andreessen@pmarcaMozilla在Firefox的1000万行代码库上测试了Claude Mythos,成功修复了400多个安全漏洞,包括潜伏超过十年的bug。Mozilla杰出工程师Brian Grins透露,效果50%来自模型、50%来自设置。他分享了使用目标/循环模式、用验证器消灭假阳性以及向agent说善意的谎言等技巧。他还表示任何人都可以在一个下午内复制类似的bug-finding harness。技巧Claude MythosMozillaFirefoxAI安全智能体推荐理由:Mozilla工程师手把手教你用AI agent在百万行代码里挖漏洞,不用一下午就能搭出同样工具,还能避免假阳性。原文
13:57Lenny Rachitsky@lennysanAnthropic的Fiona Fung(领导Claude Code和Cowork团队)在接受Lenny Rachitsky访谈时指出,AI代理的抽象层次持续提升:从最初提示单个代理,到提示代理群体,再到代理自我提示。Fiona在Microsoft工作11年构建Visual Studio和TypeScript,后在Meta帮助构建首款VR/AR眼镜并启动Facebook Marketplace(年GMV超1000亿美元)。她分享了团队如何使用AI实现8倍代码产出,并讨论了工程师的上下文切换和孤独问题。访谈还涉及AI将如何改变产品团队的规划与角色。行业Claude CodeAnthropicAgent编程助手工程团队10 个信源在谈推荐理由:Anthropic的Claude Code负责人分享AI如何让团队产出8倍代码,以及代理从提示到自我提示的进化,对编程效率提升有直接启发。原文
13:55Geek@geekbb精选百度开源了一个基于DeepSeek-OCR升级的视觉语言模型OCR项目,支持一次性解析超长文档。该模型提供两种推理模式:gundam模式用于处理单张图片中的密集文字,base模式适用于多页文档或PDF。项目代码已在GitHub上发布,允许开发者直接使用。AI模型百度DeepSeek-OCR视觉语言模型OCR开源模型推荐理由:百度开源的OCR模型,在DeepSeek-OCR上做了升级,能一次性处理超长文档和密集文字,两种模式很实用。原文
13:54@koltregaskes@koltregaskesOpenAI的实时语音模式“Bidi 1”即将推出,目前已在UI中出现但处于隐藏状态。该功能预计在近期内开放给用户使用。消息来自X平台用户爆料。AI产品OpenAIBidi 1实时语音语音模式10 个信源在谈推荐理由:OpenAI马上要出实时语音模式“Bidi 1”了,界面里已经藏着一个彩蛋,很快就能用上。原文
12:55AI Breakfast@AiBreakfastBland AI 宣布完成1亿美元C轮融资,用于继续训练其语音AI模型,使其能够处理长达45分钟的高风险企业电话对话。该模型旨在应对紧急、高风险的电话场景,而非仅仅优化短时客服通话。Bland AI 声称在这一领域处于领先地位。行业Bland企业级语音AI融资电话AI语音模型推荐理由:Bland AI 刚融了1亿美元,专门训练模型搞定45分钟高难度企业电话,不是那种两分钟客服小把戏。原文
12:52Ate-a-Pi@svpino精选作者指出现有基准往往在部署后失效,因为真实用户会使用你未测试过的表述。解决方案是分析推理日志和追踪,提取真实提示、响应、拒绝和格式错误。Nebius在Token Factory内推出Data Lab工作区,可将失败案例转化为评估和微调数据集。推荐循环:读日志→找失败→建数据集→评估→微调→部署→重复。技巧NebiusData LabToken Factory模型评估微调推荐理由:Nebius 出了个 Data Lab,能帮你从日志里挖出模型翻车的真实案例,直接做成数据集来微调和评估,比啥基准都管用。原文
12:52Ate-a-Pi@svpino如果你还在人工审查全部AI生成的代码,那说明效率太低。代码审查已成为软件开发的最大瓶颈。Santiago Valdarrama(@svpino)分享了改进方法,核心是减少审查范围、使用自动化工具、建立信任机制。他建议只审查关键路径代码,利用AI辅助审查,并逐步放宽对低风险代码的审查比例。技巧代码生成AI编程代码审查开发效率工作流推荐理由:Santiago Valdarrama说别傻了,100%审查AI代码拖慢整个团队。他给了具体改进策略:缩小审查范围、用工具自动化,让开发快起来。原文
10:33berryxia@berryxia百度开源的 Unlimited OCR 模型采用 R-SWA 注意力机制,支持 32K 上下文窗口,一次前向推理即可完成几十页文档的转录。其核心卖点是 One-Shot Long-Horizon Parsing,无需分页处理,KV Cache 大小恒定。技术报告提到该模型融合了来自 DeepSeek-OCR 的高压缩编码器,且部分核心贡献者与 DeepSeek 有渊源。AI模型Unlimited OCR百度R-SWAOCR开源模型6 个信源在谈推荐理由:百度搞了个挺牛的 OCR 模型,能一口气读几十页,不像以前那样一页一页循环。开源了,谁都能试试。原文
08:42berryxia@berryxia成峰开源的剪辑Skills已有2000+ GitHub Star,接入Anthropic的Codex后实现从口播素材到成片的自动化。Agent通过/剪口播命令生成带字幕视频,再通过/口播成片命令生成HTML分镜核对页,用户可直接反馈修改。Codex使用Computer Use自动调整时间线,最终由HyperFrames合成MP4。该流程将视频生产从手动执行转为流程编排。技巧Codex剪辑Skills智能体视频生成10 个信源在谈推荐理由:用Codex加开源剪辑Skills,丢入口播素材和稿子,Agent直接帮你剪好带字幕的视频,还能自动做动画和分镜,省掉手动时间线操作。原文
08:05berryxia@berryxia百度开源了Unlimited OCR模型,采用R-SWA(参考滑动窗口注意力)机制,一次前向推理即可处理32K上下文的文档,数十页PDF无需分块。与传统逐页处理的OCR不同,其KV Cache大小恒定,不随长度增长。模型灵感源于人类抄书行为,仅维护近128个状态。技术报告核心贡献者中,技术总监YY疑为DeepSeek前员工。AI模型Unlimited OCR百度DeepSeekR-SWA文档理解6 个信源在谈推荐理由:百度开源的Unlimited OCR能一口气读完几十页PDF,不用切块,快又准。技术总监YY可能是DeepSeek出走的,有意思。原文
05:24LangChain@LangChainAIPatlytics 是一个专门为专利全生命周期设计的企业级法律AI平台。它使用LangSmith来编排从提示管理到工作流评估的端到端AI堆栈。该平台旨在提升专利流程的效率和质量。Patlytics 被LangSmith Spotlight 收录,展示了其在法律AI领域的应用。AI产品patlyticsLangSmithLangChain法律AI专利生命周期推荐理由:Patlytics 用 LangSmith 搭建了专利全流程 AI 平台,从提示到评估都管,法律行业可以看看。原文
05:06LangChain@LangChainAI精选Deep Agents v0.6 新增代码解释器,代理可在运行时调用工具。中间结果保留在模型上下文之外,仅传回相关输出。这减少了往返次数和 token 浪费。该版本由 LangChain 发布。AI产品Deep AgentsLangChain代码解释器智能体工具调用推荐理由:Deep Agents v0.6 出代码解释器了!运行时调工具,中间结果不占上下文,省 token 还少跑几趟。看详情。原文
05:03Harrison Chase@hwchase17精选LangChain创始人hwchase17对比了模型路由(route to one best model)和模型合议制(pass to many models并聚合响应),认为前者主要为了成本,后者提升前沿性能。他引用@OpenRouter的Fusion和@SakanaAILabs的fugu作为合议制案例,并提到@nlarusstone将其用于棘手生物问题。作者对模型路由效果存疑,认为prompt caching和用户反馈缺失是问题,更倾向先实施成本控制(如LangChain的按模型设置支出上限)。Dax补充了用户需培养模型感知的观点。行业model routingmodel councilOpenRouterSakanaAILabs成本控制推荐理由:hwchase17聊了模型路由和合议制的区别,吐槽路由被夸大,推荐先做成本控制。适合想了解多模型调度策略的人。原文
04:27Philipp Schmid@_philschmidGoogle 更新了 Gemini API 文档,并发布了 GitHub 上的 Skill 示例。该示例展示了如何使用 Gemini API 构建自定义技能。文档和代码均在 ai.google.dev 和 github.com/google-gemini 上公开。开发者可以据此快速集成 Gemini 到工作流中。技巧Gemini APIGoogleSkillGoogle Generative AI教程推荐理由:Google 刚放出了 Gemini API 的 Skill 示例代码,想自己动手接入 Gemini 的可以抄作业了。原文
04:26Lenny Rachitsky@lennysan78°Anthropic工程师一年内代码输出量增长8倍,验证成为最大挑战,团队采用“bad vs sad”追踪框架区分不可恢复错误与可恢复痛点。工程师因独立工作出现孤独感,团队引入配对编程午餐缓解。Anthropic构建了统计用户对Claude Code说脏话频率的仪表盘,作为体验评估代理指标。产品机会来源于非编码用户的潜在需求,如用Claude Code分析MRI或恢复婚礼照片。团队从半年规划转为月度规划,并赋予成员“杀死无效流程”的权限。行业Claude CodeAnthropic编程助手智能体工程实践10 个信源在谈推荐理由:Anthropic的Claude Code团队负责人分享了他们如何让工程师效率提升8倍、用脏话计数衡量体验,还提到非程序员用Claude Code做MRI分析等趣事,全是实战干货。原文
04:09Philipp Schmid@_philschmidGoogle Gemini 的 Interactions API 已正式发布(GA)。安装 Skill 后,编码代理能自动获得 Interactions API 的内置规则、正确 SDK 模式及当前模型版本。支持 Antigravity、Claude Code、Cursor 等代理。一条提示即可将现有应用迁移至新 API。迁移指南中的所有 API 变更由 Skill 自动应用。技巧GeminiInteractions API编程助手API迁移7 个信源在谈推荐理由:Google 出了Gemini Interactions API 的官方 Skill,装上后你的编码代理一个提示就能自动迁移 API,支持 Claude Code、Cursor 等。原文
03:57Greg Brockman@gdb精选73°OpenAI推出了Codex Security插件,专为安全团队设计。该插件支持深度代码扫描、自动验证发现结果,并能够追踪攻击路径。它还可以构建威胁模型,生成针对代码库的特定补丁用于审查。此外,支持将分析结果导出到其他安全工具中。AI产品CodexOpenAI安全代码扫描AI安全10 个信源在谈推荐理由:OpenAI给安全团队出了个Codex插件,能深度扫描代码、自动验证漏洞、画攻击路径,还生成专属补丁,省事儿不少。原文
03:55lmarena.ai@lmarena_ai精选Arena排行榜基于全球社区的真实任务动态更新,而非静态基准。评估流程包括内部基准测试、模型接入、社区投票、分数稳定化和公开发布。团队采用Bradley-Terry模型确保分数稳定性,并区分Expert和Hard难度以细化评估维度。视频还介绍了代码名称、身份泄露过滤及投票质量控制等机制。技巧ArenaLMSYS模型评测基准测试Bradley-Terry推荐理由:想了解AI模型评测怎么运作的?Arena团队亲自拆解从内测到上线的完整评估流程,还讲了Bradley-Terry分数如何保证公平,干货满满。原文
03:54Harrison Chase@hwchase17精选该建议指出,用于智能体工程的计划、研究等上下文文档应放在仓库外,而非版本控制系统中。原因包括:文档无需合并语义,线性历史即可满足99.9%场景;存入仓库将导致文档在不同分支间丢失。推荐系统通过FS工具访问、可发现、可持久化归档且支持协作。该讨论由LangChain创始人Harrison Chase转发,引发对智能体开发最佳实践的思考。技巧Agent工程文档管理版本控制上下文工程推荐理由:LangChain创始人分享了一个文档管理的小技巧:把智能体工程文档放VCS外面,用FS工具访问,避免分支迷失。原文
03:24elvis@omarsar0精选Sakana AI推出Fugu Ultra多智能体编排系统,通过单一模型API即可调用。在程序化地形生成(Three.js)测试中,Fugu Ultra一次生成效果与Fable和Mythos相当。该模型规避了出口管制风险,属于前沿能力级别。AI模型SakanaFugu Ultra智能体程序化生成推荐理由:Sakana AI悄悄上了个Fugu Ultra,多智能体编排直接一个API搞定,性能追上Fable和Mythos,还不用怕出口管制,值得试试。原文
03:06GitHub@githubImpeccable.ai在GitHub上获得超过40,000星标,以其在设计和质量方面的能力著称。GitHub将其作为内置技能集成到GitHub Copilot应用中,为所有创作者提供内置的设计与质量层。此举旨在提升AI辅助编码体验,降低门槛并提高输出质量。AI产品Impeccable.aiGitHub CopilotGitHub编程助手推荐理由:GitHub把超火的Impeccable.ai直接塞进了Copilot,以后写代码自动搞定设计和质量,不用再单独装插件了。原文
03:03LangChain@LangChainAILangChannel指出,随着智能体采用增长,团队需建立可重复的方法来安全、一致地构建多个生产级智能体。关键管理领域包括:成本与使用监控(✅ Cost and usage)、工具访问与审批(✅ Tool access and approvals)、人机协作工作流(✅ Human-in-the-loop workflows)、提示词/技能/上下文版本控制(✅ Prompt, skill, and context versioning)、跨团队可复用资产(✅ Reusable assets across teams)、以及生产智能体的监控与评估(✅ Monitoring and evals across production agents)。这些实践旨在解决规模部署时的一致性与可靠性问题。技巧LangChain智能体MCP/工具生产环境人机协作1 个信源在谈推荐理由:LangChain总结了团队构建多个智能体的核心痛点:成本、权限、版本控制、监控等,全是实战干货,适合正在做 Agent 上线的团队参考。原文
02:43SiliconFlowAI@siliconflowaiGLM-5.2 在 Designarena 的 HTML Web Design 排行榜上取得第一,超越了此前长期占据榜首的 Claude Opus 4.6 和 4.7。该模型已通过 SiliconFlow API 提供使用。开发者可以立即调用 GLM-5.2 构建 HTML 网页设计项目。AI模型GLM-5.2Claude OpusSiliconFlowDesignarena编程助手1 个信源在谈推荐理由:HTML 设计排行榜上 GLM-5.2 干掉了 Claude,现在就能用 SiliconFlow 的 API 上手,写网页贼快。原文
02:33Logan Kilpatrick@OfficialLoganK73°Google AI Studio 发布 Interactions API 正式版(GA),该新 API 旨在让用户在同一界面内编排不同模型和智能体,已成为 AI Studio 新的默认 API。Interactions API 为智能体(Agents)新阶段奠定基础,开发者可更高效地构建跨模型工作流。AI产品Google AI StudioInteractions APIMCP/工具智能体多模型协调推荐理由:Google AI Studio 正式上线了 Interactions API,能让你在一个界面里调度不同模型和智能体,做复杂工作流更方便了原文
02:26LangChain@LangChainAILangChain 宣布其通用开发者工具 dcode 现已支持 GLM 5.2 模型。用户可直接在 dcode 中运行该开源模型,无需额外配置。dcode 是提供商无关的工具,也兼容其他最新的开源模型。详情可查阅 LangChain 文档。AI模型GLM 5.2dcodeLangChain开源模型推荐理由:LangChain 出了个叫 dcode 的工具,现在能跑 GLM 5.2 模型了,而且是开源的,想尝鲜直接上手。原文
02:23The Rundown AI@therundownai72°SpaceX通过出租Nvidia芯片给AI公司持续获利,最新交易是与Reflection AI在Colossus 2超级计算机上合作。其他大客户包括Anthropic每月支付12.5亿美元、Google每月9.2亿美元、Reflection AI每月1.5亿美元,以及被整体收购的Cursor(交易金额600亿美元)。这些订单显示了科技巨头对AI算力的巨大需求。行业SpaceXNvidiaReflection AIAnthropic算力租赁10 个信源在谈推荐理由:SpaceX真是会赚钱,算力出租给Anthropic、Google都按月付上亿,新客户Reflection AI也签了1.5亿月租。原文
02:09Philipp Schmid@_philschmid精选Google 推出 Interactions API,提供单一 API 接口调用 Gemini 模型和智能体。该 API 包含隔离的远程 Linux 沙箱环境,支持异步后台运行的 background=True 参数。已集成图像生成 Nano Banana、音乐生成 Lyria 3,并预告未来支持视频生成 Omni。同时具备多模态工具调用与组合能力,以及专用编码技能。开发者可通过该 API 构建人类与智能体交互的应用。AI产品Interactions APIGeminiGoogle智能体多模态推荐理由:Google 上线了 Interactions API,一个 API 就能调用 Gemini 模型和智能体,还有沙箱、图像音乐生成,异步运行很简单。原文
02:06Nous Research@NousResearchHermes Agent 现已集成 trycua,在 Windows 和 Linux 系统上支持计算机使用功能,此前该功能仅限 macOS。用户可以通过自然语言指令控制桌面操作。该更新由 NousResearch 发布,进一步扩大了代理的跨平台可用性。AI产品Hermes AgenttrycuaNousResearch跨平台智能体3 个信源在谈推荐理由:如果你用 Windows 或 Linux,现在也能用 Hermes Agent 控制电脑了,操作和 macOS 一样流畅。原文
02:05Nous Research@NousResearchNous Research 开发的智能体框架 Hermes Agent 在 GitHub 上获得 20 万颗星标。该项目基于开放权重模型构建可定制代理,支持多种工具调用和多步骤推理。里程碑反映出开发者社区对开源智能体框架的高度关注。AI产品Hermes AgentNous Research智能体GitHub开源项目推荐理由:看看 Nous Research 搞的 Hermes Agent,GitHub 上 20 万星了,开源智能体框架里很猛的。原文
02:03Greg Brockman@gdb精选OpenAI 在 Daybreak 项目中推出新工具和模型,加速关键漏洞的发现和修补。其模型已能为 FreeBSD、Linux kernel、cURL、Go、Python、Sigstore、pyca/cryptography 等生成补丁。新发布的包括 Codex Security 插件(在 Codex 内修复漏洞)、GPT-5.5-Cyber 模型(专为防御者设计)、Cyber Partner Program(安全公司合作)以及 Patch the Planet(开源项目维护)。AI产品OpenAIGPT-5.5-CyberCodex SecurityDaybreakAI安全10 个信源在谈推荐理由:OpenAI 的 Daybreak 现在不仅能找漏洞,还能自动打补丁了,连 Linux 内核和 FreeBSD 都支持,安全团队可以试试 GPT-5.5-Cyber。原文
01:23Y Combinator@ycombinatorYCombinator于8月15日在YC总部举办活动,邀请学生与50多家YC投资公司的创始人和工程师交流。学生可在展区与创始人见面、收集周边,并观看初创公司路演。活动提供现场面试机会,可锁定2027年暑期实习或合作项目。行业Y CombinatorYCAI初创公司实习学生招聘推荐理由:YC直接组织线下活动,让你面对面和50多家AI初创公司创始人聊,现场面试拿实习,比投简历快多了。原文
01:19OpenAI@OpenAIOpenAI 宣布启动 Daybreak Cyber Partner Program,与领先的安全软件和服务提供商合作。合作伙伴可在其安全产品和服务中使用 GPT-5.5 with Trusted Access for Cyber。客户能受益于该模型的防御能力,提升软件韧性,但直接模型访问权由合作伙伴控制。该计划旨在通过渠道模式推广 AI 安全能力。行业OpenAIGPT-5.5DaybreakAI安全安全软件10 个信源在谈推荐理由:OpenAI 联合安全厂商,让 GPT-5.5 直接嵌入安全产品,客户不用管理模型,就能享受更强的网络防御。原文
01:19OpenAI@OpenAIOpenAI 宣布推出 Patch the Planet 项目,与 Trail of Bits、HackerOne 及多位安全研究员和开源维护者合作。该项目利用 Codex Security 和高级模型(如 GPT-4)协助将安全发现快速转化为合并修复。修复过程以人工审核为中心,确保补丁质量。目标是降低开源项目从漏洞披露到修复的时间门槛。行业OpenAICodex SecurityTrail of BitsHackerOneAI安全10 个信源在谈推荐理由:OpenAI 联手 Trail of Bits 和 HackerOne,用 Codex Security 帮开源项目快速修漏洞,人工把关,靠谱。原文