13:50阶跃星辰 Stepfun@Stepfun_AIStepFun 根据开发者反馈发现,当 Agent 开始实际工作时,计费机制会干扰工作流。为此推出了 Step Plan,旨在降低这种干扰。同时发布了 Step 3.7 Flash 模型,配合 Claude Code 使用。这个组合可以让开发者在编程场景下更专注于任务本身。AI产品Step PlanStep 3.7 FlashClaude Code智能体编程助手推荐理由:StepFun 搞了个 Step Plan,专治 Agent 干活时的计费麻烦,还搭了 Step 3.7 Flash 和 Claude Code,编程省心不少。原文
13:50阶跃星辰 Stepfun@Stepfun_AIStepFun宣布与Cline合作,将其Step 3.7 Flash模型集成到Cline中。该模型专为代理式编程工作流设计,具备能力、速度和可靠性。从即日起,Cline用户可免费使用Step 3.7 Flash一个月。用户只需在Cline中输入'/model → Step 3.7 Flash'即可切换。AI模型Step 3.7 FlashCline编程助手智能体推荐理由:StepFun把自家Step 3.7 Flash模型免费给Cline用一个月,写代码的代理工作流更稳更快了,试试看。原文
13:50阶跃星辰 Stepfun@Stepfun_AIStepFun(阶跃星辰)推出初创公司计划,为早期AI团队提供支持。入选团队可获得API额度、专属生态系统支持、联合营销机会、展示位置及合作伙伴引荐。该计划面向构建多模态应用和智能体系统的团队。申请现已开放。行业StepFun多模态智能体初创计划推荐理由:StepFun给早期AI团队送API额度、资源和曝光,做多模态或智能体项目的小伙伴可以试试,链接在推文里。原文
13:50阶跃星辰 Stepfun@Stepfun_AI精选StepFun 发布 Step 3.7 Flash 模型,专为高效智能体工作负载设计。该模型具备原生多模态理解、强智能体编程能力、可靠工具调用以及网页与视觉搜索工作流。模型已通过 Novita Labs 在 OpenRouter 平台上提供。StepFun 称这是为生产级 AI 智能体打造的高效方案。AI模型Step 3.7 FlashStepFunNovita LabsOpenRouter智能体推荐理由:StepFun 刚出了 Step 3.7 Flash,专为智能体打造的模型,多模态、能编程、会搜图搜网页,现在就能在 OpenRouter 上试。原文
13:49阶跃星辰 Stepfun@Stepfun_AI精选Step 3.7 Flash 是开源多模态推理模型,现已在 DeepInfra API 上线。该模型支持私有端点部署,适用于专用负载场景。它专为智能体编码、工具使用、搜索和视觉工作流设计。开发者可通过 DeepInfra 的 API 直接调用。AI模型Step 3.7 FlashDeepInfra多模态推理模型开源模型推荐理由:Step 3.7 Flash 开源多模态推理模型刚上线 DeepInfra,支持私有部署,适合智能体编程和视觉任务,开发者可以试试。原文
13:49Microsoft AI@MicrosoftAI微软宣布MAI-Code-1-Flash模型现已面向GitHub Copilot Business和Enterprise用户全面开放。该模型专注于代码生成,强调速度和效率,旨在帮助开发者用更少资源构建更多功能。MAI-Code-1-Flash是微软内部开发的轻量级代码模型,针对商业和企业级使用场景优化。通过集成到GitHub Copilot,用户可直接在代码编辑器中获得实时补全和建议。AI模型MAI-Code-1-FlashGitHub CopilotMicrosoft编程助手代码生成推荐理由:微软把自家MAI-Code-1-Flash模型放进GitHub Copilot了,写代码更快更省资源,Business和Enterprise用户赶紧试试。原文
13:49Microsoft AI@MicrosoftAI微软AI在X上发布视频,展示团队成员如何解决机器学习中的难题。视频中研究人员探讨了改进LLM训练效率的新思路。团队还分享了在推理模型优化上的实践。行业Microsoft AI推理模型训练优化推荐理由:看看微软AI团队怎么解决实际技术难题,了解模型背后的人原文
13:49Microsoft AI@MicrosoftAI精选微软推出新编程模型 MAI-Code-1-Flash,在真实 GitHub Copilot 环境中训练,具备高速和 token 高效特性。该模型可通过 VS Code 的 Copilot Chat 完成规划、构建、运行和测试。演示中,它从单个 frost banner 生成完整季节性快照并通过测试,耗时几分钟,成本仅几美分。AI模型MAI-Code-1-FlashMicrosoft编程助手代码生成GitHub Copilot推荐理由:微软出了个新模型 MAI-Code-1-Flash,直接在 Copilot 里跑,能自动把草图变成完整测试通过的代码,又快又便宜。原文
13:49Microsoft AI@MicrosoftAI微软的 MAI-Image-2.5 在 Artificial Analysis 的文本到图像榜单中排名第2,图像编辑排名第3。该模型能对图像进行精确编辑,例如将雨窗模糊场景转换为清晰街景,同时保持物体一致性、光照、反射和场景几何。模型现已通过 Foundry API、MAI Playground 和 OpenRouter 提供使用。AI模型MAI-Image-2.5Microsoft图像生成图像编辑多模态推荐理由:微软 MAI-Image-2.5 图像生成排第2、编辑排第3,还能把雨窗变清晰,想用去 Foundry API 或 OpenRouter 试试。原文
13:49Microsoft AI@MicrosoftAI精选微软AI用VS Code分支构建原型,让MAI-Transcribe、MAI-Voice和MAI-Code-1-Flash三个模型协同工作。用户说出编程指令,语音转录并解析后直接生成可运行代码。此流程将语音、转录和编码模型串联成一个统一工作流。原型展示了多模型协作在开发工具中的落地可能。AI产品MAI-TranscribeMAI-VoiceMAI-Code-1-Flash微软语音转代码推荐理由:微软把语音识别和代码生成串起来了,对着VS Code说话就能写代码,适合想偷懒的程序员试试。原文
13:49Microsoft AI@MicrosoftAI微软AI在推文中介绍了构建编码模型的全流程,包括训练阶段的优化策略、评估方法、性能调优、安全性考量以及收集真实开发者反馈。文章深入展示了从模型设计到部署的每个环节,帮助理解如何让编码模型适配开发者的实际工作场景。AI模型微软AI编码模型模型训练AI安全编程助手推荐理由:微软AI分享了他们训练编码模型的实战细节,从评估到安全都有,做编程助手的人值得看看。原文
13:49Google Labs@GoogleLabsGoogle Labs 的 Project Genie 在2025年戛纳创意节上获得AI Craft类别的全场大奖(Grand Prix)。该奖项表彰其在AI创意领域的卓越表现。这是Google Labs社区共同参与的结果。行业Project GenieGoogle Labs戛纳创意节AI创意推荐理由:Google Labs的Project Genie拿了戛纳大奖,AI Craft类别最高荣誉,看看他们怎么用AI做创意。原文
13:49阶跃星辰 Stepfun@Stepfun_AIStepFun 的 Step 3.7 Flash 模型已在 AI 平台 ZenMuxAI 上架。该模型支持多模态输入,针对实际工作流优化,推理速度较快。用户可在 ZenMuxAI 上免费使用该模型30天。AI模型Step 3.7 FlashZenMuxStepFun多模态免费试用推荐理由:StepFun 的新模型 Step 3.7 Flash 上线 ZenMux,多模态且快,还能免费用一个月,想试试的别错过。原文
13:49Jasper AI@heyjasperai精选72°Jasper Research 宣布推出 MONET 数据集,从 29 亿张图片中精炼出 1.049 亿张高质量样本,成为全球最大的开放文本-图像数据集。该数据集采用 Apache 2.0 许可,可免费商用。同时发布的 nano-t2i 方案支持在单张 GPU 上训练有竞争力的文生图模型。AI模型MONETJasper Researchnano-t2iApache 2.0多模态推荐理由:Jasper Research 放出了 MONET 数据集,有 1 亿多张图,免费商用,还能用 nano-t2i 在单卡上训练模型,做文生图的值得试试。原文
13:49Together AI@togethercomputeGLM-5.2模型已在Together AI平台上架,并通过OpenRouter快速提供服务。Together AI优化推理路径,使模型在长上下文编码和智能体工作负载中每GPU能处理更多token,同时保持低延迟。该模型展现出强劲性能,适合需要高吞吐的复杂任务。AI模型GLM-5.2Together AIOpenRouter推理模型长上下文推荐理由:GLM-5.2跑得快,长上下文和智能体场景下Together的优化让token更多更流畅,试试看。原文
13:49Jasper AI@heyjasperaiJasper 发布了 Slack Agent,这是一个直接集成在 Slack 中的 AI 工具。用户可以在对话线程中用它生成、总结和修订内容,无需切换到其他应用。该功能旨在将聊天讨论快速转化为初稿,减少工具切换带来的效率损失。AI产品JasperSlack Agent内容生成智能体3 个信源在谈推荐理由:Jasper 把内容生成塞进 Slack 了,团队可以直接在聊天里改稿子,不用再跳来跳去。原文
13:49Ethan Mollick@emollickOpenAI目前尚未推出GPT-6模型。有观点猜测该标签可能被保留给更先进的下一代模型。GPT-4o等现有模型已覆盖多种能力。OpenAI的模型命名策略尚未公开说明。行业GPT-6OpenAI模型迭代9 个信源在谈推荐理由:看看大家对OpenAI下一代模型命名的猜想,挺有意思的,虽然没干货但能勾起好奇心。原文
13:49Ethan Mollick@emollickAA-Briefcase评分由@ArtificialAnlys发布,用于衡量AI完成多周复杂咨询任务的能力。最新得分曲线显示,AI模型在短期内取得了快速进步。开放权重模型与封闭模型之间存在明显的差距,封闭模型整体表现更优。该评测揭示了当前AI在多步骤复杂任务中的能力差异。AI模型AA-Briefcase开放模型封闭模型AI基准推荐理由:新评测让AI做多周复杂咨询,结果看到开放模型和封闭模型差距挺大,进步也很快。原文
13:49Ethan Mollick@emollickGLM-5.2是一款开源模型,其性能不及GPT-5.5和Opus 4.8,更远不及Mythos。但它表现扎实,表明开源模型持续追赶前沿。当前开源权重已触及GPT-5.2水平,在该能力区间表现显著。这一进展说明开源模型正在缩小与闭源前沿的差距。AI模型GLM-5.2GPT-5.5Opus 4.8Mythos开源模型推荐理由:GLM-5.2虽然没追上GPT-5.5,但开源模型又往前迈了一大步,能力提升明显,值得关注。原文
13:49Ethan Mollick@emollickEthan Mollick 指出,所有模型路由器(model routers)在处理非数学/编程任务时,普遍低估任务难度并分配过少的智能资源。他建议,对于不可验证的任务(如创新、营销、定性分析),使用更智能的模型往往能带来更大收益。这一观点源于他对多种路由器实际表现的经验观察。技巧model routers任务分配推理模型非数学任务推荐理由:Ethan Mollick 分享了一个容易被忽视的问题:模型路由器的任务分配不够智能,尤其对创意和分析类任务。如果你也发现一些任务结果不好,可能不是模型不行,是路由器给它派了太弱的模型。原文
13:48岚叔@lufzzliz推文作者表达了对xAI下一代模型Grok 4.5的强烈期待。作者认为xAI可能拥有过多计算资源用于Grok 4.5的训练。希望Grok 4.5能训练得更出色并支持SpaceX。行业Grok 4.5xAISpaceX模型训练4 个信源在谈推荐理由:这位网友对Grok 4.5很有信心,还调侃xAI显卡太多不如自己用。看看民间对xAI新模型的态度。原文
13:48Ethan Mollick@emollick一项实验测试了AI在端到端编码任务中的能力。Opus 4.7在14小时内构建了一个软件包,相当于人类工程师2-17周的工作量,总花费251美元。虽然模型仍不完美,但进步速度显著。AI模型Opus 4.7编程助手编码能力AI基准测试推荐理由:Opus 4.7只用14小时和251块就干完了人类几周的活,虽然还有瑕疵,但进步真的快。原文
13:48岚叔@lufzzliz文章指出长期依赖AI生成代码会削弱工程师的沉浸式创造能力和职业满足感。作者用历史小说家批量生产而非亲自研究写书的类比,说明类似问题。他自述使用Claude和Codex几个月后,写代码变得懒散迟钝,遇到复杂问题第一反应是让AI找bug或写修复。文章警告AI批量产生的代码如同“数字塑料垃圾”,便宜但长期污染软件生态。技巧ClaudeCodex编程助手软件工程推荐理由:这篇很真实,说透了AI用得越多,自己越容易变懒,得先自己思考再让AI动手。原文
13:48Ethan Mollick@emollick这个提示词让AI模型推荐两首适合当前GenAI状态的诗,并要求认真思考而非后验合理化。作者建议在GLM-5.2或Opus 4.8上尝试,观察模型如何选题和论证。它提供了窥探模型内部推理过程的视角,适合想了解模型思考方式的人。该技巧无需额外工具,直接复制提示词即可使用。技巧GLM-5.2Opus 4.8提示词工程推理模型推荐理由:想看看AI怎么思考?让GLM-5.2或Opus 4.8帮你选诗,能看到它的推理过程,挺有意思的。原文
13:48岚叔@lufzzliztokei v1.08 新增Claude Code按模型查看详情功能,可对每个模型(如GLM-5.2)单独分析费用。全局视角支持本机/全部设备查看。回顾页面新增“Loop Engineering”和“Loop滴神”成就:连续3天/30天每天24小时有Agent运行即可获得。新增对Qoder、QoderWork Agent的计算支持。AI产品tokeiClaude CodeQoderQoderWork智能体推荐理由:tokei更新了,现在能按模型看Claude Code花了多少钱,还有连续跑Agent的成就系统,适合想精细控制AI开支的开发者。原文
13:48岚叔@lufzzlizK神定义LLM UI/UX第三次变革,将LLM视为独立可持续运行的系统,拥有全组织工具和上下文,与人协同。作者基于Pi实现组织内agent交互,支持不同群组不同的记忆、知识库、技能和模型。该系统可应用于客户群交互,实现高效丝滑协同。行业Pi智能体LLM协同推荐理由:K神提出了新的LLM交互思路,作者已经用Pi搭建了能按群组定制的智能体系统,对企业协作很有参考价值。原文
13:48岚叔@lufzzliz在世界杯小组赛预测中,GLM-5.2在比分榜综合最强,GPT-5.5在胜负榜综合最强且命中率达70%。淘汰赛阶段取消24小时限制,可一次性预测16场比赛。作者分享了提示词示例:"继续预测,可以提交淘汰赛16场的比赛,你需要仔细分析给出你的答案、并提交"。同时附带了opus-4.8和deepseekv4-pro的预测结果。技巧GLM-5.2GPT-5.5提示词工程智能体世界杯推荐理由:作者用GLM-5.2和GPT-5.5预测世界杯,GPT-5.5命中率70%,还给了淘汰赛提示词,试试用自己的agent玩。原文
13:48岚叔@lufzzlizGPT-5.5-Cyber 在安全基准 CyberGym 上击败了 Mythos 5,取得领先成绩。使用该模型需向官方申请权限,个人和企业均可,用途限定为授权防御场景,如漏洞研究、红队、渗透测试、恶意软件分析、威胁情报、事件响应。此外,Codex 推出了新插件,可利用 gpt-5.5(reasoning 设 high/xhigh)进行代码安全扫描与修复。AI模型GPT-5.5-CyberMythos 5CyberGym安全模型Codex2 个信源在谈推荐理由:GPT-5.5-Cyber 在安全基准 CyberGym 上直接碾压了 Mythos 5,想搞红队或漏洞分析的话可以申请权限试试。原文
13:48岚叔@lufzzliz精选LufzzLiz基于Andrej Karpathy的LLM Wiki gist衍生出两套模板:个人知识库schema(五层目录)和代码仓库wiki schema(三层目录+双层导览)。附带实践案例Hermes-wiki和wiki-web,后者支持关系图和脑图。模板可直接用于构建结构化个人知识库或项目文档。技巧Karpathy知识库模板笔记技巧工作流推荐理由:如果你嫌搭建知识库太麻烦,试试这套基于Karpathy思路的模板,五层目录帮你把笔记理得清清楚楚,还有实际案例参考。原文
13:09vLLM@vllm_project精选vLLM-Omni TTS团队针对Qwen3-TTS、VoxCPM2、Higgs Audio V3、Fish Speech S2 Pro四种TTS模型分别设计了不同的优化策略。对Qwen3-TTS通过解耦连接器分块和批处理Stage-0解码预处理,在H20×2上音频吞吐量提升61.5%,P99延迟减半。VoxCPM2采用whole-forward torch.compile和CFM/LocDiT解码尾部跨请求批处理,音频吞吐量提升172%。Higgs Audio V3将多码本解码状态机迁移到GPU驻留张量,实现2.7倍加速。Fish Speech S2 Pro为纯解码路径设计了模型特定的q_len=1 Triton注意力内核。AI模型vLLMQwen3-TTSVoxCPM2Higgs Audio V3Fish Speech S2 Pro语音合成推理优化推荐理由:vLLM团队分享了优化四种主流TTS模型服务的具体技巧,包括性能提升数据和实现细节,对部署TTS服务很有参考价值。原文
12:48Geek@geekbbGitHub上Pluviobyte/video-skill仓库将AI视频制作流程拆解为多个可安装的skill模块,涵盖视频创作、复刻、动效、片头包装、质检等环节。每个skill独立可用,降低视频制作门槛。项目长期维护,持续更新。技巧video-skillPluviobyte视频制作工作流开源项目推荐理由:这个仓库把视频创作、动效、包装等技能打包成模块,装一个就能用,做视频更轻松。原文
12:24Shashikant Kore@kshashi谷歌在AI竞赛中看似落后,但根源可能是内部资源分配问题。现有产品的算力需求与DeepMind对前沿模型(如Gemini系列)的研发需求产生竞争。这种内耗导致谷歌难以集中资源冲刺顶级模型,而非技术能力不足。行业GoogleDeepMindAI竞赛算力资源分配推荐理由:一句话解释谷歌为什么没跑赢AI竞赛——不是技术不行,是自家产品抢算力。内耗比对手更头疼。原文
11:51Browser Use@browser_useBrowser Use 团队对 Opus 4.7 和 GLM 5.2 进行前端设计基准测试。测试使用 Browser Use v4 工具,从 LLM Arena 数据集中选取一个 prompt。每个模型根据该 prompt 生成网站并自动评分。结果对比了这两款模型在代码生成和界面设计上的能力。AI模型Opus 4.7GLM 5.2Browser UseLLM Arena前端生成推荐理由:Browser Use 团队拿 Opus 4.7 和 GLM 5.2 比前端设计,一个 prompt 生成网站打分,看看谁画页面更强。原文
11:27Yangyi@YangyixxxxTango在2023年就实现了浏览器录制功能,但AI降低了实现门槛。NewMax的录制比Codex更强,不仅能学习操作,还能将workflow沉淀为Playwright脚本,减少二次开发消耗。该功能速度更快,结合vibecoding理念让用户仅凭想法即可编码。功能将在下个版本发布。AI产品NewMaxCodexPlaywright浏览器录制vibecoding推荐理由:NewMax的录制比Codex实用,能把操作直接变成Playwright脚本,省去重复工作,下个版本就能体验。原文
11:20AI产品黄叔@PMbackttfuture这篇推文列出了关于 Agent(智能体)使用 QQ 邮箱的 10 条观察。核心观点包括:邮箱是 Agent 的数字身份证,与个人邮箱隔离;收邮件是杀手级场景;Agent 发邮件前需用户确认,这是信任训练;最终局是 A2A 通信。文章认为 QQ 邮箱此举抢的是通信层,真正的对手是 Cloudflare。行业QQ Mail智能体A2A通信数字身份推荐理由:看看这篇对 Agent 与 QQ 邮箱结合的犀利分析,10 条观察直击本质,尤其是把邮箱当作数字身份证和 A2A 通信的终局思考。原文
10:49Geek@geekbblanshu 是一个基于 Python 3.10+ 和 Pillow 库的开源绘图工具,专为技术博客、系统架构图和流程图设计。用户编辑一份 JSON 配置文件后,可同时导出 .excalidraw 源文件、高清 PNG(最高 4K)以及逐帧动画 GIF(支持 24fps)。所有渲染在本地运行,无需浏览器或远程 API 调用。视觉效果采用深色背景、手写风格标题、流动光效和脉冲高亮,类似 DailyDoseOfDS 的黑底技术手稿。项目已在 GitHub 上开源,提供 pip 快速安装。AI产品lanshuPythonPillowExcalidraw技术绘图推荐理由:技术博主画架构图常用 Excalidraw,但导出 GIF 和 PNG 还得手动转。这个工具改一份 JSON 就能同时拿到三种格式,本地渲染还快,风格也很酷。原文
10:48向阳乔木@vista8腾讯云EdgeOne发布了新产品EdgeOne Makers,旨在简化AI Agent的开发和部署流程。通过执行三条命令即可完成从安装到本地测试的全过程,包括`npm install -g edgeone`、`edgeone makers create --template openai-agents-starter-node`等。本地测试网站可直接观察Agent对话和工具调用细节,线上支持绑定域名和关联Github持续迭代。当前处于Beta内测阶段,注册可免费领取50万Token。AI产品腾讯云EdgeOneEdgeOne Makers智能体部署工具8 个信源在谈推荐理由:腾讯云EdgeOne出了个Makers,几行命令就能把AI Agent框架跑起来,不用自己折腾环境,节省大量时间。原文
09:45Yangyi@YangyixxxxNewMax客户端v1.1.0版本正式发布,完成品牌升级从牛马AI改名NewMax。新版本支持完全离线及断网运行,数据端到端加密存储,区别于Claude Desktop和Codex。该版本新增自动化任务编排,可自动拆解指令调用本地应用如剪映、Photoshop。支持多模型自定义调用、多Cookie浏览器操作及联动钉钉、微信等国内IM工具。AI产品NewMaxClaude DesktopCodex本地化自动化工作流推荐理由:NewMax客户端v1.1.0主打本地隐私安全,能离线运行,还能自动调用本地App做任务,比Claude Desktop多了一大堆实用功能,适合自媒体和办公党。原文
09:15shao__meng@shao__meng精选Boris Cherny 基于 Claude Code 团队经验,提出未来产品团队的五种角色原型:Prototyper(原型师)、Builder(构建者)、Sweeper(优化清理者)、Grower(增长者)、Maintainer(维护者)。他指出角色与岗位头衔无关,多数人横跨 2-3 个角色。产品阶段决定角色配比:新/未达 PMF 需 1+2+3,增长期需 2+3+4+少量 5,成熟期需 3+4+5+少量 2。这一框架强调从职能分工转向价值流分工,团队健康度取决于角色配比与阶段匹配度。行业Claude CodeBoris ChernyAnthropic团队角色产品团队10 个信源在谈推荐理由:Boris Cherny 分享了 Claude Code 团队的经验,把未来团队分成五种角色,帮你重新思考招人和分工,比传统职能划分更实用。原文