全部 AI 动态 · AI 热点

6月29日

13:50

François Chollet@fchollet

François Chollet（Keras创建者）在推文中指出编程不是关于代码，而是通过抽象层管理复杂性的艺术。他认为编程的核心在于构建函数、类等抽象层来降低认知负荷。AI在这一框架下仅是一种新的抽象工具，不应被过度神化。这一观点提醒程序员更关注架构设计而非语法细节。

推荐理由：Chollet一句话点醒你：编程不是写代码，是搭抽象层。别把AI太当回事。

原文

13:50

François Chollet@fchollet

精选

François Chollet 指出，智能体编程（Agentic coding）迫使开发者设计清晰的 API 接口并编写完整的文档字符串。AI 代理无法阅读团队内部的隐式心理模型，只能依赖显式的 API 合约和 docstring。这要求接口规范必须精确、无歧义，文档覆盖所有输入/输出场景。对工程团队而言，这意味着需要投入更多时间在接口形式化设计上。

技巧 Agentic coding API设计文档字符串智能体编程助手

推荐理由：François Chollet 说得很实在：想用AI代笔写代码，接口就得干净、文档得详细，别指望它懂你没写出来的默契。

原文

13:50

François Chollet@fchollet

François Chollet 指出当前 AI 技术栈存在 3-4 个数量级的数据效率低下和 4-5 个数量级的计算效率低下。他预测 2040 年的 AI 将更接近最优，而符号学习（symbolic learning）是实现这一目标的关键路径。Chollet 认为现有深度学习架构在数据和算力利用上远未达到理论极限。

行业 François Chollet 符号学习深度学习效率 AI趋势

推荐理由：AI 大神 Chollet 直言现在的深度学习数据效率差 1000 倍、算力差 10000 倍，未来要靠符号学习翻盘。

原文

13:50

阿里云 Alibaba Cloud@alibaba_cloud

在Flink Forward Asia Shenzhen 2026上，NVIDIA的Chuan Chen介绍了与阿里云的技术合作。双方通过CUDA库加速Apache Flink的多模态数据流处理。这一开源协作实现了端到端高性能多模态流式架构，适用于AI评论、实时图文流和交互式问答。

行业 NVIDIA Alibaba Cloud Apache Flink CUDA 多模态

推荐理由：NVIDIA和阿里云用CUDA把Flink的多模态数据处理速度拉满了，想做实时AI评论或图文问答的可以看看这个架构。

原文

13:50

阿里云 Alibaba Cloud@alibaba_cloud

阿里云宣布 HappyHorse 1.1 即日起作为 Creative Fabrica Studio 的默认 AI 视频生成模型上线。新模型提供更快的生成速度和更高的视频质量。为庆祝升级，所有使用 HappyHorse 1.1 的视频生成享 50% 折扣，优惠持续一周。该模型面向设计师、营销人员和内容创作者开放。

AI模型 HappyHorse 1.1 Creative Fabrica Studio Alibaba Cloud 视频生成

推荐理由：阿里云升级了HappyHorse 1.1，现在Creative Fabrica Studio默认用它生成视频，速度更快画质更好，而且这周所有视频生成都打五折。

原文

13:50

阿里云 Alibaba Cloud@alibaba_cloud

阿里巴巴云Qwen团队将于2026年6月30日举办Qwen Live第一集直播，主题为Agent-First。Qwen云负责人Linlin Kong与产品经理Pan Gu、Xijue将分享从零构建智能体云平台的经验。直播将重新定义面向非人类用户的开发者体验，并探讨大规模人机协作的新范式。

技巧 Qwen 阿里云智能体云平台开发者体验

推荐理由：想搞智能体云平台？Qwen这期直播讲从零搭建、非人类用户开发体验，做agent的开发者别错过。

原文

13:50

阿里云 Alibaba Cloud@alibaba_cloud

精选

在 Flink Forward Asia Shenzhen 2026 上，阿里巴巴云研究员冯王提到，AI 时代模型与数据共同决定智能体质量。Apache Flink 升级为 Agentic Streaming for AI，并与 Agentic Lake 协同，构建面向 AI 的原生数据基础设施。该架构支持实时代理工作流，为下一代智能体提供统一数据底座。

AI模型 Apache Flink Agentic Streaming Agentic Lake 阿里巴巴流处理

推荐理由：阿里巴巴把 Apache Flink 改造成专门给 AI 智能体用的实时流处理引擎，和 Agentic Lake 搭着用，比传统批处理更适合 Agent 场景。

原文

13:50

阿里云 Alibaba Cloud@alibaba_cloud

在Flink Forward Asia Shenzhen 2026上，阿里云CTO李飞飞提出“数据重力”将成为AI代理时代的主导概念。他强调AI必须解决复杂企业工作流并创造实际业务价值，而非仅追求模型智能。该观点针对Apache Flink等实时数据处理生态中的AI集成场景，呼吁行业关注AI在企业级应用中的落地效率。

行业 Alibaba Cloud Apache Flink Data Gravity 智能体企业工作流

推荐理由：阿里云CTO李飞飞在Flink Forward大会上点名数据重力概念，说的是AI怎么真正帮企业干活，不是光比模型分数。

原文

13:50

阿里云 Alibaba Cloud@alibaba_cloud

阿里云推出HappyHorse 1.1视频生成模型，已在ComfyUI、runware、fal、replicate、Picsart等平台集成。开发者可通过阿里云Model Studio直接调用模型进行创作。该版本优化了视频生成质量和效率。

AI模型 HappyHorse Alibaba Cloud ComfyUI 视频生成 open source

推荐理由：阿里云最新的视频生成模型HappyHorse 1.1，ComfyUI和Fal这些平台都已经接上了，想试试直接去Model Studio玩。

原文

13:50

阿里云 Alibaba Cloud@alibaba_cloud

阿里云推出Constraint Infra，为AI Agent提供安全治理层。它通过Nacos实现prompt和规则的动态热更新。支持Token限制和多智能体安全策略。StarOps SRE Agent在此框架内安全执行高风险任务。规则通过AgentLoop数据飞轮自我迭代。

AI产品 Alibaba Cloud Constraint Infra Nacos 智能体安全 Agent治理

推荐理由：阿里云出了个Agent安全治理框架，能动态控制prompt和规则，还能限制token，让高风险任务也安全运行。适合搞Agent开发的团队。

原文

13:50

阶跃星辰 Stepfun@Stepfun_AI

Step Plan 专为 Agent 工作流设计，用户只需连接一次即可持续构建和实验。它在 Claude Code 中集成了 Step 3.7 Flash 模型，大幅降低每次 API 调用的管理成本。开发者 @codedailyML 用 Step Plan 制作了 Tarot 生成器 demo，验证了工作流的便捷性。

技巧 Step Plan StepFun Claude Code Step 3.7 Flash 智能体

推荐理由：StepFun 的 Step Plan 让你在 Claude Code 里连一次就能持续调模型，不用反复写 API，看那个 Tarot 生成器 demo 就知道了。

原文

13:50

阶跃星辰 Stepfun@Stepfun_AI

StepFun 根据开发者反馈发现，当 Agent 开始实际工作时，计费机制会干扰工作流。为此推出了 Step Plan，旨在降低这种干扰。同时发布了 Step 3.7 Flash 模型，配合 Claude Code 使用。这个组合可以让开发者在编程场景下更专注于任务本身。

AI产品 Step Plan Step 3.7 Flash Claude Code 智能体编程助手

推荐理由：StepFun 搞了个 Step Plan，专治 Agent 干活时的计费麻烦，还搭了 Step 3.7 Flash 和 Claude Code，编程省心不少。

原文

13:50

阶跃星辰 Stepfun@Stepfun_AI

StepFun宣布与Cline合作，将其Step 3.7 Flash模型集成到Cline中。该模型专为代理式编程工作流设计，具备能力、速度和可靠性。从即日起，Cline用户可免费使用Step 3.7 Flash一个月。用户只需在Cline中输入'/model → Step 3.7 Flash'即可切换。

AI模型 Step 3.7 Flash Cline 编程助手智能体

推荐理由：StepFun把自家Step 3.7 Flash模型免费给Cline用一个月，写代码的代理工作流更稳更快了，试试看。

原文

13:50

阶跃星辰 Stepfun@Stepfun_AI

StepFun（阶跃星辰）推出初创公司计划，为早期AI团队提供支持。入选团队可获得API额度、专属生态系统支持、联合营销机会、展示位置及合作伙伴引荐。该计划面向构建多模态应用和智能体系统的团队。申请现已开放。

行业 StepFun 多模态智能体初创计划

推荐理由：StepFun给早期AI团队送API额度、资源和曝光，做多模态或智能体项目的小伙伴可以试试，链接在推文里。

原文

13:50

阶跃星辰 Stepfun@Stepfun_AI

精选

StepFun 发布 Step 3.7 Flash 模型，专为高效智能体工作负载设计。该模型具备原生多模态理解、强智能体编程能力、可靠工具调用以及网页与视觉搜索工作流。模型已通过 Novita Labs 在 OpenRouter 平台上提供。StepFun 称这是为生产级 AI 智能体打造的高效方案。

AI模型 Step 3.7 Flash StepFun Novita Labs OpenRouter 智能体

推荐理由：StepFun 刚出了 Step 3.7 Flash，专为智能体打造的模型，多模态、能编程、会搜图搜网页，现在就能在 OpenRouter 上试。

原文

13:49

阶跃星辰 Stepfun@Stepfun_AI

精选

Step 3.7 Flash 是开源多模态推理模型，现已在 DeepInfra API 上线。该模型支持私有端点部署，适用于专用负载场景。它专为智能体编码、工具使用、搜索和视觉工作流设计。开发者可通过 DeepInfra 的 API 直接调用。

AI模型 Step 3.7 Flash DeepInfra 多模态推理模型开源模型

推荐理由：Step 3.7 Flash 开源多模态推理模型刚上线 DeepInfra，支持私有部署，适合智能体编程和视觉任务，开发者可以试试。

原文

13:49

Microsoft AI@MicrosoftAI

微软宣布MAI-Code-1-Flash模型现已面向GitHub Copilot Business和Enterprise用户全面开放。该模型专注于代码生成，强调速度和效率，旨在帮助开发者用更少资源构建更多功能。MAI-Code-1-Flash是微软内部开发的轻量级代码模型，针对商业和企业级使用场景优化。通过集成到GitHub Copilot，用户可直接在代码编辑器中获得实时补全和建议。

AI模型 MAI-Code-1-Flash GitHub Copilot Microsoft 编程助手代码生成

推荐理由：微软把自家MAI-Code-1-Flash模型放进GitHub Copilot了，写代码更快更省资源，Business和Enterprise用户赶紧试试。

原文

13:49

Microsoft AI@MicrosoftAI

微软AI在X上发布视频，展示团队成员如何解决机器学习中的难题。视频中研究人员探讨了改进LLM训练效率的新思路。团队还分享了在推理模型优化上的实践。

行业 Microsoft AI 推理模型训练优化

推荐理由：看看微软AI团队怎么解决实际技术难题，了解模型背后的人

原文

13:49

Microsoft AI@MicrosoftAI

精选

微软推出新编程模型 MAI-Code-1-Flash，在真实 GitHub Copilot 环境中训练，具备高速和 token 高效特性。该模型可通过 VS Code 的 Copilot Chat 完成规划、构建、运行和测试。演示中，它从单个 frost banner 生成完整季节性快照并通过测试，耗时几分钟，成本仅几美分。

AI模型 MAI-Code-1-Flash Microsoft 编程助手代码生成 GitHub Copilot

推荐理由：微软出了个新模型 MAI-Code-1-Flash，直接在 Copilot 里跑，能自动把草图变成完整测试通过的代码，又快又便宜。

原文

13:49

Microsoft AI@MicrosoftAI

微软的 MAI-Image-2.5 在 Artificial Analysis 的文本到图像榜单中排名第2，图像编辑排名第3。该模型能对图像进行精确编辑，例如将雨窗模糊场景转换为清晰街景，同时保持物体一致性、光照、反射和场景几何。模型现已通过 Foundry API、MAI Playground 和 OpenRouter 提供使用。

AI模型 MAI-Image-2.5 Microsoft 图像生成图像编辑多模态

推荐理由：微软 MAI-Image-2.5 图像生成排第2、编辑排第3，还能把雨窗变清晰，想用去 Foundry API 或 OpenRouter 试试。

原文

13:49

Microsoft AI@MicrosoftAI

精选

微软AI用VS Code分支构建原型，让MAI-Transcribe、MAI-Voice和MAI-Code-1-Flash三个模型协同工作。用户说出编程指令，语音转录并解析后直接生成可运行代码。此流程将语音、转录和编码模型串联成一个统一工作流。原型展示了多模型协作在开发工具中的落地可能。

AI产品 MAI-Transcribe MAI-Voice MAI-Code-1-Flash 微软语音转代码

推荐理由：微软把语音识别和代码生成串起来了，对着VS Code说话就能写代码，适合想偷懒的程序员试试。

原文

13:49

Microsoft AI@MicrosoftAI

微软AI在推文中介绍了构建编码模型的全流程，包括训练阶段的优化策略、评估方法、性能调优、安全性考量以及收集真实开发者反馈。文章深入展示了从模型设计到部署的每个环节，帮助理解如何让编码模型适配开发者的实际工作场景。

AI模型微软AI 编码模型模型训练 AI安全编程助手

推荐理由：微软AI分享了他们训练编码模型的实战细节，从评估到安全都有，做编程助手的人值得看看。

原文

13:49

Google Labs@GoogleLabs

Google Labs 的 Project Genie 在2025年戛纳创意节上获得AI Craft类别的全场大奖（Grand Prix）。该奖项表彰其在AI创意领域的卓越表现。这是Google Labs社区共同参与的结果。

行业 Project Genie Google Labs 戛纳创意节 AI创意

推荐理由：Google Labs的Project Genie拿了戛纳大奖，AI Craft类别最高荣誉，看看他们怎么用AI做创意。

原文

13:49

阶跃星辰 Stepfun@Stepfun_AI

StepFun 的 Step 3.7 Flash 模型已在 AI 平台 ZenMuxAI 上架。该模型支持多模态输入，针对实际工作流优化，推理速度较快。用户可在 ZenMuxAI 上免费使用该模型30天。

AI模型 Step 3.7 Flash ZenMux StepFun 多模态免费试用

推荐理由：StepFun 的新模型 Step 3.7 Flash 上线 ZenMux，多模态且快，还能免费用一个月，想试试的别错过。

原文

13:49

Jasper AI@heyjasperai

精选72°

Jasper Research 宣布推出 MONET 数据集，从 29 亿张图片中精炼出 1.049 亿张高质量样本，成为全球最大的开放文本-图像数据集。该数据集采用 Apache 2.0 许可，可免费商用。同时发布的 nano-t2i 方案支持在单张 GPU 上训练有竞争力的文生图模型。

AI模型 MONET Jasper Research nano-t2i Apache 2.0 多模态

推荐理由：Jasper Research 放出了 MONET 数据集，有 1 亿多张图，免费商用，还能用 nano-t2i 在单卡上训练模型，做文生图的值得试试。

原文

13:49

Together AI@togethercompute

GLM-5.2模型已在Together AI平台上架，并通过OpenRouter快速提供服务。Together AI优化推理路径，使模型在长上下文编码和智能体工作负载中每GPU能处理更多token，同时保持低延迟。该模型展现出强劲性能，适合需要高吞吐的复杂任务。

AI模型 GLM-5.2 Together AI OpenRouter 推理模型长上下文

推荐理由：GLM-5.2跑得快，长上下文和智能体场景下Together的优化让token更多更流畅，试试看。

原文

13:49

Jasper AI@heyjasperai

Jasper 发布了 Slack Agent，这是一个直接集成在 Slack 中的 AI 工具。用户可以在对话线程中用它生成、总结和修订内容，无需切换到其他应用。该功能旨在将聊天讨论快速转化为初稿，减少工具切换带来的效率损失。

AI产品 Jasper Slack Agent 内容生成智能体

推荐理由：Jasper 把内容生成塞进 Slack 了，团队可以直接在聊天里改稿子，不用再跳来跳去。

原文

13:49

Ethan Mollick@emollick

该推文指出开放科学和透明方法论在AI论文撰写中带来更多好处。

行业开放科学方法论

推荐理由：一条关于开放科学价值的简短点评。

原文

13:49

Ethan Mollick@emollick

OpenAI目前尚未推出GPT-6模型。有观点猜测该标签可能被保留给更先进的下一代模型。GPT-4o等现有模型已覆盖多种能力。OpenAI的模型命名策略尚未公开说明。

行业 GPT-6 OpenAI 模型迭代

推荐理由：看看大家对OpenAI下一代模型命名的猜想，挺有意思的，虽然没干货但能勾起好奇心。

原文

13:49

Ethan Mollick@emollick

AA-Briefcase评分由@ArtificialAnlys发布，用于衡量AI完成多周复杂咨询任务的能力。最新得分曲线显示，AI模型在短期内取得了快速进步。开放权重模型与封闭模型之间存在明显的差距，封闭模型整体表现更优。该评测揭示了当前AI在多步骤复杂任务中的能力差异。

AI模型 AA-Briefcase 开放模型封闭模型 AI基准

推荐理由：新评测让AI做多周复杂咨询，结果看到开放模型和封闭模型差距挺大，进步也很快。

原文

13:49

Ethan Mollick@emollick

GLM-5.2是一款开源模型，其性能不及GPT-5.5和Opus 4.8，更远不及Mythos。但它表现扎实，表明开源模型持续追赶前沿。当前开源权重已触及GPT-5.2水平，在该能力区间表现显著。这一进展说明开源模型正在缩小与闭源前沿的差距。

AI模型 GLM-5.2 GPT-5.5 Opus 4.8 Mythos 开源模型

推荐理由：GLM-5.2虽然没追上GPT-5.5，但开源模型又往前迈了一大步，能力提升明显，值得关注。

原文

13:49

Ethan Mollick@emollick

Ethan Mollick 指出，所有模型路由器（model routers）在处理非数学/编程任务时，普遍低估任务难度并分配过少的智能资源。他建议，对于不可验证的任务（如创新、营销、定性分析），使用更智能的模型往往能带来更大收益。这一观点源于他对多种路由器实际表现的经验观察。

技巧 model routers 任务分配推理模型非数学任务

推荐理由：Ethan Mollick 分享了一个容易被忽视的问题：模型路由器的任务分配不够智能，尤其对创意和分析类任务。如果你也发现一些任务结果不好，可能不是模型不行，是路由器给它派了太弱的模型。

原文

13:48

岚叔@lufzzliz

推文作者表达了对xAI下一代模型Grok 4.5的强烈期待。作者认为xAI可能拥有过多计算资源用于Grok 4.5的训练。希望Grok 4.5能训练得更出色并支持SpaceX。

行业 Grok 4.5 xAI SpaceX 模型训练

推荐理由：这位网友对Grok 4.5很有信心，还调侃xAI显卡太多不如自己用。看看民间对xAI新模型的态度。

原文

13:48

Ethan Mollick@emollick

一项实验测试了AI在端到端编码任务中的能力。Opus 4.7在14小时内构建了一个软件包，相当于人类工程师2-17周的工作量，总花费251美元。虽然模型仍不完美，但进步速度显著。

AI模型 Opus 4.7 编程助手编码能力 AI基准测试

推荐理由：Opus 4.7只用14小时和251块就干完了人类几周的活，虽然还有瑕疵，但进步真的快。

原文

13:48

岚叔@lufzzliz

文章指出长期依赖AI生成代码会削弱工程师的沉浸式创造能力和职业满足感。作者用历史小说家批量生产而非亲自研究写书的类比，说明类似问题。他自述使用Claude和Codex几个月后，写代码变得懒散迟钝，遇到复杂问题第一反应是让AI找bug或写修复。文章警告AI批量产生的代码如同“数字塑料垃圾”，便宜但长期污染软件生态。

技巧 Claude Codex 编程助手软件工程

推荐理由：这篇很真实，说透了AI用得越多，自己越容易变懒，得先自己思考再让AI动手。

原文

13:48

Ethan Mollick@emollick

技巧 GLM-5.2 Opus 4.8 提示词工程推理模型

推荐理由：想看看AI怎么思考？让GLM-5.2或Opus 4.8帮你选诗，能看到它的推理过程，挺有意思的。

原文

13:48

岚叔@lufzzliz

tokei v1.08 新增Claude Code按模型查看详情功能，可对每个模型（如GLM-5.2）单独分析费用。全局视角支持本机/全部设备查看。回顾页面新增“Loop Engineering”和“Loop滴神”成就：连续3天/30天每天24小时有Agent运行即可获得。新增对Qoder、QoderWork Agent的计算支持。

AI产品 tokei Claude Code Qoder QoderWork 智能体

推荐理由：tokei更新了，现在能按模型看Claude Code花了多少钱，还有连续跑Agent的成就系统，适合想精细控制AI开支的开发者。

原文

13:48

岚叔@lufzzliz

K神定义LLM UI/UX第三次变革，将LLM视为独立可持续运行的系统，拥有全组织工具和上下文，与人协同。作者基于Pi实现组织内agent交互，支持不同群组不同的记忆、知识库、技能和模型。该系统可应用于客户群交互，实现高效丝滑协同。

行业 Pi 智能体 LLM 协同

推荐理由：K神提出了新的LLM交互思路，作者已经用Pi搭建了能按群组定制的智能体系统，对企业协作很有参考价值。

原文

13:48

岚叔@lufzzliz

在世界杯小组赛预测中，GLM-5.2在比分榜综合最强，GPT-5.5在胜负榜综合最强且命中率达70%。淘汰赛阶段取消24小时限制，可一次性预测16场比赛。作者分享了提示词示例："继续预测，可以提交淘汰赛16场的比赛，你需要仔细分析给出你的答案、并提交"。同时附带了opus-4.8和deepseekv4-pro的预测结果。

技巧 GLM-5.2 GPT-5.5 提示词工程智能体世界杯

推荐理由：作者用GLM-5.2和GPT-5.5预测世界杯，GPT-5.5命中率70%，还给了淘汰赛提示词，试试用自己的agent玩。

原文

13:48

岚叔@lufzzliz

GPT-5.5-Cyber 在安全基准 CyberGym 上击败了 Mythos 5，取得领先成绩。使用该模型需向官方申请权限，个人和企业均可，用途限定为授权防御场景，如漏洞研究、红队、渗透测试、恶意软件分析、威胁情报、事件响应。此外，Codex 推出了新插件，可利用 gpt-5.5（reasoning 设 high/xhigh）进行代码安全扫描与修复。

AI模型 GPT-5.5-Cyber Mythos 5 CyberGym 安全模型 Codex

推荐理由：GPT-5.5-Cyber 在安全基准 CyberGym 上直接碾压了 Mythos 5，想搞红队或漏洞分析的话可以申请权限试试。

原文

仅展示最近 2000 条内容。更早的内容请查阅 AI 日报存档（侧边栏 → AI 日报 → 顶部「往期日报」）。