07:12IT之家(博客/媒体)78°OpenAI 宣布升级 ChatGPT 记忆系统,基于 Dreaming V3 机制,重点解决记忆过时和准确性不足的问题。新系统能自动整合聊天历史中的关键信息,生成摘要式记忆,用户可查看、修改或追问细节。相比早期版本,新系统在保持个性化效果的同时,将服务免费用户所需算力降至原来的五分之一。美国 Plus 和 Pro 用户即日起可体验,记忆容量提升至两倍。AI产品ChatGPT记忆系统Dreaming V3个性化算力优化10 个信源在谈推荐理由:ChatGPT 重度用户终于不用反复交代背景了——新记忆系统自动更新、更准更省算力,Plus/Pro 用户今天就能体验,免费用户也快了。原文
12:05AI Will@FinanceYF5精选ZEDA是一种针对混合专家模型(MoE)的后训练方法,通过自蒸馏技术让模型学会在推理时跳过半数专家,从而大幅降低计算成本。与传统的剪枝不同,ZEDA赋予模型“算力预算意识”,使其能根据每个token的重要性动态决定是否投入计算资源。该方法在保持性能的同时显著提升效率,为大规模MoE模型的部署提供了新思路。论文已发布在arXiv上。论文MoE/混合专家模型压缩/加速自蒸馏算力优化ZEDA推荐理由:做MoE模型部署或推理优化的团队,ZEDA直接解决了算力浪费问题——跳过一半专家还能保持效果,值得一试。原文