20:42IT之家(博客/媒体)72°腾讯混元团队提出 Stem 稀疏注意力算法,已被 ICML-26 收录。该算法通过 Token 位置衰减和输出感知度量两大创新,仅用 25% 算力即可逼近稠密注意力的精度。配套的 HPC 算子库将理论加速转化为实际性能,在 128K 上下文下首字延迟降低 3.6 倍。该方案为长文本推理场景提供了高效、低成本的注意力加速方案,相关论文和代码已开源。论文稀疏注意力长文本推理腾讯混元ICML-26开源/仓库推荐理由:长文本推理的延迟痛点终于有了低成本解法——Stem 用 25% 算力实现近无损精度,做 LLM 推理优化的团队可以直接用开源代码实测,128K 上下文下首字延迟降低 3.6 倍的效果值得关注。原文
23:05IT之家(博客/媒体)76°腾讯混元推出 Hy-Memory,一款专为 Openclaw 等长期协作型 Agent 设计的记忆插件,旨在解决 Agent 在长期使用中的记忆碎片化、遗忘关键判断等问题。Hy-Memory 采用 6 层记忆框架、System1/System2 双系统设计和演化链机制,让 Agent 能“记得住、记得对、记得轻、更懂你”。在权威测试中,Hy-Memory 效果超过现有主流框架,记忆数量降低 70%+,信息密度提升 45%+,token 消耗降低 35%,记忆更新速度快 20%。该插件通过分层存储和异步处理,既保证了实时响应速度,又实现了深度认知迭代,让 Agent 越用越懂用户。AI产品记忆插件Agent腾讯混元Hy-Memory长期协作4 个信源在谈推荐理由:长期使用 Openclaw 的开发者常遇到“三周轨迹”困境——从蜜月期到降级使用,Hy-Memory 直接解决了这个痛点。做 Agent 应用或依赖 AI 协作的团队,建议试试这个插件,能让你的 Agent 真正成为长期记忆伙伴。原文
17:31IT之家(博客/媒体)腾讯混元发布新一代多语言翻译模型 Hy-MT2 并正式开源,包含 1.8B、7B、30B-A3B 三种尺寸,支持 33 种语言互译及 5 种民族语言/方言互译。轻量级 1.8B 模型通过极端量化仅需 440MB 存储空间,可在苹果、高通、联发科等手机芯片上本地部署,推理速度比上一代提升 1.5 倍,且性能超越微软等主流商业 API。同步推出的腾讯 Hy 翻译小程序支持语音输入、自定义翻译风格和离线翻译,解决了弱网络场景下的翻译需求。IFMTBench 翻译指令遵循测试集也一并开源,用于评估模型对翻译风格、术语指定等指令的遵循能力。AI模型翻译模型开源/仓库腾讯混元端侧部署多语言推荐理由:手机端就能跑的高质量翻译模型来了,做本地化应用、离线翻译工具或移动端 AI 产品的开发者可以直接下载试用,440MB 的轻量版值得关注。原文