00:17Hunyuan@TXhunyuan12款中国AI模型对世界杯32强比赛结果进行了预测。首轮榜单显示,腾讯混元(Tencent Hy)成功预测29场,以29/32的准确率排名第一。其他11款模型的具体准确率未在文中列出。现在比赛进入淘汰赛阶段,后续预测将更具挑战性。AI模型腾讯混元世界杯预测AI模型推荐理由:腾讯混元29/32比其他AI猜得准,看看淘汰赛还能不能撑住。原文
17:49Geek@geekbb精选72°腾讯混元团队开源了 UniRL 框架,它将强化学习后训练流程(采样、打分、计算优势、更新策略、同步权重)统一应用于多种多模态模型。该框架同时支持图像/视频扩散模型和自回归语言模型,为多模态 AI 的后训练提供了标准化方案。UniRL 解决了不同模态模型在 RL 后训练中流程不统一、实现复杂的问题,降低了多模态强化学习的门槛。开发者可以直接在 GitHub 上获取代码并尝试。AI产品腾讯混元UniRL强化学习多模态模型开源/仓库推荐理由:做多模态模型后训练的团队终于有了统一框架——UniRL 把扩散模型和语言模型的 RL 流程标准化了,省去重复造轮子的时间,值得直接上手试。原文
22:19Hunyuan@TXhunyuan72°腾讯混元团队推出UniRL,一个面向统一多模态模型的强化学习基础设施。该框架支持扩散模型、流匹配模型、大语言模型(LLM)和视觉语言模型(VLM)的强化学习训练,并同时发布两个新算法:DRPO和Flow-DPPO。UniRL旨在用一个强化学习循环覆盖多种模型类型,简化多模态模型的训练流程。代码已在GitHub开源,为多模态AI研究提供了新的基础设施选择。AI模型强化学习多模态模型开源/仓库腾讯混元UniRL推荐理由:多模态模型训练一直面临框架碎片化问题,UniRL用一个RL循环统一了扩散、LLM和VLM,做多模态研究的团队可以直接用开源代码降低实验成本。原文
22:18Hunyuan@TXhunyuan72°腾讯混元开源了UniRL,一个统一的多模态强化学习训练框架。它用一个循环(生成→评分→优势计算→更新→同步)覆盖文本、图像、视频等多种模态,模型和算法作为独立轴,实现模型×算法的组合覆盖。内置FlowDPPO和DRPO两种原创算法,分别针对扩散模型和LLM的强化学习优化。支持可插拔的rollout引擎、FSDP2分片和三种部署模式,旨在解决现有RL栈只能处理单一模态的问题。AI产品腾讯混元UniRL多模态强化学习开源/仓库推荐理由:做多模态RL训练的团队终于有了一个能统一处理文本、图像、视频的框架,不用再为每种模态搭不同的栈。腾讯混元把自家模型验证过的FlowDPPO和DRPO算法也开源了,做扩散模型或LLM RL优化的可以直接拿来用。原文
16:42Hunyuan@TXhunyuan精选72°腾讯混元与上海交大、南洋理工等机构合作推出 MMAE,这是首个针对语音和音频编辑的综合评估基准。与单纯生成音频不同,MMAE 要求 AI 理解现有音频并根据自然语言指令精确修改,保留无关部分。基准包含 2000 个真实场景样本、17741 个细粒度评估项,覆盖声音、音乐、语音及其混合的 7 种模态设置。当前模型在精确匹配率(EMR)上低于 5%,揭示了可靠音频编辑的巨大差距。该基准已开源,包含论文、代码和演示。论文音频编辑评估基准腾讯混元多模态开源推荐理由:音频编辑是 AI 落地的重要场景,MMAE 基准揭示了现有模型的巨大短板,做音频 AI 或语音交互的开发者值得关注这个评估工具。原文
20:42IT之家(博客/媒体)72°腾讯混元团队提出 Stem 稀疏注意力算法,已被 ICML-26 收录。该算法通过 Token 位置衰减和输出感知度量两大创新,仅用 25% 算力即可逼近稠密注意力的精度。配套的 HPC 算子库将理论加速转化为实际性能,在 128K 上下文下首字延迟降低 3.6 倍。该方案为长文本推理场景提供了高效、低成本的注意力加速方案,相关论文和代码已开源。论文稀疏注意力长文本推理腾讯混元ICML-26开源/仓库推荐理由:长文本推理的延迟痛点终于有了低成本解法——Stem 用 25% 算力实现近无损精度,做 LLM 推理优化的团队可以直接用开源代码实测,128K 上下文下首字延迟降低 3.6 倍的效果值得关注。原文
20:08berryxia@berryxia76°腾讯混元与人大高瓴人工智能学院联合开源了PlanningBench,一个专门评估和训练LLM真实规划能力的框架。该框架包含30多个来自真实世界的规划任务,覆盖调度、生产、旅行、资源分配和应急响应六大类,每个任务都有清晰的成功标准和全自动验证机制。用户既可以用它测试当前最强模型的规划能力,也可以直接用于微调,让模型从“会说”进化到“会干”。PlanningBench揭示了规划能力是智能体从玩具走向生产力的关键分水岭,腾讯已将论文、代码和数据集全部开源。AI模型规划能力PlanningBench腾讯混元智能体开源/仓库1 个信源在谈推荐理由:PlanningBench把规划能力从黑盒拉到公开赛道,做智能体开发的团队可以直接用它测模型短板、微调训练,让AI从“会聊天”真正进化到“会干活”。原文
17:03Hunyuan@TXhunyuan72°腾讯混元与中国人民大学高瓴人工智能学院合作开源了PlanningBench,这是一个可扩展、可验证的框架,用于评估和训练大语言模型的规划能力。该框架包含30多个真实世界的规划任务,支持自动验证,并提供评估和训练支持。PlanningBench旨在帮助LLM从“说”转向“做”,即提升其实际规划与执行能力。该框架已在arXiv发布论文,代码在GitHub开源,数据集在HuggingFace上可用。论文规划能力评估框架开源/仓库腾讯混元LLM1 个信源在谈推荐理由:PlanningBench解决了LLM规划能力评估缺乏标准化基准的问题,做AI Agent或任务规划的研究者和开发者可以直接用这个框架测试和训练模型,建议点开看看具体任务和验证方式。原文
20:05Hunyuan@TXhunyuan精选腾讯混元正式发布 Hy-Memory,这是一个专为长期协作智能体(如 OpenClaw)设计的内存插件。它采用 6 层记忆框架、System1/System2 双系统以及三层进化链,旨在解决智能体记忆碎片化问题。相比传统方案,Hy-Memory 可减少 70% 以上的记忆数量,提升 45% 以上的信息密度,在超长上下文中节省 35% 的 token 用量,并实现 20% 更快的记忆更新。该插件让智能体能够更持久、准确、轻量地记住信息,从而更好地理解用户需求。AI产品智能体记忆插件腾讯混元Hy-Memory长期协作6 个信源在谈推荐理由:做长期协作智能体开发的团队终于有了专门优化记忆的插件——Hy-Memory 解决了记忆碎片化和 token 浪费的痛点,建议做 Agent 应用的开发者直接试试。原文
23:05IT之家(博客/媒体)76°腾讯混元推出 Hy-Memory,一款专为 Openclaw 等长期协作型 Agent 设计的记忆插件,旨在解决 Agent 在长期使用中的记忆碎片化、遗忘关键判断等问题。Hy-Memory 采用 6 层记忆框架、System1/System2 双系统设计和演化链机制,让 Agent 能“记得住、记得对、记得轻、更懂你”。在权威测试中,Hy-Memory 效果超过现有主流框架,记忆数量降低 70%+,信息密度提升 45%+,token 消耗降低 35%,记忆更新速度快 20%。该插件通过分层存储和异步处理,既保证了实时响应速度,又实现了深度认知迭代,让 Agent 越用越懂用户。AI产品记忆插件Agent腾讯混元Hy-Memory长期协作4 个信源在谈推荐理由:长期使用 Openclaw 的开发者常遇到“三周轨迹”困境——从蜜月期到降级使用,Hy-Memory 直接解决了这个痛点。做 Agent 应用或依赖 AI 协作的团队,建议试试这个插件,能让你的 Agent 真正成为长期记忆伙伴。原文
13:06Hunyuan@TXhunyuan腾讯混元宣布与WMT26(第26届机器翻译研讨会)组织者正式合作,共同举办视频字幕翻译竞赛。该竞赛基于腾讯混元先进的Hy-MT系列模型,参赛者还可参与通用机器翻译竞赛。优胜者将获得特别大奖,旨在推动机器翻译技术的发展。腾讯混元邀请研究者、开发者、AI爱好者及所有对机器翻译感兴趣的人士注册参与。行业腾讯混元WMT26机器翻译视频字幕竞赛推荐理由:这是腾讯混元在机器翻译领域的一次重要合作,做视频翻译或字幕处理的团队可以借此机会测试前沿模型,参赛还有机会赢取大奖,值得关注。原文
20:19Hunyuan@TXhunyuan腾讯混元发布 Hy-MT2 开源多语言翻译模型,支持 33 种语言无缝互译。7B 和 30B-A3B 版本在多项翻译任务上超越参数大数十倍的模型,轻量 1.8B 版本甚至优于微软等商业 API。模型采用腾讯 AngelSlim 1.25-bit 极致量化,仅需 440MB 存储,可在主流移动芯片上本地推理,速度比 Hy-MT1.5 快 1.5 倍。项目已在 GitHub、Hugging Face 等平台开源。AI模型开源/仓库翻译模型腾讯混元量化多语言推荐理由:做多语言翻译的开发者终于有了能本地跑的开源模型——Hy-MT2 的 1.8B 版本比微软 API 还强,且量化后仅 440MB,手机芯片就能推理,建议直接下载试试。原文
17:31IT之家(博客/媒体)腾讯混元发布新一代多语言翻译模型 Hy-MT2 并正式开源,包含 1.8B、7B、30B-A3B 三种尺寸,支持 33 种语言互译及 5 种民族语言/方言互译。轻量级 1.8B 模型通过极端量化仅需 440MB 存储空间,可在苹果、高通、联发科等手机芯片上本地部署,推理速度比上一代提升 1.5 倍,且性能超越微软等主流商业 API。同步推出的腾讯 Hy 翻译小程序支持语音输入、自定义翻译风格和离线翻译,解决了弱网络场景下的翻译需求。IFMTBench 翻译指令遵循测试集也一并开源,用于评估模型对翻译风格、术语指定等指令的遵循能力。AI模型翻译模型开源/仓库腾讯混元端侧部署多语言推荐理由:手机端就能跑的高质量翻译模型来了,做本地化应用、离线翻译工具或移动端 AI 产品的开发者可以直接下载试用,440MB 的轻量版值得关注。原文