全部 AI 动态 · AI 热点

AITOP

6月30日

00:17

Hunyuan@TXhunyuan

12款中国AI模型对世界杯32强比赛结果进行了预测。首轮榜单显示，腾讯混元（Tencent Hy）成功预测29场，以29/32的准确率排名第一。其他11款模型的具体准确率未在文中列出。现在比赛进入淘汰赛阶段，后续预测将更具挑战性。

AI模型腾讯混元世界杯预测 AI模型

推荐理由：腾讯混元29/32比其他AI猜得准，看看淘汰赛还能不能撑住。

原文

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

6月12日

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？

6月10日

17:49

Geek@geekbb

精选72°

腾讯混元团队开源了 UniRL 框架，它将强化学习后训练流程（采样、打分、计算优势、更新策略、同步权重）统一应用于多种多模态模型。该框架同时支持图像/视频扩散模型和自回归语言模型，为多模态 AI 的后训练提供了标准化方案。UniRL 解决了不同模态模型在 RL 后训练中流程不统一、实现复杂的问题，降低了多模态强化学习的门槛。开发者可以直接在 GitHub 上获取代码并尝试。

AI产品腾讯混元 UniRL 强化学习多模态模型开源/仓库

推荐理由：做多模态模型后训练的团队终于有了统一框架——UniRL 把扩散模型和语言模型的 RL 流程标准化了，省去重复造轮子的时间，值得直接上手试。

原文

6月9日

22:19

Hunyuan@TXhunyuan

72°

腾讯混元团队推出UniRL，一个面向统一多模态模型的强化学习基础设施。该框架支持扩散模型、流匹配模型、大语言模型（LLM）和视觉语言模型（VLM）的强化学习训练，并同时发布两个新算法：DRPO和Flow-DPPO。UniRL旨在用一个强化学习循环覆盖多种模型类型，简化多模态模型的训练流程。代码已在GitHub开源，为多模态AI研究提供了新的基础设施选择。

AI模型强化学习多模态模型开源/仓库腾讯混元 UniRL

推荐理由：多模态模型训练一直面临框架碎片化问题，UniRL用一个RL循环统一了扩散、LLM和VLM，做多模态研究的团队可以直接用开源代码降低实验成本。

原文

22:18

Hunyuan@TXhunyuan

72°

腾讯混元开源了UniRL，一个统一的多模态强化学习训练框架。它用一个循环（生成→评分→优势计算→更新→同步）覆盖文本、图像、视频等多种模态，模型和算法作为独立轴，实现模型×算法的组合覆盖。内置FlowDPPO和DRPO两种原创算法，分别针对扩散模型和LLM的强化学习优化。支持可插拔的rollout引擎、FSDP2分片和三种部署模式，旨在解决现有RL栈只能处理单一模态的问题。

AI产品腾讯混元 UniRL 多模态强化学习开源/仓库

推荐理由：做多模态RL训练的团队终于有了一个能统一处理文本、图像、视频的框架，不用再为每种模态搭不同的栈。腾讯混元把自家模型验证过的FlowDPPO和DRPO算法也开源了，做扩散模型或LLM RL优化的可以直接拿来用。

原文

6月8日

16:42

Hunyuan@TXhunyuan

精选72°

腾讯混元与上海交大、南洋理工等机构合作推出 MMAE，这是首个针对语音和音频编辑的综合评估基准。与单纯生成音频不同，MMAE 要求 AI 理解现有音频并根据自然语言指令精确修改，保留无关部分。基准包含 2000 个真实场景样本、17741 个细粒度评估项，覆盖声音、音乐、语音及其混合的 7 种模态设置。当前模型在精确匹配率（EMR）上低于 5%，揭示了可靠音频编辑的巨大差距。该基准已开源，包含论文、代码和演示。

论文音频编辑评估基准腾讯混元多模态开源

推荐理由：音频编辑是 AI 落地的重要场景，MMAE 基准揭示了现有模型的巨大短板，做音频 AI 或语音交互的开发者值得关注这个评估工具。

原文

6月5日

20:42

20:42IT之家（博客/媒体）

72°

腾讯混元团队提出 Stem 稀疏注意力算法，已被 ICML-26 收录。该算法通过 Token 位置衰减和输出感知度量两大创新，仅用 25% 算力即可逼近稠密注意力的精度。配套的 HPC 算子库将理论加速转化为实际性能，在 128K 上下文下首字延迟降低 3.6 倍。该方案为长文本推理场景提供了高效、低成本的注意力加速方案，相关论文和代码已开源。

论文稀疏注意力长文本推理腾讯混元 ICML-26 开源/仓库

推荐理由：长文本推理的延迟痛点终于有了低成本解法——Stem 用 25% 算力实现近无损精度，做 LLM 推理优化的团队可以直接用开源代码实测，128K 上下文下首字延迟降低 3.6 倍的效果值得关注。

原文

20:08

berryxia@berryxia

76°

腾讯混元与人大高瓴人工智能学院联合开源了PlanningBench，一个专门评估和训练LLM真实规划能力的框架。该框架包含30多个来自真实世界的规划任务，覆盖调度、生产、旅行、资源分配和应急响应六大类，每个任务都有清晰的成功标准和全自动验证机制。用户既可以用它测试当前最强模型的规划能力，也可以直接用于微调，让模型从“会说”进化到“会干”。PlanningBench揭示了规划能力是智能体从玩具走向生产力的关键分水岭，腾讯已将论文、代码和数据集全部开源。

AI模型规划能力 PlanningBench 腾讯混元智能体开源/仓库

推荐理由：PlanningBench把规划能力从黑盒拉到公开赛道，做智能体开发的团队可以直接用它测模型短板、微调训练，让AI从“会聊天”真正进化到“会干活”。

原文

17:03

Hunyuan@TXhunyuan

72°

腾讯混元与中国人民大学高瓴人工智能学院合作开源了PlanningBench，这是一个可扩展、可验证的框架，用于评估和训练大语言模型的规划能力。该框架包含30多个真实世界的规划任务，支持自动验证，并提供评估和训练支持。PlanningBench旨在帮助LLM从“说”转向“做”，即提升其实际规划与执行能力。该框架已在arXiv发布论文，代码在GitHub开源，数据集在HuggingFace上可用。

论文规划能力评估框架开源/仓库腾讯混元 LLM

推荐理由：PlanningBench解决了LLM规划能力评估缺乏标准化基准的问题，做AI Agent或任务规划的研究者和开发者可以直接用这个框架测试和训练模型，建议点开看看具体任务和验证方式。

原文

6月1日

20:05

Hunyuan@TXhunyuan

精选

腾讯混元正式发布 Hy-Memory，这是一个专为长期协作智能体（如 OpenClaw）设计的内存插件。它采用 6 层记忆框架、System1/System2 双系统以及三层进化链，旨在解决智能体记忆碎片化问题。相比传统方案，Hy-Memory 可减少 70% 以上的记忆数量，提升 45% 以上的信息密度，在超长上下文中节省 35% 的 token 用量，并实现 20% 更快的记忆更新。该插件让智能体能够更持久、准确、轻量地记住信息，从而更好地理解用户需求。

AI产品智能体记忆插件腾讯混元 Hy-Memory 长期协作

推荐理由：做长期协作智能体开发的团队终于有了专门优化记忆的插件——Hy-Memory 解决了记忆碎片化和 token 浪费的痛点，建议做 Agent 应用的开发者直接试试。

原文

5月28日

23:05

23:05IT之家（博客/媒体）

76°

腾讯混元推出 Hy-Memory，一款专为 Openclaw 等长期协作型 Agent 设计的记忆插件，旨在解决 Agent 在长期使用中的记忆碎片化、遗忘关键判断等问题。Hy-Memory 采用 6 层记忆框架、System1/System2 双系统设计和演化链机制，让 Agent 能“记得住、记得对、记得轻、更懂你”。在权威测试中，Hy-Memory 效果超过现有主流框架，记忆数量降低 70%+，信息密度提升 45%+，token 消耗降低 35%，记忆更新速度快 20%。该插件通过分层存储和异步处理，既保证了实时响应速度，又实现了深度认知迭代，让 Agent 越用越懂用户。

AI产品记忆插件 Agent 腾讯混元 Hy-Memory 长期协作

推荐理由：长期使用 Openclaw 的开发者常遇到“三周轨迹”困境——从蜜月期到降级使用，Hy-Memory 直接解决了这个痛点。做 Agent 应用或依赖 AI 协作的团队，建议试试这个插件，能让你的 Agent 真正成为长期记忆伙伴。

原文

5月22日

13:06

Hunyuan@TXhunyuan

腾讯混元宣布与WMT26（第26届机器翻译研讨会）组织者正式合作，共同举办视频字幕翻译竞赛。该竞赛基于腾讯混元先进的Hy-MT系列模型，参赛者还可参与通用机器翻译竞赛。优胜者将获得特别大奖，旨在推动机器翻译技术的发展。腾讯混元邀请研究者、开发者、AI爱好者及所有对机器翻译感兴趣的人士注册参与。

行业腾讯混元 WMT26 机器翻译视频字幕竞赛

推荐理由：这是腾讯混元在机器翻译领域的一次重要合作，做视频翻译或字幕处理的团队可以借此机会测试前沿模型，参赛还有机会赢取大奖，值得关注。

原文

5月21日

20:19

Hunyuan@TXhunyuan

腾讯混元发布 Hy-MT2 开源多语言翻译模型，支持 33 种语言无缝互译。7B 和 30B-A3B 版本在多项翻译任务上超越参数大数十倍的模型，轻量 1.8B 版本甚至优于微软等商业 API。模型采用腾讯 AngelSlim 1.25-bit 极致量化，仅需 440MB 存储，可在主流移动芯片上本地推理，速度比 Hy-MT1.5 快 1.5 倍。项目已在 GitHub、Hugging Face 等平台开源。

AI模型开源/仓库翻译模型腾讯混元量化多语言

推荐理由：做多语言翻译的开发者终于有了能本地跑的开源模型——Hy-MT2 的 1.8B 版本比微软 API 还强，且量化后仅 440MB，手机芯片就能推理，建议直接下载试试。

原文

17:31

17:31IT之家（博客/媒体）

腾讯混元发布新一代多语言翻译模型 Hy-MT2 并正式开源，包含 1.8B、7B、30B-A3B 三种尺寸，支持 33 种语言互译及 5 种民族语言/方言互译。轻量级 1.8B 模型通过极端量化仅需 440MB 存储空间，可在苹果、高通、联发科等手机芯片上本地部署，推理速度比上一代提升 1.5 倍，且性能超越微软等主流商业 API。同步推出的腾讯 Hy 翻译小程序支持语音输入、自定义翻译风格和离线翻译，解决了弱网络场景下的翻译需求。IFMTBench 翻译指令遵循测试集也一并开源，用于评估模型对翻译风格、术语指定等指令的遵循能力。

AI模型翻译模型开源/仓库腾讯混元端侧部署多语言

推荐理由：手机端就能跑的高质量翻译模型来了，做本地化应用、离线翻译工具或移动端 AI 产品的开发者可以直接下载试用，440MB 的轻量版值得关注。

原文