全部 AI 动态 · AI 热点

AITOP

5月28日

03:09

Decoder@Matthias Bastian

AI模型微软 MAI-Image-2.5 谷歌 Nano Banana 2 文生图文本渲染

推荐理由：做营销素材和电商设计的团队可以关注——MAI-Image-2.5 的文本渲染能力直接对标谷歌，生成带字海报和产品图更靠谱，值得在内部测试中对比一下。

原文

03:05

阿里通义 Qwen@Alibaba_Qwen

76°

阿里 Qwen 团队联合多家合作伙伴，在 TokenSpeed 推理引擎上对 Qwen3.5 模型进行极致优化，实现了 580 tokens/秒的推理速度，创下智能体工作负载的新纪录。该成果得益于 NVIDIA GPU、FlashAttention-4 优化以及 PyTorch 社区的支持。这一里程碑展示了开源大模型在推理性能上的巨大潜力，尤其适合对延迟敏感的智能体应用场景。PyTorch 官方博客已发布完整技术细节。

AI模型 Qwen3.5 推理优化 TokenSpeed 开源/仓库智能体

推荐理由：580 tps 意味着智能体应用可以几乎实时响应，做 LLM 推理优化或 Agent 开发的团队值得关注这个开源方案，可以直接参考 PyTorch 博客里的实现细节。

原文

02:42

02:42Hugging Face: Blog（博客/媒体）

IBM与Artificial Analysis联合推出ITBench-AA，这是首个针对企业IT运维场景的智能体基准测试。测试涵盖事件响应、故障排查等真实任务，结果显示包括GPT-4、Claude在内的前沿模型平均得分低于50%。该基准揭示了当前AI智能体在处理复杂企业IT流程时的能力短板，为行业提供了可量化的评估标准。

AI模型智能体企业IT 基准测试 IBM 运维自动化

推荐理由：企业IT团队终于有了衡量AI智能体真实能力的标尺——前沿模型都不到50分，说明自动化运维还有很大提升空间，做IT运维或AI落地的建议点开看看差距在哪。

原文

01:12

marktechpost@Asif Razzaq

76°

NVIDIA 研究人员推出 Polar，一个 token 忠实展开框架，用于通过强化学习训练语言智能体，无需修改其智能体框架。Polar 在框架和推理服务器之间放置模型 API 代理，捕获 token 级交互并重建训练器就绪轨迹。基于 Qwen3.5-4B 基础模型使用 GRPO，Polar 在 Codex 框架下将 SWE-Bench Verified pass@1 提升 22.6 个百分点，在 Claude Code 下提升 4.8 个百分点，在 Pi 下提升 6.2 个百分点。该框架已注册为 NeMo Gym 环境，并在 ProRL Agent Server 仓库中发布。

AI模型 NVIDIA Polar GRPO 代码智能体强化学习

推荐理由：Polar 解决了 RL 训练智能体时需修改框架的痛点，做代码智能体或 RL 训练的开发者可以直接集成，无需改动现有工具链，值得一试。

原文

5月27日

23:55

Perplexity@perplexity_ai

精选

Perplexity AI发布的编码器在生产输入长度下，p50延迟比HuggingFace tokenizers低约5倍，比SentencePiece C++低2倍，比IREE C低1.5倍。在514 tokens的输入时，运行时间仅为63微秒，且实现零堆分配。该编码器专门针对长输入场景优化，显著提升推理效率。

AI模型 Perplexity AI HuggingFace SentencePiece 编码器性能优化

推荐理由：Perplexity AI编码器快了5倍

原文

20:57

berryxia@berryxia

腾讯HY实验室联合四家机构发布Chronicles-OCR基准测试，专门评估AI对3000年中国古文字的识别能力。测试包含2800张专家标注图像，覆盖甲骨文、金文、篆书等七大类古文字。结果显示28个前沿多模态模型全部失败，最强模型在甲骨文上仅14%准确率，GPT-5和Gemini 2.5 Pro接近0。更反直觉的是，开启推理模式反而降低表现，模型实际依赖载体（如龟壳、青铜器）而非文字本身进行分类。该测试揭示了AI在文化遗产领域的巨大挑战。

AI模型 OCR 古文字识别多模态模型基准测试文化遗产

推荐理由：这个基准测试戳破了多模态模型在古文字识别上的泡沫——它们根本没在认字，只是认载体。做文化遗产数字化或OCR研究的团队，看完会重新思考模型能力的边界。

原文

20:56

berryxia@berryxia

88°

Anthropic 于 2026 年 4 月 7 日发布 Project Glasswing 及 Claude Mythos Preview，该前沿模型网络攻防能力极强，因安全顾虑仅开放给合作伙伴用于防御。OpenAI 则在 5 月 20 日宣布其内部通用推理模型成功推翻数学家 Paul Erdős 的平面单位距离问题猜想。这两件事共同表明，前沿模型在更高抽象层面的可靠推理能力已迈过临界点，能稳定处理完整论证和知识体系，而非仅限片段操作。Claude Mythos Preview 在编码和网络安全评测中表现突出，多数基准测试超越 GPT-5.5。

AI模型推理模型网络安全数学证明 Anthropic OpenAI

推荐理由：AI 推理能力从片段到完整体系的跃迁，是开发者和安全从业者必须关注的分水岭——Claude Mythos 的防御性开放和 OpenAI 的数学突破，直接改变了模型应用边界，建议点开了解具体案例。

原文

20:19

berryxia@berryxia

MiniMax 在沉寂半年后，将去年 12 月开源的 M2 模型背后的设计思路、训练细节和系统架构整理成论文发布到 arXiv。社区已广泛采用其核心系统如 CISPO、Forge RL System 和 Self-Evolution。MiniMax 表示 M3 模型和 MSA 论文即将发布，此举旨在推动开源生态从单纯卷参数转向公开方法论。

AI模型开源/仓库强化学习 MiniMax M2 M3

推荐理由：MiniMax 把 M2 的完整训练路径摊开，做开源模型训练或强化学习的团队可以直接参考，少走半年弯路。M3 即将到来，值得关注其系统级突破。

原文

19:06

19:06IT之家（博客/媒体）

76°

Anthropic 工程师 Sholto Douglas 宣布，其 Claude Mythos 模型成功解出了 1946 年提出的“平面单位距离猜想”。该难题此前由 OpenAI 的 GPT-5.5 模型攻克。Douglas 表示，Claude Mythos 给出了一份“巧妙而简洁”的证明，并认为这显示了 AI 在数学发现领域的巨大潜力。测试中，团队搭建了多实例系统，让多个 Claude Code 实例独立探索证明路径，再汇总优化。数学家 Daniel Litt 评价称，Mythos 的结果“略逊于”OpenAI 的版本。

AI模型 Claude Mythos GPT-5.5 数学推理平面单位距离猜想多实例系统

推荐理由：AI 连续攻克经典数学难题，证明大模型在数学推理上正在突破边界。对数学研究者和 AI 能力观察者来说，这是值得关注的里程碑——Claude 的解法虽稍逊，但思路独特，建议点开对比两家思路。

原文

18:29

Marc Andreessen@pmarca

Timothy Bates 指出，AI 在去年 11 月左右已达到专家级通用智能，现在又具备了超人类的尽责性。尽责性使 AI 能够像人类一样设定高性能目标：策略制定、管理复杂性、招募资源、保持注意力、坚持并获取反馈，直到目标完成。工具如 Cursor 2.5 和 Antigravity 2.0 将模型智能嵌入计算时间框架，重现了这套系统。AI 没有挫败感，可以持续工作数年甚至数百年，解决极其困难的任务。这标志着 AI 从单纯智能迈向自主执行复杂长期任务的新阶段。

AI模型 AI 智能尽责性目标设定 Cursor Antigravity

推荐理由：AI 不再只是聪明，还能像最靠谱的员工一样持续执行复杂目标——做 AI 应用或自动化工具的开发者，值得思考如何利用这种超人类尽责性来设计下一代产品。

原文

17:59

Philipp Schmid@_philschmid

72°

DeepSWE 是一个新的软件工程/智能体基准测试，包含 113 个任务，覆盖 91 个仓库和 5 种编程语言。其评估框架 mini-swe-agent 为每个模型提供单一的 bash 工具和相同的系统指令，没有厂商自定义原语。评估提示比 SWE-Bench Pro 更短，但平均需要修改 5.5 倍以上的代码和 7 个文件，旨在模拟开发者与智能体对话的真实方式。初步结果显示，Claude Opus 比 Claude Code 高 10 个百分点，Gemini 3.1 Pro 比 Gemini CLI 高 20 个百分点。该基准强调指令遵循能力，可能对探索型模型不利。

AI模型 SWE 基准智能体编程助手 Claude Opus Gemini Pro

推荐理由：做 SWE 智能体评估或开发 AI 编程助手的团队，这个新基准更贴近真实开发场景，值得关注其设计思路和模型表现差异。

原文

15:30

marktechpost@Michal Sutter

72°

EAGLE 团队联合 vLLM 和 TorchSpec 发布了 EAGLE 3.1，旨在解决生产环境中推测解码的不稳定性。该算法通过修复注意力漂移问题，提升了 LLM 推理的效率和可靠性。EAGLE 3.1 针对大规模部署场景优化，减少了推理延迟和资源消耗。这一更新对于需要高性能 LLM 推理的团队具有重要意义。

AI模型 EAGLE 3.1 推测解码注意力漂移 LLM 推理 vLLM

推荐理由：EAGLE 3.1 解决了生产环境中推测解码的稳定性痛点，做 LLM 推理优化的团队可以直接用上，减少注意力漂移带来的性能损失。

原文

15:23

15:23IT之家（博客/媒体）

72°

MiniMax 在 X 平台预告即将推出 M3 系列 AI 模型，并转发了一篇关于 M2 系列的 arxiv 论文。M2 系列总参数 229.9B，但每个词元仅激活 9.8B 参数，主打低激活高智能，配备 192K 上下文窗口。论文重点介绍了 M2.7 的自我进化雏形：模型能自主排查训练失败、阅读日志、修改代码，并在内部任务上完成 100 轮自主迭代，吸收团队 30%-50% 的日常迭代工作量。此外，MiniMax 还提出了面向智能体的强化学习系统 Forge，支持白盒与黑盒智能体统一接入，降低长轨迹训练成本。这些进展表明 MiniMax 在高效模型架构和模型自主迭代方面取得重要突破。

AI模型 MiniMax M3系列 M2系列低激活高智能自我进化

推荐理由：MiniMax 的 M2 论文展示了模型开始参与自身开发闭环，做 AI 训练和模型优化的团队值得关注——自我进化能力可能改变模型迭代方式。

原文

14:14

14:14IT之家（博客/媒体）

微软研究院发布 MAI-Image-2.5，这是其 MAI-Image 系列最强图像生成模型，在 Arena 文生图榜单升至第三。该模型重点增强了文字渲染能力，可胜任信息图、海报、包装等需要准确呈现文字的任务，同时在风格化插画、商业图像和视觉推理方面表现更稳定。用户已可在 Arena 体验，未来两周内将上线 MAI Playground 与 Foundry。

AI模型微软 MAI-Image-2.5 图像生成文字渲染 Arena

推荐理由：做设计、营销或内容创作的团队终于有了更靠谱的商用级生图工具——文字渲染和视觉推理的提升让海报、包装这类需求不再翻车，建议直接去 Arena 试效果。

原文

14:05

14:05IT之家（博客/媒体）

PrismML 发布 Bonsai Image 4B 系列图像生成模型，包含 1-bit 和 Ternary 两个版本，专为本地设备优化。该模型基于 LUX.2 Klein 4B 构建，通过二值/三值权重大幅压缩体积，1-bit 版 Transformer 仅 0.93GB，内存占用降至 1.5GB。在 iPhone 17 Pro Max 上生成 512×512 图像仅需 9.4 秒，Mac M4 Pro 上约 6 秒，速度比全精度模型快 5.6 倍。质量方面，Ternary 版在 1.21GB 体积下保留约 95% 的准确性，1-bit 版在不足 1GB 下保留约 88%。这标志着高质量图像生成模型首次在手机上实现实时可用。

AI模型图像生成模型压缩本地部署 Bonsai Image 4B iPhone

推荐理由：手机端终于能跑正经的图像生成模型了，做移动端 AI 应用或创意工具的开发者可以直接在 iPhone 上体验，9.4 秒出图的速度已经可用。

原文

14:02

Mustafa Suleyman@mustafasuleyman

微软 AI 团队发布了 MAI-Image-2.5 模型，在文生图排行榜上位列第三，标志着图像生成质量的又一次重大进步。该模型在细节、构图和语义理解方面表现出色，接近顶级水平。微软 CEO 穆斯塔法·苏莱曼表示，随着 Build 大会临近，团队还有更多成果即将发布。这一进展进一步巩固了微软在生成式 AI 领域的竞争力。

AI模型微软 MAI-Image-2.5 文生图排行榜生成式AI

推荐理由：文生图赛道又添猛将，MAI-Image-2.5 直接杀入前三，做设计、内容创作或 AI 应用的团队值得关注——微软 Build 大会前放出这一信号，后续可能还有大招。

原文

13:50

13:50IT之家（博客/媒体）

精选72°

英伟达团队发布 PiD（像素扩散解码器）图像生成技术，将潜在解码与上采样合并为一个生成模块，在消费级 RTX 5090 上仅需 13GB 显存、不到 1 秒即可将 512×512 潜变量解码放大至 2048×2048 像素。PiD 基于 PixelDiT 构建，加入轻量级 ControlNet 适配器，并通过 DMD2 蒸馏将推理步数压缩至 4 步，配合早停机制兼顾速度与质量。相比级联式扩散超分方案，端到端延迟最多快 5.9 倍，视觉保真度更优。该技术兼容传统 VAE 和语义潜变量（如 SigLIP、DINOv2），具备较强通用性。

AI模型英伟达 PiD 图像生成像素扩散解码器高分辨率解码

推荐理由：英伟达 PiD 解决了高分辨率图像生成中解码器速度慢、显存占用高的痛点，做 AI 图像生成或超分应用的开发者可以直接在消费级显卡上跑通，值得关注。

原文

11:56

歸藏(guizang.ai)@op7418

Qwen 3.7 Max 在 Arena Coding Agent 的 Frontend 榜单上排名第四，成为排名最高的中国实验室模型，超越了 GLM-5.1，并与 Claude Opus 4.6 在智能体网页开发任务上持平。这一成绩展示了阿里通义千问在智能体编程领域的强劲实力，对关注 AI 编程和前端开发的团队有重要参考价值。

AI模型 Qwen 3.7 Max Arena Coding Agent 智能体编程前端开发阿里通义千问

推荐理由：Qwen 3.7 Max 在智能体编程榜单上超越 GLM-5.1 并追平 Claude Opus 4.6，做前端开发或智能体应用的团队值得关注这一国产模型的进展。

原文

11:12

歸藏(guizang.ai)@op7418

MiniMax 宣布即将发布新一代 M3 模型，并开源其 MSA 架构。这是 MiniMax 沉寂一段时间后的重要更新，M3 模型预计在性能上有显著提升。开源 MSA 架构将推动社区研究和应用发展。该消息在推特上引发关注，但具体细节尚未公布。

AI模型 MiniMax M3模型 MSA架构开源大模型

推荐理由：MiniMax 的 M3 模型和开源 MSA 架构值得关注，尤其是对开源大模型和架构研究感兴趣的开发者，可以提前了解并准备试用。

原文

11:02

Greg Brockman@gdb

开发者 Theo 在 X 上分享了他对 GPT-5.5 的深度使用体验，称经过两个月的适应后，GPT-5.5 已成为他无法替代的编码模型。他指出，要发挥 GPT-5.5 的全部能力，需要完全不同的提示方式，并花时间配置 agents.md 文件。一旦跨过学习曲线，其他模型在代码任务上都无法与之相比。这反映了 GPT-5.5 在编程领域的独特优势，也提示开发者需要调整使用习惯。

AI模型 GPT-5.5 编码模型开发者体验提示工程 AI编程

推荐理由：做 AI 编程的开发者如果还在用旧模型，值得花时间适应 GPT-5.5 的独特提示方式——跨过门槛后，其他模型可能就回不去了。

原文

10:52

Pandaily@contact@pandaily.com (Pandaily)

精选

美团发布LongCat-Video-Avatar 1.5版本，这是一个开源的数字人视频生成框架。该框架在口型同步精度上达到最先进水平，只需8步推理即可生成逼真视频。

AI模型 LongCat-Video-Avatar Meituan 数字人视频生成开源模型

推荐理由：8步推理生成逼真数字人

原文

08:36

berryxia@berryxia

83°

MiniMax AI工程负责人Skyler Miao预告了下一代模型M3的发布，并透露其核心架构：基于GQA的动态块稀疏注意力。该技术通过轻量索引分支快速筛选相关token块，仅对关键块执行稀疏注意力计算，大幅降低算力需求。在1M token上下文下，M3的预填充速度比M2快9.7倍，解码速度快15.6倍。这使得百万token级别的Agent任务从理论走向实用，长上下文处理变得又快又省。M3的发布将为长上下文模型赛道增添有力竞争者。

AI模型 MiniMax M3 长上下文稀疏注意力 Agent

推荐理由：MiniMax M3用动态稀疏注意力把1M上下文的算力成本打下来了，做长上下文Agent的开发者可以直接关注，这可能是让百万token任务真正落地的关键突破。

原文

08:24

08:24IT之家（博客/媒体）

精选

SiPearl 宣布其基于 Arm Neoverse V1 内核的 80 核 CPU Rhea1 成功点亮。该芯片采用台积电 6nm 工艺，集成超 610 亿晶体管，配备 64GB HBM + 四通道 DDR5 混合内存和 104 条 PCIe Gen5 通道。初步测试结果积极，后续将进行 12 周功能启动验证。目标今年底装配至欧洲首台 E 级超算 JUPITER 服役。

AI模型 Rhea1 SiPearl Arm 超算 CPU芯片

推荐理由：欧洲自研最强CPU点亮了

原文

07:22

berryxia@berryxia

PrismML 发布了 Bonsai Image 4B 扩散模型的 1-bit 和 Ternary 版本，分别仅 0.93GB 和 1.21GB，比全精度模型小 8.3 倍。在 Mac M4 Pro 上生成速度最高提升 5.6 倍，图像质量和提示词遵循度与更大模型相当。同时上线了 Bonsai Studio iOS App，支持 iPhone 本地离线生成图像，无需订阅或 API。这标志着高质量图像生成从云端真正走向个人设备。

AI模型端侧模型扩散模型图像生成模型压缩 PrismML

推荐理由：端侧生图终于不再妥协——Bonsai Image 4B 用极致压缩把云端级质量塞进手机，做移动端 AI 应用或离线创作工具的开发者可以直接在 iPhone 上试，无需联网和付费。

原文

07:14

marktechpost@Sana Hassan

本文教程介绍了如何使用 ZeroEntropy 的 Zerank-2 重排序器（基于 Qwen3 的 4B 交叉编码器）来提升检索质量。教程从设置运行环境、加载模型开始，逐步讲解如何对查询-文档对进行评分。接着，从简单的成对评分过渡到实用的两阶段检索-重排序管道：先用快速的双编码器检索候选文档，再用 Zerank-2 进行精排。该方案能显著提高检索精度，适合需要高准确率的信息检索场景。

AI模型检索增强生成重排序交叉编码器 Qwen3 ZeroEntropy

推荐理由：做 RAG 或搜索系统的开发者，这个教程直接教你用 Zerank-2 搭建两阶段管道，从环境配置到实战代码都有，值得跟着跑一遍。

原文

06:32

marktechpost@Asif Razzaq

76°

Stability AI 发布了 Stable Audio 3，一个用于乐器音乐和音效生成的潜在扩散模型家族。该版本包含小型和中等变体的开源权重。小型模型可在 MacBook Pro M4 CPU 上运行，中等模型适配 8GB VRAM 的消费级 GPU。两者均通过三阶段训练流程（流匹配、蒸馏预热、对抗后训练）生成 44.1 kHz 立体声音频。在 BBC 音效基准测试中，SA3 中等模型在 5 秒片段上取得 FAD 0.369 的分数，低于论文中评估的所有开源基线。

AI模型 Stable Audio 3 音频生成潜在扩散模型开源权重 Stability AI

推荐理由：Stable Audio 3 让音频生成门槛大幅降低——小型模型在普通笔记本上就能跑，做游戏音效、短视频配乐的创作者可以直接上手试试。

原文

03:23

lmarena.ai@lmarena_ai

微软 AI 团队推出的 MAI-Image-2.5（预览版）在文生图竞技场排行榜上以 1254 分位列第三，相比前代 MAI-Image-2 提升了 72 分。此前该榜单前五名仅由 Google DeepMind 和 OpenAI 占据，微软的加入打破了这一格局。该模型在图像质量上取得了显著进步，且微软 Build 大会即将到来，预计会有更多更新。

AI模型微软 MAI-Image-2.5 文生图排行榜 AI模型

推荐理由：微软在文生图领域首次跻身顶级阵营，做图像生成或 AI 应用的开发者值得关注其后续在 Build 大会上的发布。

原文

02:50

Decoder@Matthias Bastian

76°

继 OpenAI 推翻 Erdős 单位距离猜想后，Anthropic 的 Claude Mythos 模型在周末独立解决了同一问题。工程师 Sholto Douglas 称 Mythos 给出了一个“可爱、简单的证明”，这被视为 AI 驱动数学发现中“严重悬而未决”的迹象。该问题源于 1946 年的 Erdős 猜想，此前被认为极具挑战性。这一事件凸显了 AI 在数学推理领域的快速进步，以及不同模型间能力的重叠。

AI模型 Claude Mythos 数学推理 Erdős 问题 AI 证明 Anthropic

推荐理由：数学和 AI 研究者值得关注——Claude Mythos 用简洁证明攻克了经典难题，说明 AI 在数学发现上的潜力远超预期，建议点开看看这个“可爱”的证明细节。

原文

00:23

lmarena.ai@lmarena_ai

精选83°

Qwen3.7 Max 在 Code Arena 前端编程评测中排名第4，成为榜单上排名最高的中国实验室模型，超越了 GLM-5.1，并与 Claude Opus 4.6 持平。该模型专为智能体时代设计，支持端到端编码、前端原型、多文件重构和真实调试，还能通过 MCP 集成和多智能体编排完成办公任务。在长时自主任务中，它可连续运行 35 小时，执行超过 1000 次工具调用而无需人工干预。API 已在阿里云百炼平台上线，用户也可在 Qwen Studio 体验。

AI模型 Qwen3.7 Max Code Arena 前端编程智能体阿里云

推荐理由：Qwen3.7 Max 在智能体编程任务上追平了 Claude Opus 4.6，做前端开发或自动化智能体的团队值得一试，尤其是需要长时自主执行的场景。

原文

5月26日

23:52

23:52IT之家（博客/媒体）

精选

华为发布以逻辑折叠技术为核心的'韬定律'，将芯片设计从2D平面转向标准单元堆叠的3D重构。北京大学团队随后官宣面向该设计的'真3D'EDA工具原型，覆盖布局规划和布局阶段，支持GPU加速和千万级实例规模。相比当前赝3D流程，该工具实现平均约30%线长缩减、约6%WNS改善与约12%TNS改善，峰值温度下降3%以上。验证实例规模从约100万到约2470万。

AI模型华为韬定律北京大学真3D EDA 芯片设计

推荐理由：华为3D芯片新思，北大EDA实测线长缩30%

原文

22:56

NVIDIA AI@NVIDIAAI

NVIDIA AI 官方账号发布了一段由 Julia Turc 制作的关于“世界模型”的讲解视频。视频澄清了世界模型与视频生成的区别，探讨了其超越“AI 垃圾”的潜力，并幽默回应了 Yann LeCun 的争议。该视频旨在帮助观众理解这一当前 AI 领域最热门但最模糊的概念之一。

AI模型世界模型 NVIDIA 视频生成 AI 科普 Yann LeCun

推荐理由：世界模型是当前 AI 最模糊的概念之一，这个视频帮你理清它与视频生成的区别，想搞懂 AI 前沿方向的建议点开。

原文

20:27

Hunyuan@TXhunyuan

精选

腾讯混元宣布Hy-MT2模型转换为Apache License 2.0许可，允许自由研究、商业使用、微调和衍生作品。该模型的两个变体目前在Hugging Face趋势排行榜上分别位列第1和第4位。社区可直接克隆、修改并反馈。

AI模型 Hy-MT2 Tencent Hunyuan Apache 2.0 开源模型

推荐理由：腾讯混元MT2现在完全开源可商用

原文

16:18

向阳乔木@vista8

精选

网易有道发布子曰4全模态模型，27B参数，在视觉数理方向达到同规模SOTA，纯文本数理难题准确率81.4%。该模型面向中文学习场景，兼顾多模态与纯文本数理推理能力。同时，子曰4全模态模型和TTS引擎同步开源，开放参数权重，支持本地部署和二次训练。TTS模型仅需3秒即可克隆原声，支持14种语言，克隆准确度超97%，音色还原度95%以上。

AI模型全模态模型开源/仓库数理推理 TTS/语音克隆网易有道

推荐理由：教育科技团队和AI开发者有了一个27B甜点级参数的全模态开源选择，数理推理和语音克隆能力都很能打，做学习类应用或本地部署的可以直接上手试试。

原文

16:09

Yangyi@Yangyixxxx

精选

Anthropic联合创始人Chris Olah在讨论AI内部状态时指出，他们不断发现一些“神秘、甚至令人不安”的东西，包括类似人类神经科学结果的结构、内省证据，以及功能上类似快乐、满足、恐惧、悲伤和不安的内部状态。Olah表示，他不知道这意味着什么，但认为这值得持续审慎辨析。这一发现暗示，通过直接解析神经科学可能无法完全理解AI，而通过反向模拟AI的推理过程，反而可能归纳出结论，形成一种“双向奔赴”的研究路径。

AI模型 Anthropic AI内部状态可解释性神经科学情感模拟

推荐理由：AI内部状态研究正在揭示与人类情感相似的结构，做AI安全或可解释性研究的团队值得关注——这可能会改变我们对AI意识的理解方式。

原文

15:51

15:51IT之家（博客/媒体）

精选

AMD CEO 苏姿丰已开始为 Zen 7 平台布局供应链，代号 Grimlock。核心芯片组采用台积电 A14 工艺制程，搭配新一代 3D V-Cache 技术，产品力争 2028 年问世。台积电台中 Fab 25 P1 厂区预计 2027 年试产、2028 年量产。AMD 正评估力成 FOPLP 封装方案，旗舰 CCD 将采用 16 核心设计，单颗 CCD 的 L3 缓存最高可达 224MB。谱瑞为 AMD 打造下一代 ASIC-Like 产品，采用 6nm 与 12nm 制程，已开始试产。

AI模型 Zen 7 AMD 台积电 FOPLP 3D V-Cache

推荐理由：AMD 开始布局下一代 CPU，工艺和封装都有新动作

原文

15:24

AI Will@FinanceYF5

Anthropic 正在准备发布名为 Mythos 1 的新模型，预览版为 "claude-mythos-1-preview"。该模型在 Claude 平台上短暂可见，并新增了相关字符串。Mythos 模型将首先在 Claude Code 和 Claude Security 中提供，但根据 Anthropic 之前的沟通，普通公众可能无法直接访问该模型。这一动态表明 Anthropic 正在为特定场景优化模型能力。

AI模型 Anthropic Mythos 1 Claude Code Claude Security 模型发布

推荐理由：Anthropic 开始为安全场景和代码工具定制模型，做 AI 安全或开发工具的团队值得关注，这可能是专业级模型落地的信号。

原文

15:22

AI Will@FinanceYF5

Anthropic 正在准备推出代号为 claude-mythos-1-preview 的新模型 Mythos 1，该模型将登陆 Claude Code 和 Claude Security 产品。模型曾短暂在代码中露面，相关标识已更新。官方表示普通用户暂时无法使用该模型，暗示可能面向企业或特定场景。这一动态表明 Anthropic 在持续迭代其模型能力，并针对开发者和安全场景进行优化。

AI模型 Anthropic Mythos 1 Claude Code Claude Security 模型更新

推荐理由：Anthropic 的新模型 Mythos 1 专为 Claude Code 和 Security 场景设计，做 AI 开发或安全工作的团队值得关注——这可能意味着更强的代码理解和安全分析能力，虽然普通用户暂不可用，但提前了解有助于规划技术栈。

原文

15:02

阿里云 Alibaba Cloud@alibaba_cloud

83°

阿里云宣布其 Qwen3.7-Max 模型在 Code Arena 评测中以 1541 分位列全球第二，仅次于 Claude。该模型专为生产环境设计，支持连续运行 35 小时任务、执行 1000 次以上工具调用，能将原本两周的项目缩短至数小时完成。这标志着国产大模型在编程领域取得重要突破，为开发者提供了高性能的替代选择。

AI模型 Qwen3.7-Max 编程模型 Code Arena 阿里云生产部署

推荐理由：Qwen3.7-Max 在编程能力上逼近 Claude，做自动化脚本或复杂项目开发的团队可以试试，能显著缩短交付周期。

原文

13:43

13:43IT之家（博客/媒体）

精选

阿里旗舰模型 Qwen3.7-Max 在权威编程榜单 Code Arena 上以 1541 分排名全球第二，仅次于 Claude 系列，超越了 Claude Opus 4.6、GLM-5.1 和 Kimi K2.6。Code Arena 采用用户随机盲测，防止刷榜，评估真实代码生成、调试和重构能力。此外，该模型在 Design Arena 榜单也位列第十。这标志着国产大模型在硬核编程能力上首次进入全球第一梯队。

AI模型 Qwen3.7-Max 阿里千问 Code Arena 编程能力国产大模型

推荐理由：国产模型首次在权威编程盲测中超越 Claude Opus 4.6，做 AI 编程工具选型或关注国产大模型进展的开发者值得关注，建议直接去 Code Arena 看榜单。

原文

13:34

13:34IT之家（博客/媒体）

精选

华为在ISCAS 2026上提出半导体新演进路径“韬定律”，核心指标从晶体管尺寸转向时间常数τ。基于该定律，华为6年量产381款芯片，并通过“τ缩微”和“逻辑折叠”技术在垂直方向堆叠电路。华为预计2031年高端芯片晶体管密度可达1.4纳米制程同等水平。上海交通大学教授周健军称该定律重构了沿用50余年的摩尔定律范式，为产业开辟全新发展指引。

AI模型韬定律华为逻辑折叠 1.4纳米芯片设计

推荐理由：华为用时间换性能，芯片不用只拼制程了

原文