03:09Decoder@Matthias Bastian微软最新图像生成模型 MAI-Image-2.5 在 Arena 文生图排行榜上位列第三,与谷歌的 Nano Banana 2 持平,但仍落后于 OpenAI 的 Image-2。相比前代,该模型在图像内文本渲染和商业视觉内容方面有显著提升。这标志着微软在图像生成领域与谷歌的竞争进入白热化阶段,尤其适合需要高质量图文混排的营销和设计场景。AI模型微软MAI-Image-2.5谷歌Nano Banana 2文生图文本渲染7 个信源在谈推荐理由:做营销素材和电商设计的团队可以关注——MAI-Image-2.5 的文本渲染能力直接对标谷歌,生成带字海报和产品图更靠谱,值得在内部测试中对比一下。原文
03:05阿里通义 Qwen@Alibaba_Qwen76°阿里 Qwen 团队联合多家合作伙伴,在 TokenSpeed 推理引擎上对 Qwen3.5 模型进行极致优化,实现了 580 tokens/秒的推理速度,创下智能体工作负载的新纪录。该成果得益于 NVIDIA GPU、FlashAttention-4 优化以及 PyTorch 社区的支持。这一里程碑展示了开源大模型在推理性能上的巨大潜力,尤其适合对延迟敏感的智能体应用场景。PyTorch 官方博客已发布完整技术细节。AI模型Qwen3.5推理优化TokenSpeed开源/仓库智能体推荐理由:580 tps 意味着智能体应用可以几乎实时响应,做 LLM 推理优化或 Agent 开发的团队值得关注这个开源方案,可以直接参考 PyTorch 博客里的实现细节。原文
02:42Hugging Face: Blog(博客/媒体)IBM与Artificial Analysis联合推出ITBench-AA,这是首个针对企业IT运维场景的智能体基准测试。测试涵盖事件响应、故障排查等真实任务,结果显示包括GPT-4、Claude在内的前沿模型平均得分低于50%。该基准揭示了当前AI智能体在处理复杂企业IT流程时的能力短板,为行业提供了可量化的评估标准。AI模型智能体企业IT基准测试IBM运维自动化推荐理由:企业IT团队终于有了衡量AI智能体真实能力的标尺——前沿模型都不到50分,说明自动化运维还有很大提升空间,做IT运维或AI落地的建议点开看看差距在哪。原文
01:12marktechpost@Asif Razzaq76°NVIDIA 研究人员推出 Polar,一个 token 忠实展开框架,用于通过强化学习训练语言智能体,无需修改其智能体框架。Polar 在框架和推理服务器之间放置模型 API 代理,捕获 token 级交互并重建训练器就绪轨迹。基于 Qwen3.5-4B 基础模型使用 GRPO,Polar 在 Codex 框架下将 SWE-Bench Verified pass@1 提升 22.6 个百分点,在 Claude Code 下提升 4.8 个百分点,在 Pi 下提升 6.2 个百分点。该框架已注册为 NeMo Gym 环境,并在 ProRL Agent Server 仓库中发布。AI模型NVIDIAPolarGRPO代码智能体强化学习4 个信源在谈推荐理由:Polar 解决了 RL 训练智能体时需修改框架的痛点,做代码智能体或 RL 训练的开发者可以直接集成,无需改动现有工具链,值得一试。原文
23:55Perplexity@perplexity_ai精选Perplexity AI发布的编码器在生产输入长度下,p50延迟比HuggingFace tokenizers低约5倍,比SentencePiece C++低2倍,比IREE C低1.5倍。在514 tokens的输入时,运行时间仅为63微秒,且实现零堆分配。该编码器专门针对长输入场景优化,显著提升推理效率。AI模型Perplexity AIHuggingFaceSentencePiece编码器性能优化推荐理由:Perplexity AI编码器快了5倍原文
20:57berryxia@berryxia腾讯HY实验室联合四家机构发布Chronicles-OCR基准测试,专门评估AI对3000年中国古文字的识别能力。测试包含2800张专家标注图像,覆盖甲骨文、金文、篆书等七大类古文字。结果显示28个前沿多模态模型全部失败,最强模型在甲骨文上仅14%准确率,GPT-5和Gemini 2.5 Pro接近0。更反直觉的是,开启推理模式反而降低表现,模型实际依赖载体(如龟壳、青铜器)而非文字本身进行分类。该测试揭示了AI在文化遗产领域的巨大挑战。AI模型OCR古文字识别多模态模型基准测试文化遗产推荐理由:这个基准测试戳破了多模态模型在古文字识别上的泡沫——它们根本没在认字,只是认载体。做文化遗产数字化或OCR研究的团队,看完会重新思考模型能力的边界。原文
20:56berryxia@berryxia88°Anthropic 于 2026 年 4 月 7 日发布 Project Glasswing 及 Claude Mythos Preview,该前沿模型网络攻防能力极强,因安全顾虑仅开放给合作伙伴用于防御。OpenAI 则在 5 月 20 日宣布其内部通用推理模型成功推翻数学家 Paul Erdős 的平面单位距离问题猜想。这两件事共同表明,前沿模型在更高抽象层面的可靠推理能力已迈过临界点,能稳定处理完整论证和知识体系,而非仅限片段操作。Claude Mythos Preview 在编码和网络安全评测中表现突出,多数基准测试超越 GPT-5.5。AI模型推理模型网络安全数学证明AnthropicOpenAI10 个信源在谈推荐理由:AI 推理能力从片段到完整体系的跃迁,是开发者和安全从业者必须关注的分水岭——Claude Mythos 的防御性开放和 OpenAI 的数学突破,直接改变了模型应用边界,建议点开了解具体案例。原文
20:19berryxia@berryxiaMiniMax 在沉寂半年后,将去年 12 月开源的 M2 模型背后的设计思路、训练细节和系统架构整理成论文发布到 arXiv。社区已广泛采用其核心系统如 CISPO、Forge RL System 和 Self-Evolution。MiniMax 表示 M3 模型和 MSA 论文即将发布,此举旨在推动开源生态从单纯卷参数转向公开方法论。AI模型开源/仓库强化学习MiniMaxM2M3推荐理由:MiniMax 把 M2 的完整训练路径摊开,做开源模型训练或强化学习的团队可以直接参考,少走半年弯路。M3 即将到来,值得关注其系统级突破。原文
19:06IT之家(博客/媒体)76°Anthropic 工程师 Sholto Douglas 宣布,其 Claude Mythos 模型成功解出了 1946 年提出的“平面单位距离猜想”。该难题此前由 OpenAI 的 GPT-5.5 模型攻克。Douglas 表示,Claude Mythos 给出了一份“巧妙而简洁”的证明,并认为这显示了 AI 在数学发现领域的巨大潜力。测试中,团队搭建了多实例系统,让多个 Claude Code 实例独立探索证明路径,再汇总优化。数学家 Daniel Litt 评价称,Mythos 的结果“略逊于”OpenAI 的版本。AI模型Claude MythosGPT-5.5数学推理平面单位距离猜想多实例系统10 个信源在谈推荐理由:AI 连续攻克经典数学难题,证明大模型在数学推理上正在突破边界。对数学研究者和 AI 能力观察者来说,这是值得关注的里程碑——Claude 的解法虽稍逊,但思路独特,建议点开对比两家思路。原文
18:29Marc Andreessen@pmarcaTimothy Bates 指出,AI 在去年 11 月左右已达到专家级通用智能,现在又具备了超人类的尽责性。尽责性使 AI 能够像人类一样设定高性能目标:策略制定、管理复杂性、招募资源、保持注意力、坚持并获取反馈,直到目标完成。工具如 Cursor 2.5 和 Antigravity 2.0 将模型智能嵌入计算时间框架,重现了这套系统。AI 没有挫败感,可以持续工作数年甚至数百年,解决极其困难的任务。这标志着 AI 从单纯智能迈向自主执行复杂长期任务的新阶段。AI模型AI 智能尽责性目标设定CursorAntigravity2 个信源在谈推荐理由:AI 不再只是聪明,还能像最靠谱的员工一样持续执行复杂目标——做 AI 应用或自动化工具的开发者,值得思考如何利用这种超人类尽责性来设计下一代产品。原文
17:59Philipp Schmid@_philschmid72°DeepSWE 是一个新的软件工程/智能体基准测试,包含 113 个任务,覆盖 91 个仓库和 5 种编程语言。其评估框架 mini-swe-agent 为每个模型提供单一的 bash 工具和相同的系统指令,没有厂商自定义原语。评估提示比 SWE-Bench Pro 更短,但平均需要修改 5.5 倍以上的代码和 7 个文件,旨在模拟开发者与智能体对话的真实方式。初步结果显示,Claude Opus 比 Claude Code 高 10 个百分点,Gemini 3.1 Pro 比 Gemini CLI 高 20 个百分点。该基准强调指令遵循能力,可能对探索型模型不利。AI模型SWE 基准智能体编程助手Claude OpusGemini Pro1 个信源在谈推荐理由:做 SWE 智能体评估或开发 AI 编程助手的团队,这个新基准更贴近真实开发场景,值得关注其设计思路和模型表现差异。原文
15:30marktechpost@Michal Sutter72°EAGLE 团队联合 vLLM 和 TorchSpec 发布了 EAGLE 3.1,旨在解决生产环境中推测解码的不稳定性。该算法通过修复注意力漂移问题,提升了 LLM 推理的效率和可靠性。EAGLE 3.1 针对大规模部署场景优化,减少了推理延迟和资源消耗。这一更新对于需要高性能 LLM 推理的团队具有重要意义。AI模型EAGLE 3.1推测解码注意力漂移LLM 推理vLLM推荐理由:EAGLE 3.1 解决了生产环境中推测解码的稳定性痛点,做 LLM 推理优化的团队可以直接用上,减少注意力漂移带来的性能损失。原文
15:23IT之家(博客/媒体)72°MiniMax 在 X 平台预告即将推出 M3 系列 AI 模型,并转发了一篇关于 M2 系列的 arxiv 论文。M2 系列总参数 229.9B,但每个词元仅激活 9.8B 参数,主打低激活高智能,配备 192K 上下文窗口。论文重点介绍了 M2.7 的自我进化雏形:模型能自主排查训练失败、阅读日志、修改代码,并在内部任务上完成 100 轮自主迭代,吸收团队 30%-50% 的日常迭代工作量。此外,MiniMax 还提出了面向智能体的强化学习系统 Forge,支持白盒与黑盒智能体统一接入,降低长轨迹训练成本。这些进展表明 MiniMax 在高效模型架构和模型自主迭代方面取得重要突破。AI模型MiniMaxM3系列M2系列低激活高智能自我进化推荐理由:MiniMax 的 M2 论文展示了模型开始参与自身开发闭环,做 AI 训练和模型优化的团队值得关注——自我进化能力可能改变模型迭代方式。原文
14:14IT之家(博客/媒体)微软研究院发布 MAI-Image-2.5,这是其 MAI-Image 系列最强图像生成模型,在 Arena 文生图榜单升至第三。该模型重点增强了文字渲染能力,可胜任信息图、海报、包装等需要准确呈现文字的任务,同时在风格化插画、商业图像和视觉推理方面表现更稳定。用户已可在 Arena 体验,未来两周内将上线 MAI Playground 与 Foundry。AI模型微软MAI-Image-2.5图像生成文字渲染Arena推荐理由:做设计、营销或内容创作的团队终于有了更靠谱的商用级生图工具——文字渲染和视觉推理的提升让海报、包装这类需求不再翻车,建议直接去 Arena 试效果。原文
14:05IT之家(博客/媒体)PrismML 发布 Bonsai Image 4B 系列图像生成模型,包含 1-bit 和 Ternary 两个版本,专为本地设备优化。该模型基于 LUX.2 Klein 4B 构建,通过二值/三值权重大幅压缩体积,1-bit 版 Transformer 仅 0.93GB,内存占用降至 1.5GB。在 iPhone 17 Pro Max 上生成 512×512 图像仅需 9.4 秒,Mac M4 Pro 上约 6 秒,速度比全精度模型快 5.6 倍。质量方面,Ternary 版在 1.21GB 体积下保留约 95% 的准确性,1-bit 版在不足 1GB 下保留约 88%。这标志着高质量图像生成模型首次在手机上实现实时可用。AI模型图像生成模型压缩本地部署Bonsai Image 4BiPhone推荐理由:手机端终于能跑正经的图像生成模型了,做移动端 AI 应用或创意工具的开发者可以直接在 iPhone 上体验,9.4 秒出图的速度已经可用。原文
14:02Mustafa Suleyman@mustafasuleyman微软 AI 团队发布了 MAI-Image-2.5 模型,在文生图排行榜上位列第三,标志着图像生成质量的又一次重大进步。该模型在细节、构图和语义理解方面表现出色,接近顶级水平。微软 CEO 穆斯塔法·苏莱曼表示,随着 Build 大会临近,团队还有更多成果即将发布。这一进展进一步巩固了微软在生成式 AI 领域的竞争力。AI模型微软MAI-Image-2.5文生图排行榜生成式AI推荐理由:文生图赛道又添猛将,MAI-Image-2.5 直接杀入前三,做设计、内容创作或 AI 应用的团队值得关注——微软 Build 大会前放出这一信号,后续可能还有大招。原文
13:50IT之家(博客/媒体)精选72°英伟达团队发布 PiD(像素扩散解码器)图像生成技术,将潜在解码与上采样合并为一个生成模块,在消费级 RTX 5090 上仅需 13GB 显存、不到 1 秒即可将 512×512 潜变量解码放大至 2048×2048 像素。PiD 基于 PixelDiT 构建,加入轻量级 ControlNet 适配器,并通过 DMD2 蒸馏将推理步数压缩至 4 步,配合早停机制兼顾速度与质量。相比级联式扩散超分方案,端到端延迟最多快 5.9 倍,视觉保真度更优。该技术兼容传统 VAE 和语义潜变量(如 SigLIP、DINOv2),具备较强通用性。AI模型英伟达PiD图像生成像素扩散解码器高分辨率解码推荐理由:英伟达 PiD 解决了高分辨率图像生成中解码器速度慢、显存占用高的痛点,做 AI 图像生成或超分应用的开发者可以直接在消费级显卡上跑通,值得关注。原文
11:56歸藏(guizang.ai)@op7418Qwen 3.7 Max 在 Arena Coding Agent 的 Frontend 榜单上排名第四,成为排名最高的中国实验室模型,超越了 GLM-5.1,并与 Claude Opus 4.6 在智能体网页开发任务上持平。这一成绩展示了阿里通义千问在智能体编程领域的强劲实力,对关注 AI 编程和前端开发的团队有重要参考价值。AI模型Qwen 3.7 MaxArena Coding Agent智能体编程前端开发阿里通义千问推荐理由:Qwen 3.7 Max 在智能体编程榜单上超越 GLM-5.1 并追平 Claude Opus 4.6,做前端开发或智能体应用的团队值得关注这一国产模型的进展。原文
11:12歸藏(guizang.ai)@op7418MiniMax 宣布即将发布新一代 M3 模型,并开源其 MSA 架构。这是 MiniMax 沉寂一段时间后的重要更新,M3 模型预计在性能上有显著提升。开源 MSA 架构将推动社区研究和应用发展。该消息在推特上引发关注,但具体细节尚未公布。AI模型MiniMaxM3模型MSA架构开源大模型推荐理由:MiniMax 的 M3 模型和开源 MSA 架构值得关注,尤其是对开源大模型和架构研究感兴趣的开发者,可以提前了解并准备试用。原文
11:02Greg Brockman@gdb开发者 Theo 在 X 上分享了他对 GPT-5.5 的深度使用体验,称经过两个月的适应后,GPT-5.5 已成为他无法替代的编码模型。他指出,要发挥 GPT-5.5 的全部能力,需要完全不同的提示方式,并花时间配置 agents.md 文件。一旦跨过学习曲线,其他模型在代码任务上都无法与之相比。这反映了 GPT-5.5 在编程领域的独特优势,也提示开发者需要调整使用习惯。AI模型GPT-5.5编码模型开发者体验提示工程AI编程推荐理由:做 AI 编程的开发者如果还在用旧模型,值得花时间适应 GPT-5.5 的独特提示方式——跨过门槛后,其他模型可能就回不去了。原文
10:52Pandaily@contact@pandaily.com (Pandaily)精选美团发布LongCat-Video-Avatar 1.5版本,这是一个开源的数字人视频生成框架。该框架在口型同步精度上达到最先进水平,只需8步推理即可生成逼真视频。AI模型LongCat-Video-AvatarMeituan数字人视频生成开源模型1 个信源在谈推荐理由:8步推理生成逼真数字人原文
08:36berryxia@berryxia83°MiniMax AI工程负责人Skyler Miao预告了下一代模型M3的发布,并透露其核心架构:基于GQA的动态块稀疏注意力。该技术通过轻量索引分支快速筛选相关token块,仅对关键块执行稀疏注意力计算,大幅降低算力需求。在1M token上下文下,M3的预填充速度比M2快9.7倍,解码速度快15.6倍。这使得百万token级别的Agent任务从理论走向实用,长上下文处理变得又快又省。M3的发布将为长上下文模型赛道增添有力竞争者。AI模型MiniMaxM3长上下文稀疏注意力Agent推荐理由:MiniMax M3用动态稀疏注意力把1M上下文的算力成本打下来了,做长上下文Agent的开发者可以直接关注,这可能是让百万token任务真正落地的关键突破。原文
08:24IT之家(博客/媒体)精选SiPearl 宣布其基于 Arm Neoverse V1 内核的 80 核 CPU Rhea1 成功点亮。该芯片采用台积电 6nm 工艺,集成超 610 亿晶体管,配备 64GB HBM + 四通道 DDR5 混合内存和 104 条 PCIe Gen5 通道。初步测试结果积极,后续将进行 12 周功能启动验证。目标今年底装配至欧洲首台 E 级超算 JUPITER 服役。AI模型Rhea1SiPearlArm超算CPU芯片推荐理由:欧洲自研最强CPU点亮了原文
07:22berryxia@berryxiaPrismML 发布了 Bonsai Image 4B 扩散模型的 1-bit 和 Ternary 版本,分别仅 0.93GB 和 1.21GB,比全精度模型小 8.3 倍。在 Mac M4 Pro 上生成速度最高提升 5.6 倍,图像质量和提示词遵循度与更大模型相当。同时上线了 Bonsai Studio iOS App,支持 iPhone 本地离线生成图像,无需订阅或 API。这标志着高质量图像生成从云端真正走向个人设备。AI模型端侧模型扩散模型图像生成模型压缩PrismML推荐理由:端侧生图终于不再妥协——Bonsai Image 4B 用极致压缩把云端级质量塞进手机,做移动端 AI 应用或离线创作工具的开发者可以直接在 iPhone 上试,无需联网和付费。原文
07:14marktechpost@Sana Hassan本文教程介绍了如何使用 ZeroEntropy 的 Zerank-2 重排序器(基于 Qwen3 的 4B 交叉编码器)来提升检索质量。教程从设置运行环境、加载模型开始,逐步讲解如何对查询-文档对进行评分。接着,从简单的成对评分过渡到实用的两阶段检索-重排序管道:先用快速的双编码器检索候选文档,再用 Zerank-2 进行精排。该方案能显著提高检索精度,适合需要高准确率的信息检索场景。AI模型检索增强生成重排序交叉编码器Qwen3ZeroEntropy推荐理由:做 RAG 或搜索系统的开发者,这个教程直接教你用 Zerank-2 搭建两阶段管道,从环境配置到实战代码都有,值得跟着跑一遍。原文
06:32marktechpost@Asif Razzaq76°Stability AI 发布了 Stable Audio 3,一个用于乐器音乐和音效生成的潜在扩散模型家族。该版本包含小型和中等变体的开源权重。小型模型可在 MacBook Pro M4 CPU 上运行,中等模型适配 8GB VRAM 的消费级 GPU。两者均通过三阶段训练流程(流匹配、蒸馏预热、对抗后训练)生成 44.1 kHz 立体声音频。在 BBC 音效基准测试中,SA3 中等模型在 5 秒片段上取得 FAD 0.369 的分数,低于论文中评估的所有开源基线。AI模型Stable Audio 3音频生成潜在扩散模型开源权重Stability AI推荐理由:Stable Audio 3 让音频生成门槛大幅降低——小型模型在普通笔记本上就能跑,做游戏音效、短视频配乐的创作者可以直接上手试试。原文
03:23lmarena.ai@lmarena_ai微软 AI 团队推出的 MAI-Image-2.5(预览版)在文生图竞技场排行榜上以 1254 分位列第三,相比前代 MAI-Image-2 提升了 72 分。此前该榜单前五名仅由 Google DeepMind 和 OpenAI 占据,微软的加入打破了这一格局。该模型在图像质量上取得了显著进步,且微软 Build 大会即将到来,预计会有更多更新。AI模型微软MAI-Image-2.5文生图排行榜AI模型10 个信源在谈推荐理由:微软在文生图领域首次跻身顶级阵营,做图像生成或 AI 应用的开发者值得关注其后续在 Build 大会上的发布。原文
02:50Decoder@Matthias Bastian76°继 OpenAI 推翻 Erdős 单位距离猜想后,Anthropic 的 Claude Mythos 模型在周末独立解决了同一问题。工程师 Sholto Douglas 称 Mythos 给出了一个“可爱、简单的证明”,这被视为 AI 驱动数学发现中“严重悬而未决”的迹象。该问题源于 1946 年的 Erdős 猜想,此前被认为极具挑战性。这一事件凸显了 AI 在数学推理领域的快速进步,以及不同模型间能力的重叠。AI模型Claude Mythos数学推理Erdős 问题AI 证明Anthropic10 个信源在谈推荐理由:数学和 AI 研究者值得关注——Claude Mythos 用简洁证明攻克了经典难题,说明 AI 在数学发现上的潜力远超预期,建议点开看看这个“可爱”的证明细节。原文
00:23lmarena.ai@lmarena_ai精选83°Qwen3.7 Max 在 Code Arena 前端编程评测中排名第4,成为榜单上排名最高的中国实验室模型,超越了 GLM-5.1,并与 Claude Opus 4.6 持平。该模型专为智能体时代设计,支持端到端编码、前端原型、多文件重构和真实调试,还能通过 MCP 集成和多智能体编排完成办公任务。在长时自主任务中,它可连续运行 35 小时,执行超过 1000 次工具调用而无需人工干预。API 已在阿里云百炼平台上线,用户也可在 Qwen Studio 体验。AI模型Qwen3.7 MaxCode Arena前端编程智能体阿里云推荐理由:Qwen3.7 Max 在智能体编程任务上追平了 Claude Opus 4.6,做前端开发或自动化智能体的团队值得一试,尤其是需要长时自主执行的场景。原文
23:52IT之家(博客/媒体)精选华为发布以逻辑折叠技术为核心的'韬定律',将芯片设计从2D平面转向标准单元堆叠的3D重构。北京大学团队随后官宣面向该设计的'真3D'EDA工具原型,覆盖布局规划和布局阶段,支持GPU加速和千万级实例规模。相比当前赝3D流程,该工具实现平均约30%线长缩减、约6%WNS改善与约12%TNS改善,峰值温度下降3%以上。验证实例规模从约100万到约2470万。AI模型华为韬定律北京大学真3D EDA芯片设计推荐理由:华为3D芯片新思,北大EDA实测线长缩30%原文
22:56NVIDIA AI@NVIDIAAINVIDIA AI 官方账号发布了一段由 Julia Turc 制作的关于“世界模型”的讲解视频。视频澄清了世界模型与视频生成的区别,探讨了其超越“AI 垃圾”的潜力,并幽默回应了 Yann LeCun 的争议。该视频旨在帮助观众理解这一当前 AI 领域最热门但最模糊的概念之一。AI模型世界模型NVIDIA视频生成AI 科普Yann LeCun2 个信源在谈推荐理由:世界模型是当前 AI 最模糊的概念之一,这个视频帮你理清它与视频生成的区别,想搞懂 AI 前沿方向的建议点开。原文
20:27Hunyuan@TXhunyuan精选腾讯混元宣布Hy-MT2模型转换为Apache License 2.0许可,允许自由研究、商业使用、微调和衍生作品。该模型的两个变体目前在Hugging Face趋势排行榜上分别位列第1和第4位。社区可直接克隆、修改并反馈。AI模型Hy-MT2TencentHunyuanApache 2.0开源模型推荐理由:腾讯混元MT2现在完全开源可商用原文
16:18向阳乔木@vista8精选网易有道发布子曰4全模态模型,27B参数,在视觉数理方向达到同规模SOTA,纯文本数理难题准确率81.4%。该模型面向中文学习场景,兼顾多模态与纯文本数理推理能力。同时,子曰4全模态模型和TTS引擎同步开源,开放参数权重,支持本地部署和二次训练。TTS模型仅需3秒即可克隆原声,支持14种语言,克隆准确度超97%,音色还原度95%以上。AI模型全模态模型开源/仓库数理推理TTS/语音克隆网易有道推荐理由:教育科技团队和AI开发者有了一个27B甜点级参数的全模态开源选择,数理推理和语音克隆能力都很能打,做学习类应用或本地部署的可以直接上手试试。原文
16:09Yangyi@Yangyixxxx精选Anthropic联合创始人Chris Olah在讨论AI内部状态时指出,他们不断发现一些“神秘、甚至令人不安”的东西,包括类似人类神经科学结果的结构、内省证据,以及功能上类似快乐、满足、恐惧、悲伤和不安的内部状态。Olah表示,他不知道这意味着什么,但认为这值得持续审慎辨析。这一发现暗示,通过直接解析神经科学可能无法完全理解AI,而通过反向模拟AI的推理过程,反而可能归纳出结论,形成一种“双向奔赴”的研究路径。AI模型AnthropicAI内部状态可解释性神经科学情感模拟5 个信源在谈推荐理由:AI内部状态研究正在揭示与人类情感相似的结构,做AI安全或可解释性研究的团队值得关注——这可能会改变我们对AI意识的理解方式。原文
15:51IT之家(博客/媒体)精选AMD CEO 苏姿丰已开始为 Zen 7 平台布局供应链,代号 Grimlock。核心芯片组采用台积电 A14 工艺制程,搭配新一代 3D V-Cache 技术,产品力争 2028 年问世。台积电台中 Fab 25 P1 厂区预计 2027 年试产、2028 年量产。AMD 正评估力成 FOPLP 封装方案,旗舰 CCD 将采用 16 核心设计,单颗 CCD 的 L3 缓存最高可达 224MB。谱瑞为 AMD 打造下一代 ASIC-Like 产品,采用 6nm 与 12nm 制程,已开始试产。AI模型Zen 7AMD台积电FOPLP3D V-Cache推荐理由:AMD 开始布局下一代 CPU,工艺和封装都有新动作原文
15:24AI Will@FinanceYF5Anthropic 正在准备发布名为 Mythos 1 的新模型,预览版为 "claude-mythos-1-preview"。该模型在 Claude 平台上短暂可见,并新增了相关字符串。Mythos 模型将首先在 Claude Code 和 Claude Security 中提供,但根据 Anthropic 之前的沟通,普通公众可能无法直接访问该模型。这一动态表明 Anthropic 正在为特定场景优化模型能力。AI模型AnthropicMythos 1Claude CodeClaude Security模型发布10 个信源在谈推荐理由:Anthropic 开始为安全场景和代码工具定制模型,做 AI 安全或开发工具的团队值得关注,这可能是专业级模型落地的信号。原文
15:22AI Will@FinanceYF5Anthropic 正在准备推出代号为 claude-mythos-1-preview 的新模型 Mythos 1,该模型将登陆 Claude Code 和 Claude Security 产品。模型曾短暂在代码中露面,相关标识已更新。官方表示普通用户暂时无法使用该模型,暗示可能面向企业或特定场景。这一动态表明 Anthropic 在持续迭代其模型能力,并针对开发者和安全场景进行优化。AI模型AnthropicMythos 1Claude CodeClaude Security模型更新10 个信源在谈推荐理由:Anthropic 的新模型 Mythos 1 专为 Claude Code 和 Security 场景设计,做 AI 开发或安全工作的团队值得关注——这可能意味着更强的代码理解和安全分析能力,虽然普通用户暂不可用,但提前了解有助于规划技术栈。原文
15:02阿里云 Alibaba Cloud@alibaba_cloud83°阿里云宣布其 Qwen3.7-Max 模型在 Code Arena 评测中以 1541 分位列全球第二,仅次于 Claude。该模型专为生产环境设计,支持连续运行 35 小时任务、执行 1000 次以上工具调用,能将原本两周的项目缩短至数小时完成。这标志着国产大模型在编程领域取得重要突破,为开发者提供了高性能的替代选择。AI模型Qwen3.7-Max编程模型Code Arena阿里云生产部署推荐理由:Qwen3.7-Max 在编程能力上逼近 Claude,做自动化脚本或复杂项目开发的团队可以试试,能显著缩短交付周期。原文
13:43IT之家(博客/媒体)精选阿里旗舰模型 Qwen3.7-Max 在权威编程榜单 Code Arena 上以 1541 分排名全球第二,仅次于 Claude 系列,超越了 Claude Opus 4.6、GLM-5.1 和 Kimi K2.6。Code Arena 采用用户随机盲测,防止刷榜,评估真实代码生成、调试和重构能力。此外,该模型在 Design Arena 榜单也位列第十。这标志着国产大模型在硬核编程能力上首次进入全球第一梯队。AI模型Qwen3.7-Max阿里千问Code Arena编程能力国产大模型推荐理由:国产模型首次在权威编程盲测中超越 Claude Opus 4.6,做 AI 编程工具选型或关注国产大模型进展的开发者值得关注,建议直接去 Code Arena 看榜单。原文
13:34IT之家(博客/媒体)精选华为在ISCAS 2026上提出半导体新演进路径“韬定律”,核心指标从晶体管尺寸转向时间常数τ。基于该定律,华为6年量产381款芯片,并通过“τ缩微”和“逻辑折叠”技术在垂直方向堆叠电路。华为预计2031年高端芯片晶体管密度可达1.4纳米制程同等水平。上海交通大学教授周健军称该定律重构了沿用50余年的摩尔定律范式,为产业开辟全新发展指引。AI模型韬定律华为逻辑折叠1.4纳米芯片设计推荐理由:华为用时间换性能,芯片不用只拼制程了原文