02:26IT之家(博客/媒体)83°微软在 Build 2026 大会上发布自研 AI 模型系列,包括首款高级推理模型 MAI-Thinking-1。该模型为中等规模,在软件工程基准测试中达到业界领先水平,并承诺完全自研、未使用第三方蒸馏数据。同时发布的还有图像生成模型 MAI-Image 2.5、语音转写模型 MAI-Transcribe-1.5(速度达竞品五倍)、语音合成模型 MAI-Voice-2 及编程辅助模型 MAI-Code-1。MAI-Code-1 已集成到 GitHub Copilot 和 VS Code 中。这标志着微软在推理、图像、语音和编程等 AI 领域全面布局自研模型。AI模型推理模型微软MAI-Thinking-1编程助手语音合成推荐理由:微软终于拿出了自己的推理模型,而且强调纯自研、不蒸馏,这对关注模型自主可控的开发者是个信号。做软件工程或编程的团队可以关注 MAI-Code-1 在 Copilot 中的实际表现,值得一试。原文
17:49IT之家(博客/媒体)精选网易有道宣布将“子曰”大模型 4.0 的核心双引擎——多模态模型(27B 参数)和语音合成(TTS)模型面向全球全量开源。多模态模型在视觉数理问题上达到行业顶尖水平,纯文本中文数理难题准确率达 81.4%,并通过思维链重构将输出长度压缩 43.2%,降低推理成本。TTS 模型支持跨语种音色情感迁移克隆,3 秒内完成零样本原声复制,准确度超 97%,覆盖 14 种语言。开发者可免费下载、部署并二次开发,适合教育场景和语音应用。AI模型开源/仓库多模态模型语音合成教育场景网易有道推荐理由:教育场景的开发者终于有了可商用的开源多模态模型——27B 参数在数理问题上达到 SOTA,且推理成本更低;TTS 模型 3 秒克隆音色并跨语种带情感,做语音助手或教育产品的团队可以直接下载试试。原文
08:06IT之家(博客/媒体)腾讯会议正式推出“AI 同传”功能,支持模仿用户音色,时延低于3秒,实现发言与翻译几乎同步。每位参会者可独立开启同传,选择自己需要的语言,收听时仿佛用户本人用流利外语发言。该功能无需插件或外接设备,并支持调节同传与原声音量,方便核验关键信息。同时,AI 同传与文字转写、会中字幕打通,实现跨语言会议的可听、可译、可见、可记。AI产品腾讯会议AI同传语音合成实时翻译音色模仿推荐理由:跨国会议和远程协作的团队终于有了低延迟、高拟真的同传方案——不用外挂设备,还能模仿发言人音色,做国际业务或跨语言沟通的可以直接在腾讯会议里开启试试。原文