全部 AI 动态 · AI 热点

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

6月12日

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？

6月3日

02:26

02:26IT之家（博客/媒体）

83°

微软在 Build 2026 大会上发布自研 AI 模型系列，包括首款高级推理模型 MAI-Thinking-1。该模型为中等规模，在软件工程基准测试中达到业界领先水平，并承诺完全自研、未使用第三方蒸馏数据。同时发布的还有图像生成模型 MAI-Image 2.5、语音转写模型 MAI-Transcribe-1.5（速度达竞品五倍）、语音合成模型 MAI-Voice-2 及编程辅助模型 MAI-Code-1。MAI-Code-1 已集成到 GitHub Copilot 和 VS Code 中。这标志着微软在推理、图像、语音和编程等 AI 领域全面布局自研模型。

AI模型推理模型微软 MAI-Thinking-1 编程助手语音合成

推荐理由：微软终于拿出了自己的推理模型，而且强调纯自研、不蒸馏，这对关注模型自主可控的开发者是个信号。做软件工程或编程的团队可以关注 MAI-Code-1 在 Copilot 中的实际表现，值得一试。

5月22日

17:49

17:49IT之家（博客/媒体）

精选

网易有道宣布将“子曰”大模型 4.0 的核心双引擎——多模态模型（27B 参数）和语音合成（TTS）模型面向全球全量开源。多模态模型在视觉数理问题上达到行业顶尖水平，纯文本中文数理难题准确率达 81.4%，并通过思维链重构将输出长度压缩 43.2%，降低推理成本。TTS 模型支持跨语种音色情感迁移克隆，3 秒内完成零样本原声复制，准确度超 97%，覆盖 14 种语言。开发者可免费下载、部署并二次开发，适合教育场景和语音应用。

AI模型开源/仓库多模态模型语音合成教育场景网易有道

推荐理由：教育场景的开发者终于有了可商用的开源多模态模型——27B 参数在数理问题上达到 SOTA，且推理成本更低；TTS 模型 3 秒克隆音色并跨语种带情感，做语音助手或教育产品的团队可以直接下载试试。

08:06

08:06IT之家（博客/媒体）

腾讯会议正式推出“AI 同传”功能，支持模仿用户音色，时延低于3秒，实现发言与翻译几乎同步。每位参会者可独立开启同传，选择自己需要的语言，收听时仿佛用户本人用流利外语发言。该功能无需插件或外接设备，并支持调节同传与原声音量，方便核验关键信息。同时，AI 同传与文字转写、会中字幕打通，实现跨语言会议的可听、可译、可见、可记。

AI产品腾讯会议 AI同传语音合成实时翻译音色模仿

推荐理由：跨国会议和远程协作的团队终于有了低延迟、高拟真的同传方案——不用外挂设备，还能模仿发言人音色，做国际业务或跨语言沟通的可以直接在腾讯会议里开启试试。