全部 AI 动态 · AI 热点

6月18日

18:46

18:46IT之家（博客/媒体）

Canonical 于 6 月 17 日公布 Project Myna，一款面向 Ubuntu 桌面的本地语音转文字听写工具。首版计划随 Ubuntu 26.10（Stonking Stingray）发布。Myna 使用 AI 语音模型，所有识别任务在本地运行，无需联网。用户按下快捷键即可开始听写，转录文字直接插入当前应用，屏幕显示视觉反馈。Canonical 强调首版只专注基础听写，不涉及语音助手、语音命令或翻译功能。

AI产品 Canonical Ubuntu Myna 语音转文字本地AI

推荐理由：Ubuntu 用户看过来！Canonical 出了个叫 Myna 的本地听写工具，不用联网就能把语音转成文字，直接敲进文档里，首发跟着 26.10 系统版本走。

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

6月13日

10:57

10:57IT之家（博客/媒体）

iOS 27 Beta 1 新增“高级听写预览”功能，支持离线运行。该功能提升语音转写准确率，能实时处理大写字母与标点符号。用户需在设置中手动开启，启用后覆盖系统全局键盘场景。适配机型包括 iPhone 17 Pro、iPhone Air、第二代 Vision Pro（M5 芯片）、M4 芯片及以上 iPad（需 12GB 内存）、M3 芯片及以上 Mac（需 12GB 内存）。

AI产品 iOS 27 iPhone 17 Pro 苹果离线听写语音转文字

推荐理由：苹果给新机加了离线听写

6月12日

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？

5月30日

04:17

04:17

Together AI@togethercompute

72°

Together AI 推出了目前最快的两个语音转文字（STT）模型，其中 NVIDIA Parakeet-TDT 0.6B v3 能在 10 秒内转录 20 小时的语音。该模型基于 TensorRT 优化、条件 CUDA 图、事件驱动 I/O 和共享内存等技术实现极致性能。这一进展大幅降低了大规模语音转录的延迟和成本，对需要实时或批量处理语音的团队意义重大。Together AI 通过系统级优化展示了 STT 模型在推理速度上的新标杆。

AI产品语音转文字 NVIDIA Parakeet-TDT Together AI 推理优化 TensorRT

推荐理由：语音转录速度提升了一个数量级，做实时语音应用或大规模音频处理的团队可以直接用上，省下不少时间和算力成本。