18:46IT之家(博客/媒体)Canonical 于 6 月 17 日公布 Project Myna,一款面向 Ubuntu 桌面的本地语音转文字听写工具。首版计划随 Ubuntu 26.10(Stonking Stingray)发布。Myna 使用 AI 语音模型,所有识别任务在本地运行,无需联网。用户按下快捷键即可开始听写,转录文字直接插入当前应用,屏幕显示视觉反馈。Canonical 强调首版只专注基础听写,不涉及语音助手、语音命令或翻译功能。AI产品CanonicalUbuntuMyna语音转文字本地AI推荐理由:Ubuntu 用户看过来!Canonical 出了个叫 Myna 的本地听写工具,不用联网就能把语音转成文字,直接敲进文档里,首发跟着 26.10 系统版本走。原文
10:57IT之家(博客/媒体)iOS 27 Beta 1 新增“高级听写预览”功能,支持离线运行。该功能提升语音转写准确率,能实时处理大写字母与标点符号。用户需在设置中手动开启,启用后覆盖系统全局键盘场景。适配机型包括 iPhone 17 Pro、iPhone Air、第二代 Vision Pro(M5 芯片)、M4 芯片及以上 iPad(需 12GB 内存)、M3 芯片及以上 Mac(需 12GB 内存)。AI产品iOS 27iPhone 17 Pro苹果离线听写语音转文字推荐理由:苹果给新机加了离线听写原文
04:17Together AI@togethercompute72°Together AI 推出了目前最快的两个语音转文字(STT)模型,其中 NVIDIA Parakeet-TDT 0.6B v3 能在 10 秒内转录 20 小时的语音。该模型基于 TensorRT 优化、条件 CUDA 图、事件驱动 I/O 和共享内存等技术实现极致性能。这一进展大幅降低了大规模语音转录的延迟和成本,对需要实时或批量处理语音的团队意义重大。Together AI 通过系统级优化展示了 STT 模型在推理速度上的新标杆。AI产品语音转文字NVIDIA Parakeet-TDTTogether AI推理优化TensorRT5 个信源在谈推荐理由:语音转录速度提升了一个数量级,做实时语音应用或大规模音频处理的团队可以直接用上,省下不少时间和算力成本。原文