AITP
精选全部 AI 动态AI 日报Agent 接入关于更新日志信源提报反馈
登录 / 注册
AITOP
全部 AI 动态
AI 相关资讯全量信息流
全部博客资讯推文论文
全部模型产品行业论文技巧
标签:语音转文字×
6月18日
18:46
18:46IT之家(博客/媒体)
Canonical 于 6 月 17 日公布 Project Myna,一款面向 Ubuntu 桌面的本地语音转文字听写工具。首版计划随 Ubuntu 26.10(Stonking Stingray)发布。Myna 使用 AI 语音模型,所有识别任务在本地运行,无需联网。用户按下快捷键即可开始听写,转录文字直接插入当前应用,屏幕显示视觉反馈。Canonical 强调首版只专注基础听写,不涉及语音助手、语音命令或翻译功能。
AI产品CanonicalUbuntuMyna语音转文字本地AI

推荐理由:Ubuntu 用户看过来!Canonical 出了个叫 Myna 的本地听写工具,不用联网就能把语音转成文字,直接敲进文档里,首发跟着 26.10 系统版本走。
原文
6月16日
20:46
AITOP6月16日 20:46
600亿美元买下Cursor,xAI终于拿到了编程工具,但真正值得跟踪的或许不是AI600亿美元买下Cursor,xAI终于拿到了编程工具,但真正值得跟踪的或许不是AI
6月13日
10:57
10:57IT之家(博客/媒体)
iOS 27 Beta 1 新增“高级听写预览”功能,支持离线运行。该功能提升语音转写准确率,能实时处理大写字母与标点符号。用户需在设置中手动开启,启用后覆盖系统全局键盘场景。适配机型包括 iPhone 17 Pro、iPhone Air、第二代 Vision Pro(M5 芯片)、M4 芯片及以上 iPad(需 12GB 内存)、M3 芯片及以上 Mac(需 12GB 内存)。
AI产品iOS 27iPhone 17 Pro苹果离线听写语音转文字

推荐理由:苹果给新机加了离线听写
原文
6月12日
12:57
AITOP6月12日 12:57
Claude代码里藏了个20260612,18个月后的AI记忆革命已经开始倒计时
6月11日
15:28
AITOP6月11日 15:28
1107 vs 303:谷歌悄悄开源了一个“拆打字机”的模型,把大模型速度翻了4倍
15:23
AITOP6月11日 15:23
DiffusionGemma颠覆文本生成?自回归模型的“统治”要结束了
15:07
AITOP6月11日 15:07
每秒1107个token,Google开源的扩散模型为什么能改变本地推理格局?
5月30日
04:17
04:17Together AI@togethercompute
72°
Together AI 推出了目前最快的两个语音转文字(STT)模型,其中 NVIDIA Parakeet-TDT 0.6B v3 能在 10 秒内转录 20 小时的语音。该模型基于 TensorRT 优化、条件 CUDA 图、事件驱动 I/O 和共享内存等技术实现极致性能。这一进展大幅降低了大规模语音转录的延迟和成本,对需要实时或批量处理语音的团队意义重大。Together AI 通过系统级优化展示了 STT 模型在推理速度上的新标杆。
AI产品语音转文字NVIDIA Parakeet-TDTTogether AI推理优化TensorRT

推荐理由:语音转录速度提升了一个数量级,做实时语音应用或大规模音频处理的团队可以直接用上,省下不少时间和算力成本。
原文
精选全部日报登录