AITP
精选全部 AI 动态AI 日报Agent 接入关于更新日志信源提报反馈
登录 / 注册
AITOP
全部 AI 动态
AI 相关资讯全量信息流
全部博客资讯推文论文
全部模型产品行业论文技巧
标签:语音输入×
6月27日
12:11
12:11IT之家(博客/媒体)
阿里千问输入法 macOS 版今日上线官网,语音输入速度最快达 300 字/分。内置 AI 自动润色功能,可对口语内容去语气词、纠错、格式化整理,支持 9 种方言。千问预告 iOS、Android、Windows 版将于近日发布。该输入法是独立 App,区别于此前作为千问 App 组件的语音输入功能。
AI产品千问输入法阿里macOS语音输入输入法

推荐理由:打字累?试试千问输入法 macOS 版,说话秒变文字,300 字/分,还能自动润色,支持 9 种方言,纯净无广告。
原文
6月26日
16:16
16:16berryxia@berryxia
Voicenotes将其语音输入功能升级为iOS系统级键盘。更新后,用户可在微信、邮件、笔记、评论区等任意输入框使用该键盘,语音实时转文字。这使得Voicenotes的转录和智能处理覆盖整个iOS系统,而非仅限App内。相比之前仅在Voicenotes App内使用,此次更新显著提升了语音输入的实用性和入口价值。
AI产品VoicenotesiOS语音输入系统级键盘

推荐理由:Voicenotes把语音做成了iOS系统键盘,现在你在任何App里都能直接说话转文字,超实用!
原文
6月20日
03:24
03:24GitHub@github
精选72°
GitHub Copilot CLI 推出新功能:支持设备端语音转文本模型,开发者可直接用语音向 Copilot 下达指令。同时内置 Rubber Duck 代理,利用第二个模型帮助发现代码盲点。两项功能现已正式可用。
AI产品GitHub CopilotCLI语音输入橡皮鸭调试编程助手

推荐理由:GitHub 给 Copilot CLI 加了语音输入和自动查漏的橡皮鸭,调试省事多了。
原文
6月16日
20:46
AITOP6月16日 20:46
600亿美元买下Cursor,xAI终于拿到了编程工具,但真正值得跟踪的或许不是AI600亿美元买下Cursor,xAI终于拿到了编程工具,但真正值得跟踪的或许不是AI
6月12日
12:57
AITOP6月12日 12:57
Claude代码里藏了个20260612,18个月后的AI记忆革命已经开始倒计时
6月11日
15:28
AITOP6月11日 15:28
1107 vs 303:谷歌悄悄开源了一个“拆打字机”的模型,把大模型速度翻了4倍
15:23
AITOP6月11日 15:23
DiffusionGemma颠覆文本生成?自回归模型的“统治”要结束了
15:07
AITOP6月11日 15:07
每秒1107个token,Google开源的扩散模型为什么能改变本地推理格局?
5月21日
08:00
08:00Google Gemini App@GeminiApp
Gemini 桌面应用新增语音输入功能,用户可直接通过语音在桌面工作流中操作。该功能能识别原始文档中的内容,并自动将其转换为格式化的邮件邀请等文本,支持跨应用无缝操作。这标志着 AI 助手从键盘输入向语音交互的重要演进,提升了多任务处理的效率。目前该功能已在 Gemini 桌面端上线,用户可体验更自然的交互方式。
AI产品Gemini语音输入桌面应用跨应用操作效率工具

推荐理由:语音输入让桌面工作流更高效,经常在多个应用间切换的办公族可以直接用语音完成文本转换和格式化,省去手动复制粘贴的麻烦。
原文
5月18日
20:04
20:04IT之家(博客/媒体)
阿里云宣布 QoderWork 正式上线设计工作台(Design Desk),支持语音输入,用户可通过语音描述需求在无限画布上获得可运行、可编辑的设计产物。该工作台内置一百多种风格参考与数十个设计技能,实现了设计即代码,设计产物可一键交付至 Qoder IDE 等开发工具。它通过 Questions、Design Plan 和 Nudge 三个机制重构了 AI 生产设计流程,降低无效迭代,确保方向对齐,并支持参数化微调。该工具面向设计师、产品经理和市场运营,分别解决了传统流程中的反复导出修改、高保真原型制作周期长、多场景物料交付效率低等问题。
AI产品阿里云QoderWork设计工作台语音输入设计即代码

推荐理由:QoderWork 设计工作台把语音描述直接变成可交付的设计稿,解决了设计师、产品经理和运营在传统流程中的反复沟通和低效迭代问题,做 UI 设计或产品原型的人可以直接用语音试起来。
原文
5月13日
15:51
15:51歸藏(guizang.ai)@op7418
70°
谷歌在安卓 I/O 大会上发布了 Gemini Intelligence,这是本次大会最大的 AI 相关发布。该功能将率先在三星 Galaxy 和 Pixel 手机上推出,后续扩展至所有安卓设备。核心功能包括跨应用自动完成繁琐任务(如将备忘录购物清单加入购物车)、Chrome 浏览器自动检索总结内容并填写表单、以及名为 Rambler 的语音输入功能,可自动将口语转为文本并去除语气词。最引人注目的是支持通过自然语言生成任意桌面小组件,例如每周食谱推荐或自定义天气数据组件。此外,谷歌还发布了 Material 3 Expressive 设计语言,组件在交互时边界会虚化模糊,视觉效果出色。
AI产品Gemini Intelligence跨应用操作AI小组件语音输入安卓

推荐理由:跨应用自动化和AI生成桌面小组件解决了日常操作繁琐和个性化需求,安卓用户和开发者可以直接体验这些新功能,建议关注后续适配。
原文
5月12日
17:19
17:19歸藏(guizang.ai)@op7418
本文对比了移动端和桌面端语音输入法的设计差异。作者指出移动端语音输入法必须配备全键盘以方便用户编辑,而桌面端语音输入法则最好与输入法解耦以实现更灵活的交互。Typeless犯了移动端无全键盘的错误,豆包则犯了桌面端与输入法耦合的错误。
AI产品语音输入产品设计Typeless豆包交互体验

推荐理由:观点鲜明地指出了主流语音输入产品在设计上的关键误区,对产品设计和用户体验优化有参考价值。
原文
精选全部日报登录