AITP
精选全部 AI 动态AI 日报Agent 接入关于更新日志信源提报反馈
登录 / 注册
AITOP
全部 AI 动态
AI 相关资讯全量信息流
全部博客资讯推文论文
全部模型产品行业论文技巧
标签:Whisper×
6月16日
20:46
AITOP6月16日 20:46
600亿美元买下Cursor,xAI终于拿到了编程工具,但真正值得跟踪的或许不是AI600亿美元买下Cursor,xAI终于拿到了编程工具,但真正值得跟踪的或许不是AI
6月12日
12:57
AITOP6月12日 12:57
Claude代码里藏了个20260612,18个月后的AI记忆革命已经开始倒计时
6月11日
15:28
AITOP6月11日 15:28
1107 vs 303:谷歌悄悄开源了一个“拆打字机”的模型,把大模型速度翻了4倍
15:23
AITOP6月11日 15:23
DiffusionGemma颠覆文本生成?自回归模型的“统治”要结束了
15:07
AITOP6月11日 15:07
每秒1107个token,Google开源的扩散模型为什么能改变本地推理格局?
5月30日
18:29
18:29Qdrant@qdrant_engine
大多数车载媒体系统仍依赖关键词搜索,但驾驶时用户更倾向于用情绪、氛围和意图来寻找音乐。Sarvesh Talele 基于 Qdrant Edge 构建了一个完全本地化的 AI 媒体发现系统,支持语音、文本和情绪查询。该系统利用 Whisper 进行本地语音转录,通过向量嵌入实现语义检索,并使用 Qdrant Edge 在设备端完成向量搜索,无需依赖云端。这一项目展示了向量搜索如何在保护隐私的前提下,为车载场景提供实时、个性化的体验。
AI产品语义搜索车载系统Qdrant EdgeWhisper本地AI

推荐理由:车载媒体搜索终于从关键词进化到语义理解,做车载系统或本地 AI 应用的开发者可以直接参考这个架构,体验隐私优先的实时搜索。
原文
5月16日
21:04
21:04宝玉@dotey
精选
博主dotey分享了利用AI或Agent制作字幕SRT的经验,强调断句和拼写纠错是关键。英文断句简单,通过标点即可切分;中文断句更复杂,因为Whisper生成的中文语音没有标点,且“word”是多个汉字。需要借助大模型断句加标点,再重新对齐时间戳拆分。对于长访谈,需分块处理,避免切分在句子中间。推荐Mac用户使用WhisperKit,支持单词级时间戳和说话人识别。
技巧字幕SRT断句WhisperWhisperKitAI工具

推荐理由:做字幕或视频处理的开发者,用AI断句和纠错能大幅提升效率,中文断句的坑和解决方案都讲清楚了,值得实操参考。
原文
精选全部日报登录