全部 AI 动态 · AI 热点

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

6月12日

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？

5月30日

18:29

18:29

Qdrant@qdrant_engine

大多数车载媒体系统仍依赖关键词搜索，但驾驶时用户更倾向于用情绪、氛围和意图来寻找音乐。Sarvesh Talele 基于 Qdrant Edge 构建了一个完全本地化的 AI 媒体发现系统，支持语音、文本和情绪查询。该系统利用 Whisper 进行本地语音转录，通过向量嵌入实现语义检索，并使用 Qdrant Edge 在设备端完成向量搜索，无需依赖云端。这一项目展示了向量搜索如何在保护隐私的前提下，为车载场景提供实时、个性化的体验。

AI产品语义搜索车载系统 Qdrant Edge Whisper 本地AI

推荐理由：车载媒体搜索终于从关键词进化到语义理解，做车载系统或本地 AI 应用的开发者可以直接参考这个架构，体验隐私优先的实时搜索。

5月16日

21:04

21:04

宝玉@dotey

精选

博主dotey分享了利用AI或Agent制作字幕SRT的经验，强调断句和拼写纠错是关键。英文断句简单，通过标点即可切分；中文断句更复杂，因为Whisper生成的中文语音没有标点，且“word”是多个汉字。需要借助大模型断句加标点，再重新对齐时间戳拆分。对于长访谈，需分块处理，避免切分在句子中间。推荐Mac用户使用WhisperKit，支持单词级时间戳和说话人识别。

技巧字幕SRT 断句 Whisper WhisperKit AI工具

推荐理由：做字幕或视频处理的开发者，用AI断句和纠错能大幅提升效率，中文断句的坑和解决方案都讲清楚了，值得实操参考。