全部 AI 动态 · AI 热点

6月29日

17:55

17:55

Yangyi@Yangyixxxx

用户认为FunASR模型在大部分场景下可用，精度偶尔不足。建议套用LLM进行修复，可解决绝大多数问题。其被评价为中国版Whisper中性价比最高的方案。

AI模型 FunASR ASR 语音识别 LLM 开源模型

推荐理由：有实测用户说FunASR比Whisper更值，精度不够时加个LLM就能补上，做中文语音识别可以试试。

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

6月12日

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？

5月15日

09:25

09:25

berryxia@berryxia

牛津大学博士后、前Meta和Microsoft研究员Kevin Lin发布了开源视频翻译工具Violin。该工具将ASR、LLM翻译和TTS无缝集成，可自动完成语音识别、多语言翻译和自然语音合成。用户可个性化翻译风格，将学术报告转为通俗版本，还能直接与视频聊天提问。Violin支持Web应用、CLI和Agent Skill，完全MIT开源，旨在打破语言壁垒，让高质量内容全球化。

AI产品视频翻译开源/仓库 ASR LLM翻译 TTS

推荐理由：做内容、教育或跨语言传播的团队，这个工具能一键解决视频翻译痛点，还能直接和视频对话，建议立刻装起来试试。