AITOP6月11日 15:28
精选
过去 24 小时,从 1009 条中筛出 58 条
6月11日
15:28
1107 vs 303:谷歌悄悄开源了一个“拆打字机”的模型,把大模型速度翻了4倍
15:23
AITOP6月11日 15:23
15:07
AITOP6月11日 15:07
6月8日
17:03
17:03
marktechpost@Asif Razzaq
精选
推荐理由:语音转文字场景的开发者终于有了微软官方的强力选项——MAI-Transcribe-1.5 在精度和速度上双双突破,做会议转录、客服质检或多语言内容处理的团队可以直接在 Azure 上试用,省去自建模型的麻烦。
6月3日
10:01
10:01
arXiv: OpenAI@Muhammad Ali
精选
推荐理由:这是首个为巴尔蒂语打造的ASR系统,解决了低资源语言语音识别的空白,做多语言语音技术或濒危语言保护的团队可以直接用这个开源模型和语料库。
6月1日
10:46
10:46
arXiv cs.AI@Máté Gedeon, Piroska Zsófia Barta, Péter Mihajlik, Katalin Mády
精选
推荐理由:匈牙利语 ASR 研究者终于有了更大规模的对话数据集——BEA-Dialogue+ 将可用训练数据从85小时扩展到200小时,做低资源语言语音识别的团队可以直接用于模型评估和微调。
00:09
AITOP6月1日 00:09
5月29日
5月22日
11:34
11:34
arXiv cs.LG@Berk Hayta, Hannah Laus, Simon Mittermaier, Felix Krahmer
精选
推荐理由:做不确定性估计的团队终于有了更简单的实现路径——用标准 Softmax 损失就能获得 EDL 效果,语音识别研究者可以直接替换现有训练流程试试。
