AITOP6月11日 15:28
精选
过去 24 小时,从 665 条中筛出 44 条
6月11日
15:28
1107 vs 303:谷歌悄悄开源了一个“拆打字机”的模型,把大模型速度翻了4倍
15:23
AITOP6月11日 15:23
15:07
AITOP6月11日 15:07
6月1日
00:09
AITOP6月1日 00:09
5月29日
5月22日
11:18
11:18
arXiv cs.LG@Jan Tempus, Philip Whittington, Craig W. Schmidt, Dennis Komm, Tiago Pimentel
精选
推荐理由:分词是NLP的基础环节,贪心算法长期占据主流——ConvexTok用凸优化给出了可证明接近最优的方案,做分词器优化或语言模型预训练的团队值得关注。
5月21日
09:46
09:46
arXiv cs.AI@Fernando Ortega, Raúl Lara-Cabrera, Jorge Dueñas-Lerín, Alejandro de la Torre-Luque, Mercé Salvador Robert, Enrique Baca-García
精选
推荐理由:精神科医生和医疗编码员每天面对大量诊断文本,这项研究展示了如何用LLM自动化ICD编码,大幅减轻行政负担。做医疗NLP或临床信息学的团队值得关注其方法。
5月15日
23:12
23:12
AlphaSignal@AlphaSignalAI
精选73°
推荐理由:扩散模型终于能高效处理文本了,做NLP或生成式AI的团队可以关注这个新范式——数据需求降低10倍,性能反而更好,值得一试。
