AITOP6月11日 15:28
精选
过去 24 小时,从 785 条中筛出 40 条
6月11日
15:28
1107 vs 303:谷歌悄悄开源了一个“拆打字机”的模型,把大模型速度翻了4倍
15:23
AITOP6月11日 15:23
15:07
AITOP6月11日 15:07
6月4日
10:39
10:39
arXiv cs.AI@Andhika Bernard Lumbantobing, Hokky Situngkir
精选
推荐理由:做小模型算术推理的团队可以借鉴这种教学法思路——用人类教学步骤替代复杂强化学习,86M参数就能达到大模型水平,值得一试。
6月2日
10:10
10:10
Gary Marcus@GaryMarcus
精选
推荐理由:神经符号系统终于有了可量化的突破——小模型+符号推理就能碾压纯神经网络,做推理模型和逻辑 AI 的团队值得关注这个方向。
6月1日
00:09
AITOP6月1日 00:09
5月29日
5月26日
12:37
12:37
arXiv: DeepSeek@Pingfan Su, Kai Ye, Shijin Gong, Erhan Xu, Jin Zhu, Giulia Livieri, Chengchun Shi
精选
推荐理由:AI文本检测的可解释性和鲁棒性一直是痛点,READER用1.5B参数就超越了千倍大模型,做内容安全或反作弊的团队值得关注这个新思路。
5月19日
05:47
05:47
rohanpaul_ai@rohanpaul_ai
精选
推荐理由:客服团队和语音 AI 开发者可以亲眼看到:小模型专精化路线在延迟和效果上碾压通用大模型,PolyAI 的新工具让 10 分钟部署语音代理成为现实,值得立即关注。
5月14日
13:36
13:36
EleutherAI@AiEleuther
精选
推荐理由:这项研究打破了多语言模型必须靠大参数量才能取得好效果的固有认知,做低资源语言 NLP 的团队可以直接参考其方法,用更小的成本覆盖更多语言。
