AITOP6月11日 15:28
精选
过去 24 小时,从 661 条中筛出 45 条
6月11日
15:28
1107 vs 303:谷歌悄悄开源了一个“拆打字机”的模型,把大模型速度翻了4倍
15:23
AITOP6月11日 15:23
15:07
AITOP6月11日 15:07
6月10日
12:36
12:36
arXiv cs.AI@Xuan Han, Yihao Zhao, Mingyu You
精选
推荐理由:做图像生成和主体定制的团队终于有了一个能精准控制姿态的方案——Pose-ICL 用3D感知解决了2D模型的老大难问题,做定制化生成的开发者可以直接试试。
6月9日
11:39
11:39
arXiv cs.LG@Tuan A. Vu, Harri Lähdesmäki, Julien Martinelli
精选
推荐理由:做分子设计或材料优化的团队终于有了适配LSBO的上下文学习代理——它解决了预训练任务与潜空间优化不匹配的痛点,直接提升分子优化效率,建议做AI制药或计算化学的开发者试试。
6月7日
03:17
03:17
elvis@omarsar0
精选
推荐理由:如果你在构建或研究持续学习智能体,这个基准测试直接挑战了当前记忆系统的有效性——简单ICL反而更好,值得所有AI研究者点开看看。
6月5日
12:02
12:02
arXiv cs.AI@Alexander Möllers, Marvin Sextro, Julius Hense, Gabriel Dernbach, Klaus-Robert Müller
精选
推荐理由:做弱监督学习或医疗图像分析的团队,终于有了一个无需微调就能从少量标注包中学习的方案——单次前向传播搞定,值得直接试试。
6月4日
11:29
11:29
arXiv cs.LG@Yaseen M. Osman, Geoff V. Merrett, Stuart E. Middleton
精选
推荐理由:如果你在做ICL样本选择或主动学习,这篇论文用实验告诉你MLP激活值这条路走不通,省下试错时间。做LLM推理效率或特征分析的开发者,看完会理解为什么SAE可能是更好的方向。
6月1日
00:09
AITOP6月1日 00:09
5月29日
5月13日
19:12
19:12
arXiv cs.AI@Eric Bigelow, Raphaël Sarfati, Daniel Wurgaft, Owen Lewis, Thomas McGrath, Jack Merullo, Atticus Geiger, Ekdeep Singh Lubana
精选
推荐理由:这项研究把 LLM 上下文学习的黑箱过程可视化成了几何轨迹,做可解释性、推理机制或认知建模的研究者值得关注——它提供了干预模型信念的实操方法,看完会有启发。
19:12
19:12
arXiv: DeepSeek@Pruthvinath Jeripity Venkata
精选70°
推荐理由:这个框架解决了 LLM 行为研究中一个长期矛盾的谜题——为什么有的实验说模型死记硬背,有的说模型灵活跟随。做 LLM 评测或 prompt 工程的人,看完能更精准地预测模型在知识冲突场景下的行为,建议直接读原文的机制划分部分。
19:12
19:12
arXiv cs.AI@Rishabh Tiwari, Kusha Sareen, Lakshya A Agrawal, Joseph E. Gonzalez, Matei Zaharia, Kurt Keutzer, Inderjit S Dhillon, Rishabh Agarwal, Devvrit Khatri
精选70°
推荐理由:这篇论文解决了LLM在持续学习中灾难性遗忘和可塑性丧失的痛点,做模型微调、持续学习或Agent长期记忆的团队值得关注——FST框架让你不用在参数更新和上下文学习之间二选一,直接结合两者优势。
