AITOP6月11日 15:28
精选
过去 24 小时,从 662 条中筛出 45 条
6月11日
15:28
1107 vs 303:谷歌悄悄开源了一个“拆打字机”的模型,把大模型速度翻了4倍
15:23
AITOP6月11日 15:23
15:07
AITOP6月11日 15:07
6月10日
09:32
09:32
arXiv cs.LG@Yiyuan She, Zhaojun Hu, Yifan Sun
精选
推荐理由:联邦学习团队终于有了一个兼顾理论严谨和实际效率的正则化方案——极值聚类能显著提升模型压缩和通信效率,做分布式系统或资源受限场景的开发者可以直接参考实验设置。
6月1日
00:09
AITOP6月1日 00:09
5月29日
5月27日
10:50
10:50
arXiv cs.LG@Ethan Harvey, Dennis Johan Loevlie, Michael C. Hughes
精选
推荐理由:做医学影像分析的团队终于有了一个简单有效的正则化技巧——Normal Guidance能显著提升弱监督下的切片定位精度,比现有MIL方法更准,建议做3D医学图像分类的开发者试试。
5月22日
10:59
10:59
arXiv cs.AI@Vishal Rajput
精选
推荐理由:这篇论文把鲁棒性、域适应等一堆看似无关的问题统一成了一个统计框架,做表示学习或模型泛化的研究者可以直接用匹配原则指导正则化器设计,省去试错成本。
5月21日
09:46
09:46
arXiv cs.AI@Yixu Wang, Yang Yao, Xin Wang, Yifeng Gao, Yan Teng, Xingjun Ma, Yingchun Wang
精选
推荐理由:大模型安全对齐的脆弱性一直是部署痛点,AIR用巧妙的锚定策略解决了“一改措辞就破防”的问题,做安全对齐的团队可以直接集成到现有训练流程中。
5月19日
11:03
11:03
arXiv cs.LG@George Whittle, Pranav Vaidhyanathan, Juliusz Ziomek, Natalia Ares, Maike A. Osborne
精选
推荐理由:这篇论文解决了特征学习网络缺乏规范正则化理论的痛点,做深度学习理论和正则化研究的学者值得细读——它用黎曼几何统一了核机制和特征学习机制,并给出了可落地的弧岭正则化方案。
5月15日
10:01
10:01
arXiv cs.AI@Suorong Yang, Hanqi Zhu, Hai Gan, Fangjian Su, Guang Li, Furao Shen, Soujanya Poria
精选
推荐理由:PODS解决了数据选择中“选多少”被忽视的问题,做模型训练优化的团队可以直接集成到现有方法中,无需改动评分指标,值得一试。
5月12日
19:11
19:11
arXiv cs.LG@Tiberiu Musat
精选80°
推荐理由:为权重衰减的优越性提供了理论解释,将神经网络正则化与计算复杂性理论直接关联,对理解深度学习泛化机理有重要参考价值。
