AITOP6月11日 15:28
精选
过去 24 小时,从 356 条中筛出 12 条
6月11日
15:28
1107 vs 303:谷歌悄悄开源了一个“拆打字机”的模型,把大模型速度翻了4倍
15:23
AITOP6月11日 15:23
15:07
AITOP6月11日 15:07
6月3日
10:42
10:42
arXiv cs.LG@Mihail Stoian, Mark Gerarts, Pascal Ginter, Andreas Zimmerer, Jan Van den Bussche, Andreas Kipf
精选
推荐理由:数据库团队终于有了处理ML过滤器的数据跳过方案——用轻量元数据就能剪枝,做大数据分析或数据库内核开发的建议看看,能直接提升查询性能。
6月1日
00:09
AITOP6月1日 00:09
5月29日
5月21日
12:31
12:31
arXiv cs.LG@Qishi Zhan, Ziheng Chen, Minxuan Hu
精选
推荐理由:做模型压缩和边缘部署的团队终于有了一个无需重训的通道级修复方案——ASR在高稀疏度下能显著挽回精度损失,建议做剪枝优化的开发者直接试。
5月20日
11:31
11:31
arXiv cs.LG@Yuhao Shen, Tianyu Liu, Xinyi Hu, Quan Kong, Baolin Zhang, Jun Dai, Jun Zhang, Shuang Ge, Lei Chen, Yue Li, Mingcheng Wan, Cong Wang
精选
推荐理由:做推理加速的团队终于有了一个不牺牲接受率的剪枝方案——Graft用检索补偿剪枝损失,直接提升EAGLE-3 21.8%的加速比,搞LLM部署的值得试试。
5月18日
10:31
10:31
arXiv cs.LG@Gabriel Garcia
精选
推荐理由:做模型压缩或剪枝的团队,如果只用一种等价性测试就决定删层,可能会踩坑——这篇论文用Qwen3-8B和Llama-3.1-8B的对比告诉你,测试方法选错,安全剪枝的层数能差好几倍。建议在剪枝前先跑一下两种swap-KL诊断。
