10:37
10:37
arXiv cs.LG@Ilia Kulikov, Chenxi Whitehouse, Tianhao Wu, Yixin Nie, Swarnadeep Saha, Eryk Helenowski, Weizhe Yuan, Olga Golovneva, Jack Lanchantin, Yoram Bachrach, Jakob Foerster, Xian Li, Han Fang, Sainbayar Sukhbaatar, Jason Weston 论文提出Autodata方法,让AI代理扮演数据科学家角色,自动构建高质量的训练和评估数据。通过元优化训练数据科学家代理,使其学会生成更优数据。在计算机科学、法律推理和数学对象推理任务上,该方法相比经典合成数据集创建方法取得更优结果。元优化数据科学家代理本身也带来更大性能提升,表明代理式数据创建可将推理计算量转化为高质量模型训练。
推荐理由:这篇论文教你让AI自己当数据科学家,自动造出比手动更好的训练数据,还能越造越强,做研究写代码都能用上。
09:37
09:37
arXiv cs.AI@Tianyu Dong, Yangyang Liu, Jiang Zhou, Xinwei Wu, Xiaohu Zhao, Hao Wang, Heng Liu, Linlong Xu, Longyue Wang, Weihua Luo, Shaolin Zhu, Deyi Xiong 稀疏MoE(Mixture-of-Experts)模型在多语言场景下,低资源语言因数据稀缺导致路由与高资源语言不一致,限制跨语言知识共享。为此提出SARA(Semantically Anchored Routing Alignment)框架,利用对称JS散度对齐路由分布。在Qwen3-30B-A3B和Phi-3.5-MoE-instruct两个模型上,针对5种低资源语言和3个基准测试,SARA在Global-MMLU上分别提升0.8%和1.2%。该方法不依赖输出logits蒸馏,直接对齐内部路由机制,有效缓解低资源语言瓶颈。
推荐理由:论文提出SARA方法,用语义锚对齐MoE路由,让低资源语言也能用好专家能力,Global-MMLU提升0.8%-1.2%。
09:33
09:33
arXiv cs.AI@Octavia-Andreea Ciora, Julian Welzel, Dennis Frauen, Maresa Schröder, Marie Brockschmidt, Harry Amad, Thomas Callender, Mihaela van der Schaar, Stefan Feuerriegel OncoSynth是一种因果感知的生成式机器学习框架,采用扩散序列方法模拟协变量对治疗分配的影响以及治疗对生存的影响。在大规模肺癌(N=37,128)和乳腺癌(N=17,046)队列上评估,OncoSynth生成的合成患者队列能保留真实世界的患者、治疗和结局分布。与现有方法相比,OncoSynth将群体水平治疗效应估计误差降低最多66%,患者水平误差降低最多58%。该方法支持在数据共享受限场景下为精准肿瘤学提供可靠证据。
推荐理由:这篇论文推出了OncoSynth,能用合成数据准确估计肿瘤治疗效果,比现有方法误差降低一半以上,适合做医疗AI的朋友了解。
仅展示最近 2000 条内容。更早的内容请查阅 AI 日报存档(侧边栏 → AI 日报 → 顶部「往期日报」)。