09:37
09:37
arXiv cs.AI@Tianyu Dong, Yangyang Liu, Jiang Zhou, Xinwei Wu, Xiaohu Zhao, Hao Wang, Heng Liu, Linlong Xu, Longyue Wang, Weihua Luo, Shaolin Zhu, Deyi Xiong 稀疏MoE(Mixture-of-Experts)模型在多语言场景下,低资源语言因数据稀缺导致路由与高资源语言不一致,限制跨语言知识共享。为此提出SARA(Semantically Anchored Routing Alignment)框架,利用对称JS散度对齐路由分布。在Qwen3-30B-A3B和Phi-3.5-MoE-instruct两个模型上,针对5种低资源语言和3个基准测试,SARA在Global-MMLU上分别提升0.8%和1.2%。该方法不依赖输出logits蒸馏,直接对齐内部路由机制,有效缓解低资源语言瓶颈。
推荐理由:论文提出SARA方法,用语义锚对齐MoE路由,让低资源语言也能用好专家能力,Global-MMLU提升0.8%-1.2%。
09:33
09:33
arXiv cs.AI@Octavia-Andreea Ciora, Julian Welzel, Dennis Frauen, Maresa Schröder, Marie Brockschmidt, Harry Amad, Thomas Callender, Mihaela van der Schaar, Stefan Feuerriegel OncoSynth是一种因果感知的生成式机器学习框架,采用扩散序列方法模拟协变量对治疗分配的影响以及治疗对生存的影响。在大规模肺癌(N=37,128)和乳腺癌(N=17,046)队列上评估,OncoSynth生成的合成患者队列能保留真实世界的患者、治疗和结局分布。与现有方法相比,OncoSynth将群体水平治疗效应估计误差降低最多66%,患者水平误差降低最多58%。该方法支持在数据共享受限场景下为精准肿瘤学提供可靠证据。
推荐理由:这篇论文推出了OncoSynth,能用合成数据准确估计肿瘤治疗效果,比现有方法误差降低一半以上,适合做医疗AI的朋友了解。
12:13
12:13
arXiv cs.AI@Negin Raoof, Richard Zhuang, Marianna Nezhurina, Etash Guha, Atula Tejaswi, Ryan Marten, Charlie F. Ruan, Tyler Griggs, Alexander Glenn Shaw, Hritik Bansal, E. Kelly Buchanan, Artem Gazizov, Reinhard Heckel, Chinmay Hegde, Sankalp Jajee, Daanish Khazi, Emmanouil Koukoumidis, Xiangyi Li, Hange Liu, Shlok Natarajan, Harsh Raj, Nicholas Roberts, Ethan Shen, Nishad Singhi, Michael Siu, Ashima Suvarna, Hanwen Xing, Patrick Yubeaton, Robert Zhang, Leon Liangyu Chen, Xiaokun Chen, Steven Dillmann, Saadia Gabriel, Xunyi Jiang, Anurag Kashyap, Boxuan Li, Yein Park, Minh Pham, Sujay Sanghavi, Lin Shi, Ke Sun, Yixin Wang, Zhiwei Xu, Erica Zhang, Siyan Zhao, Wanjia Zhao, Jenia Jitsev, Alex Dimakis, Benjamin Feuer, Ludwig Schmidt OpenThoughts-Agent项目提出一个完全开源的数据整理流程,用于训练通用智能体模型。研究团队进行超过100次对照实验,系统分析了数据来源和多样性的重要性。基于该流程构建了10万样本的训练集,微调Qwen3-32B模型后,在7个智能体基准上平均准确率达44.8%,比最强开源模型Nemotron-Terminal-32B(40.9%)提升3.9个百分点。该训练集在计算量可控的对比中表现出强扩展性,所有数据、管道和模型已在openthoughts.ai开源。
推荐理由:想自己训练智能体模型?这里有开源的数据配方和100次实验的经验,帮你少走弯路。
12:11
12:11
arXiv cs.AI@Zixuan Li, Haokun Lin, Yicheng Xiao, Zhiwei Li, Xinyang Song, Zelong Zheng, Yong He, Heng Yao, Ke Ding, Chao Yu, Chuan Yuan, Qi Li, Zhenan Sun 统一多模态大语言模型在文本到图像生成中仍难以精确遵循结构提示(如物体计数、空间关系、属性绑定、粗略布局)。IV-CoT提出的隐式视觉思维链框架将视觉条件分解为结构查询和语义查询的级联,结构查询先形成隐式视觉计划,语义查询再基于该计划渲染外观。训练时引入草图监督信号,无需推理时草图提取或中间解码,在单个前向传播中完成隐式CoT推理。该方法在GenEval和T2I-CompBench基准上取得更优结果,可视化分析验证了结构和语义查询的互补作用。
推荐理由:这篇论文解决了文生图模型在物体数量、空间位置等结构细节上经常翻车的问题,用隐式思维链单次前向传播搞定,在GenEval和T2I-CompBench上效果更好。
11:59
11:59
arXiv cs.AI@Shiyu Li, Ziqi Yan, Zhihao Wu, Jielong Lu, Weiran Liao, Jiajun Yu, Genjie Li, Zeyu Chu, Jiajun Bu, Haishuai Wang DeepBD是一种基于智能体的工作流,用于遗传出生缺陷的变异优先级排序和诊断解释。该工作流包括LLM辅助病例结构构建、预训练证据引擎、专家证据模块和接地诊断审查层。证据引擎从结构化规则证据、序列和变异效应表示以及表型条件生物学背景中学习患者特定变异分数。基于包含18,622例的胎儿和婴儿队列开发,DeepBD在内部保留的已解决病例基准上实现了Recall@1/3/5/10分别为0.658/0.882/0.912/0.929,超过了Exomiser、DeepRare和基于提示的LLM重排序基线。消融和重叠分析表明,规则证据、机制背景和专家细化提供了互补信号。
推荐理由:这篇论文提出了一个接地气的智能体工作流DeepBD,用LLM辅助分析遗传变异,在18,622例队列中召回率比Exomiser和DeepRare都高,适合做基因诊断研究的参考。
仅展示最近 2000 条内容。更早的内容请查阅 AI 日报存档(侧边栏 → AI 日报 → 顶部「往期日报」)。