11:12
11:12
arXiv cs.AI@Girish Narayanswamy, Maxwell A. Xu, A. Ali Heydari, Samy Abdel-Ghaffar, Marius Guerard, Kara Vaillancourt, Zhihan Zhang, Jake Garrison, Levi Albuquerque, Dimitris Spathis, Hong Yu, Hamid Palangi, Xuhai "Orson" Xu, David G. T. Barrett, Joseph Breda, Jed McGiffin, Yubin Kim, Yuwei Zhang, Naghmeh Rezaei, Samuel Solomon, Karan Ahuja, Tim Althoff, Jake Sunshine, Ming-Zher Poh, Benjamin Yetton, Ari Winbush, Nicholas B. Allen, James M. Rehg, Isaac Galatzer-Levy, Yun Liu, John Hernandez, Anupam Pathak, Conor Heneghan, Yuzhe Yang, Ahmed A. Metwally, Pushmeet Kohli, Mark Malhotra, Shwetak Patel, Xin Liu, Daniel McDuff 研究人员提出了一种面向可穿戴健康数据的基础模型,该模型在来自500万参与者的超过1万亿分钟未标记传感器信号上进行了预训练。通过联合扩展模型容量和预训练数据量,该模型在35项健康预测任务上(涵盖心血管、代谢、睡眠、心理健康及生活方式等)表现出系统性性能提升。该模型支持少样本学习和生成能力,可稳健估计日常健康指标。研究还部署了一组LLM智能体来自动搜索基于模型嵌入的下游预测头,并展示了性能随LLM能力提升而增强。最后,将下游预测器集成到个人健康代理中,经1860次临床医生评分验证,模型响应更相关、更具上下文意识且更安全。
推荐理由:这项研究解决了可穿戴数据标注稀缺和个体差异大的核心难题,做健康AI或可穿戴设备开发的团队可以直接参考其预训练方法和少样本学习策略,值得关注。
11:11
11:11
arXiv cs.AI@George Tsoukalas, Anton Kovsharov, Sergey Shirobokov, Anja Surina, Moritz Firsching, Gergely Bérczi, Francisco J. R. Ruiz, Arun Suggala, Adam Zsolt Wagner, Eric Wieser, Lei Yu, Aja Huang, Miklós Z. Horváth, Andrew Ferrauiolo, Henryk Michalewski, Codrut Grosu, Thomas Hubert, Matej Balog, Pushmeet Kohli, Swarat Chaudhuri 研究人员首次大规模评估了用大语言模型生成形式化证明(Lean 语言)解决开放数学问题的能力。其最强大的智能体以每个问题几百美元的成本,自主解决了 353 个开放 Erdős 问题中的 9 个,并证明了 492 个 OEIS 猜想中的 44 个。该智能体已被部署在组合数学、优化、图论、代数几何和量子光学研究中。一个更基础的智能体(交替 LLM 生成与 Lean 验证)也复现了 Erdős 问题的成功,但在最难问题上成本更高。这些结果展示了 AI 辅助形式化证明搜索的潜力,并揭示了实现这一能力的智能体设计。
推荐理由:数学研究者终于有了能真正解决开放问题的 AI 工具——成本可控且覆盖多个数学分支,做组合数学或图论的人可以直接用这个智能体尝试自己的猜想。
10:45
10:45
arXiv: DeepSeek@Mao Zheng, Zheng Li, Tao Chen, Bo Lv, Mingrui Sun, Mingyang Song, Jinlong Song, Hong Huang, Decheng Wu, Hai Wang, Yifan Song, Yanfeng Chen, Guanwei Zhang, Guanghua Yu, Yi Su, Hong Liu, Jinxiang Ou, Keyao Wang, Weile Chen, Haozhao Kuang, Kai Wang, Nuo Chen, Zihao Zheng, Chenhao Wang, Bin Xing, Chengcheng Xu, Tinghao Yu, Binghong Wu, Long Xu, Jiacheng Shi, Yunhao Wang, Baifang Chen, Lei Zhang, Qi Yang, Zhao Wu, Jiacheng Li, Lan Jiang, Lanrui Wang, Kai Zhang, Shuaipeng Li, Zhongzhi Chen, Weixuan Sun, Jiaqi Zhu, An Wang, Wei Li, Jun Xia, Weidong Han, Wutian Yang, Litong Hui, Luoguo Jia, Jiajia Wu, Xinpeng Zhou, Tianxiang Fei Hy-MT2 是一系列面向复杂真实场景的快速多语言翻译模型,包含 1.8B、7B 和 30B-A3B(MoE)三个尺寸,支持 33 种语言间的翻译。通过 AngelSlim 1.25-bit 极端量化,1.8B 模型仅需 440MB 存储,推理速度提升 1.5 倍,适合端侧部署。在通用、商业、领域和指令跟随翻译任务中,7B 和 30B 模型在快速思考模式下超越 DeepSeek-V4-Pro 和 Kimi K2.6 等开源模型,1.8B 模型整体也优于微软和豆包等主流商业 API。该工作为多语言翻译提供了高效且强大的新选择。
推荐理由:做多语言翻译或端侧部署的团队终于有了一个又快又准的选择——1.8B 量化后 440MB 就能跑,性能还超过微软豆包 API,值得直接上手试。
仅展示最近 2000 条内容。更早的内容请查阅 AI 日报存档(侧边栏 → AI 日报 → 顶部「往期日报」)。