5月20日
11:24
11:24arXiv cs.LG@Emaad Khwaja, Chris Lettieri, Gerald Woo, Eden Belouadah, Marc Cenac, Guillaume Jarry, Enguerrand Paquin, Xunyi Zhao, Viktoriya Zhukov, Othmane Abou-Amal, Chenghao Liu, Ameet Talwalkar, David Asker
精选76°
Toto 2.0 是一系列开源时间序列基础模型,参数规模从 4M 到 2.5B,展示了单一训练配方即可实现预测质量的可靠提升。该模型家族在 BOOM、GIFT-Eval 和 TIME 三个基准上刷新了最先进水平。研究团队详细描述了架构、训练数据、超参数迁移管道等设计决策。所有五个基础检查点均以 Apache 2.0 许可证开源。这项工作标志着时间序列预测领域正式进入规模扩展时代。
推荐理由:时间序列预测终于有了可扩展的基础模型,做金融、能源、运维等预测任务的团队可以直接用开源权重,值得关注。
10:31
10:31arXiv cs.AI@Wen Shi, Zhe Wang, Huafei Huang, Qing Qing, Ziqi Xu, Qixin Zhang, Xikun Zhang, Renqiang Luo, Feng Xia
精选
TERGAD 是一种新型图异常检测框架,通过大语言模型将节点拓扑属性转化为自然语言描述,生成高维语义嵌入,再与原始节点特征自适应融合。该方法解决了现有文本增强方法忽略节点结构上下文的问题,能检测由内容与拓扑不一致导致的复杂异常。在六个真实数据集上,TERGAD 持续优于现有基线,消融实验验证了结构语义引导和门控融合机制的有效性。代码已开源。
推荐理由:做图异常检测的研究者终于有了一个能同时利用结构语义和文本特征的框架——TERGAD 用 LLM 把拓扑信息翻译成自然语言,比纯数值特征更易捕捉异常模式,建议做 GAD 的团队直接跑一下开源代码。
10:22
10:22arXiv cs.AI@Meisam Jamshidi Seikavandi, Alice Modica, Anna Obara, Shan Ahmed Shaffi, Fabricio Batista Narcizo, Tanya Ignatenko, Ted Vucurevich, Karim Haddad, Daniel Barratt, Daniel Overholt, Jesper Bunsow Boldt, Paolo Burelli, Andrew Burke Dittberner
精选
现有情感计算与社交信号处理数据集难以支持对同地小组中个体、人际和群体层面的情感耦合分析。研究者推出了GroupAffect-4,包含10组共40名参与者在四种协作任务(信息汇集、谈判、创意生成、公共物品博弈)中的多模态数据。每位参与者佩戴腕式生理传感器、眼动追踪眼镜和近讲麦克风,并收集连续情感自评、任务后问卷、任务结果和大五人格评分,所有数据通过共享时钟对齐。数据集覆盖91%以上的预期生理窗口和98%的眼动窗口,谈判任务的情感操纵检验验证了任务有效性。它定义了15个基准目标,涵盖个体内状态、个体间特质和群体动态三个分析层次,并提供了留一组交叉验证的可行性基线。数据集以BIDS风格结构、Croissant元数据、数据表、每会话质量报告和开源处理脚本发布。
推荐理由:做情感计算、社交信号处理或小组协作研究的团队终于有了一个覆盖个体、人际和群体三层次的高质量多模态数据集,数据完整性和任务效度都经过验证,可以直接用于训练和评估模型。

仅展示最近 2000 条内容。更早的内容请查阅 AI 日报存档(侧边栏 → AI 日报 → 顶部「往期日报」)。