10:08arXiv cs.LG@Xiang Shi, Yifei Zhang, Peng Hu论文利用 LENS 数据集中的 Starlink RTT 测量数据,提出一个层级分析框架,将原始 RTT 序列转化为多尺度统计特征以进行跨区域比较。基于五个地理代表性区域的数据,发现延迟差异与基础设施可用性和 Starlink 天线到 PoP 距离强相关。互信息分析确认最小 RTT 为最具区分度的特征,XGBoost 特征重要性进一步支持该结论。模型在短期数据上达到 83% 准确率,但长期泛化能力下降,表明需要自适应模型。论文StarlinkLEO卫星互联网RTT延迟分析XGBoost推荐理由:想知道 Starlink 在不同地区延迟差异的原因?这篇论文用数据和机器学习告诉你答案,还给出了 83% 准确率的模型。原文
10:04arXiv cs.LG@Craig Atkinson研究在Open University Learning Analytics数据集(N=800,4个时间截点)上发现干预偏差:第56天,oracle标记70.1%学生无需干预,但零样本GPT-4o对73%学生推荐行动,误报率43个百分点。商业RAG和SQL增强检索校准同样差,在10000学生规模下每周期约4300次不必要接触。监督学习方法(ONNX Decision Transformer和XGBoost)校准误差接近零,Decision Transformer达到macro-F1 0.79、macro-recall 0.85,决策延迟低于5毫秒。LLM-as-judge评估(DeepEval G-Eval)无法捕捉干预偏差,反而奖励流畅的过度干预。论文GPT-4oDecision TransformerXGBoost干预偏差教育顾问推荐理由:零样本GPT-4o当教育顾问爱多管闲事?实测误报率43%,换成Decision Transformer或XGBoost就能准到几乎零误报。原文
09:57arXiv cs.LG@Ranuga Weerasekara, Heshan Nethmina, Manuja Ranathunga, Vinma Wettasinghe, Dinithi Navodya, Subavarshana Arumugam, Nirasha Munasinghe, Nisansa de Silva, Sandareka Wickramanayake斯里兰卡蔬菜市场因进口隔离导致供应中断时价格剧烈波动。研究者构建了结合零售价、农民价、天气变量、柴油成本和汇率的融合数据集,覆盖12种蔬菜、14个市场、2013-2019年数据。使用XGBoost和LightGBM梯度提升集成模型,经Optuna优化,比较统一模型和季节特定模型。季节特定模型中Yala季模型R2最高达0.9420,统一模型总体准确率90.84%、R2为0.9281。在完全未见过的2024年恶性通胀期,统一模型无需重新训练仍保持85.96%准确率,成功追踪价格飙升。论文XGBoostLightGBMOptuna斯里兰卡农产品价格预测推荐理由:这篇论文用XGBoost和LightGBM预测斯里兰卡蔬菜价格,统一模型在极端通胀期也能保持近86%准确率,对农民和决策者很有参考价值。原文
10:49arXiv cs.AI@Diana Magalhães, Eva Maia, João Vitorino, Isabel PraçaXGBoost-Forget是一种针对XGBoost模型的机器遗忘方法,用于删除特定数据点而无需完全重新训练。该方法在IoT-23和GeNIS两个网络入侵表格数据集上评估,使用多项指标衡量模型性能、遗忘效率和遗忘质量。实验表明,XGBoost-Forget在保持接近原始模型预测性能的同时,实现显著更快的遗忘速度,展示了其在表格网络入侵场景中的潜力。论文XGBoost机器遗忘IoT-23GeNIS网络入侵检测推荐理由:这篇论文提出了XGBoost-Forget,让XGBoost模型能快速遗忘特定数据,在入侵检测数据集上效果不错。原文
10:43arXiv cs.AI@Soheyl Bateni, Maryam AbdolaliClaMPAPP系统将LLM用作特征提取接口,而非直接诊断引擎,对自由文本病历进行模式约束提取后经确定性检查,再输入XGBoost分类器。该系统在两个德国医院独立儿科阑尾炎队列上评估,性能优于端到端LLM基线(包括开源和专有模型)。在内部和外部验证中,ClaMPAPP实现了最强整体诊断性能,并最小化漏诊阑尾炎病例。端到端LLM在敏感度-特异度权衡和叙事重排下表现更不稳定。论文ClaMPAPPLLMXGBoost儿科阑尾炎临床决策支持推荐理由:这篇论文提出了一个实用设计:用LLM理解病历文本,但把最终判断交给更可靠的机器学习模型,值得做临床AI的看看。原文
10:20arXiv cs.LG@Degala Pushpa Sri, Mayank Atreya, Lakshmi. H, Navin Chhibber, Mukesh Soni该研究针对电商平台难以预测客户未来购买行为的问题,提出混合Ret-DNN(零售深度神经网络)与XGBoost(极端梯度提升)模型。数据来自英国在线零售商,包含近500,000条交易记录。Ret-DNN作为特征提取器捕获时间特征,XGBoost基于提取特征输出购买概率。该模型在测试集上达到0.2193的平均绝对误差(MAE),优于纯Ret-DNN模型。论文Ret-DNNXGBoost客户行为预测电商预测分析推荐理由:这篇论文用Ret-DNN加XGBoost预测电商客户行为,MAE仅0.2193,比单独用Ret-DNN效果更好,适合做电商预测研究的人参考。原文