23:12IT之家(博客/媒体)72°月之暗面 Kimi 宣布将用 Agent 集群功能预测 2026 年美加墨世界杯全部 104 场比赛。该集群最多同时调度 300 个子 Agent,从战术、球员、伤病、赔率等维度独立分析,每个 Agent 给出结论、证据和置信度,最终融合输出概率预测。模型综合了 Elo、Poisson、xG 等多种方法,并发现德国队夺冠概率可能被市场低估。Kimi 明确表示预测不构成投注建议,高置信度准确率约 85%-90%,中等约 55%-65%。AI产品KimiAgent 集群世界杯预测多 Agent 协作体育分析推荐理由:Kimi 把 AI 预测世界杯玩出了新高度——300 个 Agent 并行分析 104 场,连天气和赔率变动都考虑到了。做体育数据分析或对 Agent 集群感兴趣的开发者,值得看看这种多 Agent 协作的推理框架。原文
23:12IT之家(博客/媒体)北卡罗来纳大学教堂山分校和美国东北大学的研究人员发现,主流AI模型在分析职业体育比赛时表现很差。他们创建了名为SVI-bench的新基准测试,包含35000小时比赛画面等数据,测试AI在感知、推理、模拟和自主行动能力。AI在基础感知任务中识别准确率约74%,但在因果推理环节成功率仅约40%,模拟球员下一步动作接近随机猜测,自主分析准确率只有5%。研究人员指出,AI擅长描述画面,但无法解释原因或预测未来,这意味着体育主播等需要深度理解的工作暂时不会被取代。论文AI模型体育分析基准测试推理能力研究推荐理由:这项研究揭示了AI在复杂场景推理上的真实短板,做体育内容或依赖AI分析的团队可以借此评估工具边界,值得点开看看AI到底哪里不行。原文