全部 AI 动态 · AI 热点

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

6月12日

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？

6月1日

10:53

10:53

arXiv: DeepSeek@Tarun Kota

精选

预测市场依赖可靠的裁决机制，但现有方案在自动化速度与人工准确性间难以平衡。该研究评估了多智能体LLM架构（独立聚合与协商共识）在1189个已解决预测市场问题上的表现，对比GPT-5 Nano、DeepSeek V3和Llama-3.3-70B单模型基线。独立聚合（置信度加权投票）以83.43%准确率胜出，比最佳单模型高1.01个百分点；而协商共识因错误传播导致准确率降至76%。模型间错误相关性（0.529-0.689）限制了集成方法的理论上限。研究提出混合AI-人类裁决系统：仅自动裁决一致高置信度问题，可在47%数据上达到97.87%准确率，其余由人工审查。

论文多智能体预测市场预言机 LLM 聚合投票

推荐理由：预测市场从业者终于有了可落地的AI裁决方案——独立聚合投票比单模型更准，混合路由策略能平衡成本与精度，做预言机或去中心化应用的团队值得参考。