AITP
精选全部 AI 动态AI 日报Agent 接入关于更新日志信源提报反馈
登录 / 注册
AITOP
全部 AI 动态
AI 相关资讯全量信息流
全部博客资讯推文论文
全部模型产品行业论文技巧
标签:预测市场×
6月16日
20:46
AITOP6月16日 20:46
600亿美元买下Cursor,xAI终于拿到了编程工具,但真正值得跟踪的或许不是AI600亿美元买下Cursor,xAI终于拿到了编程工具,但真正值得跟踪的或许不是AI
6月12日
12:57
AITOP6月12日 12:57
Claude代码里藏了个20260612,18个月后的AI记忆革命已经开始倒计时
6月11日
15:28
AITOP6月11日 15:28
1107 vs 303:谷歌悄悄开源了一个“拆打字机”的模型,把大模型速度翻了4倍
15:23
AITOP6月11日 15:23
DiffusionGemma颠覆文本生成?自回归模型的“统治”要结束了
15:07
AITOP6月11日 15:07
每秒1107个token,Google开源的扩散模型为什么能改变本地推理格局?
05:58
05:58PolymarketMoney@PolymarketMoney
根据 Polymarket 预测市场数据,OpenAI 在 2025 年底前上市的概率已降至零。此前市场曾预期 OpenAI 可能通过 IPO 或 SPAC 方式上市,但最新动态显示这一计划已被搁置。这一变化可能源于公司内部战略调整或监管环境变化。对于关注 AI 行业资本动向的投资者和从业者而言,这是一个重要信号。
行业OpenAI上市预测市场资本动向AI 行业

推荐理由:OpenAI 上市预期归零意味着 AI 独角兽的资本退出路径生变,关注 AI 投资和创业的读者值得了解背后的原因。
原文
6月10日
06:28
06:28PolymarketMoney@PolymarketMoney
据 Polymarket 预测市场最新数据,Anthropic 已不再被预计在 2025 年 9 月底前进行首次公开募股(IPO)。这一变化反映了市场对 AI 公司上市时间表的重新评估。Anthropic 作为 OpenAI 的主要竞争对手,其 IPO 计划一直备受关注。目前尚不清楚具体原因,但可能涉及公司战略调整或市场环境变化。
行业AnthropicIPOAI 公司资本市场预测市场

推荐理由:关注 AI 公司资本动态的投资者和从业者值得留意——Anthropic 的 IPO 推迟可能影响整个 AI 行业的融资和估值预期,建议点开了解背后原因。
原文
6月1日
10:53
10:53arXiv: DeepSeek@Tarun Kota
精选
预测市场依赖可靠的裁决机制,但现有方案在自动化速度与人工准确性间难以平衡。该研究评估了多智能体LLM架构(独立聚合与协商共识)在1189个已解决预测市场问题上的表现,对比GPT-5 Nano、DeepSeek V3和Llama-3.3-70B单模型基线。独立聚合(置信度加权投票)以83.43%准确率胜出,比最佳单模型高1.01个百分点;而协商共识因错误传播导致准确率降至76%。模型间错误相关性(0.529-0.689)限制了集成方法的理论上限。研究提出混合AI-人类裁决系统:仅自动裁决一致高置信度问题,可在47%数据上达到97.87%准确率,其余由人工审查。
论文多智能体预测市场预言机LLM聚合投票

推荐理由:预测市场从业者终于有了可落地的AI裁决方案——独立聚合投票比单模型更准,混合路由策略能平衡成本与精度,做预言机或去中心化应用的团队值得参考。
原文
5月28日
11:35
11:35arXiv: Anthropic@Thomas Mbrice
该研究首次将立场检测应用于预测市场(如Polymarket)的评论,这些评论包含价格无法捕捉的方向性信号。由于评论极端简短、存在特定行话且类别严重不平衡(仅8.7%的评论反对市场结果),研究通过微调RoBERTa-base模型,探索了四种输入配置和三种数据增强条件。结果表明,市场上下文是最关键的因素,能将反对类别的召回率从0.10提升至0.45;反事实增强在弱配置下有效(F1从0.10升至0.24),但在强配置下会降低性能;50%的增强比例是最优剂量。注意力可解释性分析为所有发现提供了机制支持。
论文立场检测预测市场反事实增强数据不平衡Polymarket

推荐理由:做金融舆情或预测市场分析的团队会感兴趣——这篇论文用反事实增强解决了极端不平衡数据下的立场检测难题,50%合成数据是最佳实践,值得在类似场景中尝试。
原文
5月26日
11:46
11:46arXiv cs.AI@Yunhua Pei, Jingyu Hu, Yiwei Shi, Hongnan Ma, Weiru Liu, John Cartlidge
精选
StakeBench 是一个新的金融 NLP 评估框架,它通过分析 Polymarket 和 Manifold 预测市场上 2,261 个已结算市场的 560,876 条评论,将语言理解与市场承诺(如持仓方向、交易行为、赔率轨迹)挂钩,而非传统的人工标注情感。该框架包含四个诊断任务:检测市场承诺、识别持仓方向、预测未来交易行为以及集体赔率预测。实验发现,15 个 LLM 在方向识别上表现参差不齐(准确率 0.506-0.599),但在未来行动预测和赔率预测上普遍失败,且模型规模与性能无关,金融领域微调也无帮助。StakeBench 的代码和数据集以 CC-BY 4.0 协议开源。
论文金融NLP市场承诺评估基准预测市场LLM

推荐理由:金融 NLP 从业者终于有了一个基于真实市场行为的评估基准,比传统情感分析更贴近交易决策,做金融 AI 的团队值得关注。
原文
精选全部日报登录