05:58PolymarketMoney@PolymarketMoney根据 Polymarket 预测市场数据,OpenAI 在 2025 年底前上市的概率已降至零。此前市场曾预期 OpenAI 可能通过 IPO 或 SPAC 方式上市,但最新动态显示这一计划已被搁置。这一变化可能源于公司内部战略调整或监管环境变化。对于关注 AI 行业资本动向的投资者和从业者而言,这是一个重要信号。行业OpenAI上市预测市场资本动向AI 行业10 个信源在谈推荐理由:OpenAI 上市预期归零意味着 AI 独角兽的资本退出路径生变,关注 AI 投资和创业的读者值得了解背后的原因。原文
06:28PolymarketMoney@PolymarketMoney据 Polymarket 预测市场最新数据,Anthropic 已不再被预计在 2025 年 9 月底前进行首次公开募股(IPO)。这一变化反映了市场对 AI 公司上市时间表的重新评估。Anthropic 作为 OpenAI 的主要竞争对手,其 IPO 计划一直备受关注。目前尚不清楚具体原因,但可能涉及公司战略调整或市场环境变化。行业AnthropicIPOAI 公司资本市场预测市场10 个信源在谈推荐理由:关注 AI 公司资本动态的投资者和从业者值得留意——Anthropic 的 IPO 推迟可能影响整个 AI 行业的融资和估值预期,建议点开了解背后原因。原文
10:53arXiv: DeepSeek@Tarun Kota精选预测市场依赖可靠的裁决机制,但现有方案在自动化速度与人工准确性间难以平衡。该研究评估了多智能体LLM架构(独立聚合与协商共识)在1189个已解决预测市场问题上的表现,对比GPT-5 Nano、DeepSeek V3和Llama-3.3-70B单模型基线。独立聚合(置信度加权投票)以83.43%准确率胜出,比最佳单模型高1.01个百分点;而协商共识因错误传播导致准确率降至76%。模型间错误相关性(0.529-0.689)限制了集成方法的理论上限。研究提出混合AI-人类裁决系统:仅自动裁决一致高置信度问题,可在47%数据上达到97.87%准确率,其余由人工审查。论文多智能体预测市场预言机LLM聚合投票推荐理由:预测市场从业者终于有了可落地的AI裁决方案——独立聚合投票比单模型更准,混合路由策略能平衡成本与精度,做预言机或去中心化应用的团队值得参考。原文
11:35arXiv: Anthropic@Thomas Mbrice该研究首次将立场检测应用于预测市场(如Polymarket)的评论,这些评论包含价格无法捕捉的方向性信号。由于评论极端简短、存在特定行话且类别严重不平衡(仅8.7%的评论反对市场结果),研究通过微调RoBERTa-base模型,探索了四种输入配置和三种数据增强条件。结果表明,市场上下文是最关键的因素,能将反对类别的召回率从0.10提升至0.45;反事实增强在弱配置下有效(F1从0.10升至0.24),但在强配置下会降低性能;50%的增强比例是最优剂量。注意力可解释性分析为所有发现提供了机制支持。论文立场检测预测市场反事实增强数据不平衡Polymarket推荐理由:做金融舆情或预测市场分析的团队会感兴趣——这篇论文用反事实增强解决了极端不平衡数据下的立场检测难题,50%合成数据是最佳实践,值得在类似场景中尝试。原文
11:46arXiv cs.AI@Yunhua Pei, Jingyu Hu, Yiwei Shi, Hongnan Ma, Weiru Liu, John Cartlidge精选StakeBench 是一个新的金融 NLP 评估框架,它通过分析 Polymarket 和 Manifold 预测市场上 2,261 个已结算市场的 560,876 条评论,将语言理解与市场承诺(如持仓方向、交易行为、赔率轨迹)挂钩,而非传统的人工标注情感。该框架包含四个诊断任务:检测市场承诺、识别持仓方向、预测未来交易行为以及集体赔率预测。实验发现,15 个 LLM 在方向识别上表现参差不齐(准确率 0.506-0.599),但在未来行动预测和赔率预测上普遍失败,且模型规模与性能无关,金融领域微调也无帮助。StakeBench 的代码和数据集以 CC-BY 4.0 协议开源。论文金融NLP市场承诺评估基准预测市场LLM推荐理由:金融 NLP 从业者终于有了一个基于真实市场行为的评估基准,比传统情感分析更贴近交易决策,做金融 AI 的团队值得关注。原文