精选理由
Hebbia测了金融场景,Fable 5在文档推理和图表解读上碾压其他模型,搞金融AI的可以看看具体分数对比。
在Hebbia金融服务业基准测试中,Anthropic的Fable 5模型总分超过所有其他前沿模型。该模型在基于文档的推理任务上提升显著,并在图表与表格解读、问题解决两个子项中取得最高分。测试结果来自Hebbia发布的金融行业专属评测集,涵盖多个复杂金融场景。
AI 翻译 · 中文
在Hebbia金融服务业基准测试中,Anthropic的Fable 5模型总分超过所有其他前沿模型。该模型在基于文档的推理任务上提升显著,并在图表与表格解读、问题解决两个子项中取得最高分。测试结果来自Hebbia发布的金融行业专属评测集,涵盖多个复杂金融场景。
On Hebbia's Financial Services Benchmark, @AnthropicAI's Fable 5 scored higher than any other frontier model, with substantial gains in document-based reasoning, chart and table interpretation, and problem solving.