Anthropic Fable 5在Hebbia金融服务基准测试中得分最高

On Hebbia's Financial Services Benchmark, @Anthrop…

精选理由

Hebbia测了金融场景,Fable 5在文档推理和图表解读上碾压其他模型,搞金融AI的可以看看具体分数对比。

AI 摘要

在Hebbia金融服务业基准测试中,Anthropic的Fable 5模型总分超过所有其他前沿模型。该模型在基于文档的推理任务上提升显著,并在图表与表格解读、问题解决两个子项中取得最高分。测试结果来自Hebbia发布的金融行业专属评测集,涵盖多个复杂金融场景。

AI 翻译 · 中文

在Hebbia金融服务业基准测试中,Anthropic的Fable 5模型总分超过所有其他前沿模型。该模型在基于文档的推理任务上提升显著,并在图表与表格解读、问题解决两个子项中取得最高分。测试结果来自Hebbia发布的金融行业专属评测集,涵盖多个复杂金融场景。

@hebbiaOn Hebbia's Financial Services Benchmark, @AnthropicAI's Fable 5 scored higher than any other frontier model, with substantial gains in document-based reasoning, chart and table interpretation, and problem solving.