Mistral在UKRI基金提案实体提取中表现优于GPT-4o和DSIT-Taxonomies

Research Entity Extraction and Topic Detection from UKRI Grant Proposals

精选理由

这篇论文实打实比较了GPT-4o、Mistral和DSIT-Taxonomies在提取基金提案实体上的能力,Mistral准确率90.5%碾压对手,做科研数据挖掘的可以看看。

AI 摘要

这篇论文比较了GPT-4o、Mistral和DSIT-Taxonomies算法从42份UKRI基金提案摘要中提取研究实体的效果。Mistral实现了90.5%的主题分类准确率,远超DSIT-Taxonomies的71.4%。Mistral与GPT-4o的实体集质量相当且语义重叠度高,但Mistral在操作效率和安全性上更优。研究依托OpenAlex Topics分类体系,为大规模敏感数据分析提供参考。

AI 翻译 · 中文

这篇论文比较了GPT-4o、Mistral和DSIT-Taxonomies算法从42份UKRI基金提案摘要中提取研究实体的效果。Mistral实现了90.5%的主题分类准确率,远超DSIT-Taxonomies的71.4%。Mistral与GPT-4o的实体集质量相当且语义重叠度高,但Mistral在操作效率和安全性上更优。研究依托OpenAlex Topics分类体系,为大规模敏感数据分析提供参考。

arXiv cs.AIThis paper presents preliminary findings from a UKRI-funded Metascience project comparing three LLM-based approaches, GPT-4o, Mistral, and a bespoke algorithm, DSIT-Taxonomies, for extracting and classifying research ent