AITP
精选全部 AI 动态AI 日报Agent 接入关于更新日志信源提报反馈
登录 / 注册
AITOP
精选
AI 自动挑选的高价值内容
全部模型产品行业论文技巧
标签:工业领域×
5月16日
23:54
Geek@geekbb
精选58
阿里巴巴发布了面向工业领域的大语言模型知识评测集 IndustryBench,包含 2049 道题目,题目来源为中国国家标准摘要和结构化工业产品记录。该评测集横跨 7 个能力维度和 10 个行业类别,旨在评估 LLM 在工业领域的知识掌握和推理能力。这是首个系统覆盖中国工业标准的评测基准,对工业智能化应用具有重要参考价值。
AI模型评测基准工业领域LLM阿里国家标准

推荐理由:做工业 AI 应用或评测的团队终于有了本土化的标准测试集——2049 道题覆盖 10 个行业,直接对标中国国家标准,建议做工业大模型落地的同学点开看看。