精选理由
1B模型,1500美元,性能超预期
HuggingFace CEO和Bengio团队推荐的HRM模型,参数量仅1B,训练成本仅1500美元。该模型在多个基准测试中表现优于同规模模型,如MMLU上达到45.2%,HellaSwag上达到72.1%。其核心创新在于高效训练方法,大幅降低了资源需求。
AI 翻译 · 中文
HuggingFace CEO和Bengio团队推荐的HRM模型,参数量仅1B,训练成本仅1500美元。该模型在多个基准测试中表现优于同规模模型,如MMLU上达到45.2%,HellaSwag上达到72.1%。其核心创新在于高效训练方法,大幅降低了资源需求。
模型参数量只有1B