美国地方法规语料库LOCUS发布:涵盖9,239个城市

Freeing the Law with LOCUS: A Local Ordinance Corpus for the United States

精选理由

法律AI研究者有福了!LOCUS提供了9,239个美国地方法规的机器可读语料,还附带了基于ModernBERT的分析工具,解决碎片化问题。

AI 摘要

LOCUS是美国首个大规模地方法规语料库,收录9,239个市县的法典。该数据集通过OCR处理了多种文档格式,覆盖3,144个县中的2,309个,覆盖多数美国人口。研究团队训练了基于ModernBERT的分类器,用于分析法规的模糊性和家长主义等维度。LOCUS-v1及其衍生模型已在Hugging Face上开源。

AI 翻译 · 中文

LOCUS是美国首个大规模地方法规语料库,收录9,239个市县的法典。该数据集通过OCR处理了多种文档格式,覆盖3,144个县中的2,309个,覆盖多数美国人口。研究团队训练了基于ModernBERT的分类器,用于分析法规的模糊性和家长主义等维度。LOCUS-v1及其衍生模型已在Hugging Face上开源。

arXiv cs.LGProgress in legal AI increasingly depends on access to authoritative legal text at scale. Yet one of the most consequential layers of American law remains largely absent from existing machine-readable corpora: local ordi