10:42arXiv cs.AI@Michèle Finck大型语言模型已能生成至少中位质量的法律文本,但现有法律AI评估仅测量辅助性任务,无法评价其是否执行教义性法律推理。欧盟AI法案对高风险司法AI要求“适当准确性”,却因缺乏教义性推理基准而无操作内容。这篇论文首次系统定义该测量空白,并呼吁建立对应的标准化评估。论文LLMEU AI Act法律推理基准教义性推理推荐理由:这篇论文直击法律AI评测的核心缺陷——现有基准只测写文书,不测真正懂法理。做法律AI或合规的朋友值得看看。原文
11:21a16z@a16za16z 发文指出,合规工作长期依赖人工,流程繁琐且成本高昂,成为初创公司的“坟墓”。但 AI 正从“勉强可用”迈向“值得信赖”,尤其是在法律推理领域。多个 LLM 在 LegalBench 的 162 项法律推理任务中得分 80-100%,这直接适用于合规场景——因为合规本质上是应用法律推理。文章认为,AI 有望大幅降低合规的官僚成本和人力投入,为初创公司打开新机会。行业合规法律推理LLMa16z初创公司推荐理由:合规是很多初创公司的隐形杀手,a16z 这篇分析点出了 AI 如何把法律推理的准确率拉到可信水平,做合规、法务或监管科技的人值得一读,看看自己的流程能不能被 AI 重构。原文