14:45Fireworks AI@FireworksAI_HQ精选Fireworks AI 与 Harvey 合作研究发现,将前沿闭源模型(如 Opus 4.8)作为顾问代理,与微调的开源工作代理结合,在三个基准测试中均取得更优结果。相比全部使用 Opus 4.8,该混合方案成本降低40-67%。该方法简单部署即可提升效果,为模型调用提供新思路。AI模型Fireworks AIHarveyOpus 4.8开源模型推理模型1 个信源在谈推荐理由:Fireworks AI 的实验证明,把闭源大模型当参谋、开源模型当打手,效果更好还省40%-67%的钱,值得关注。原文
23:46LangChain@LangChainAILangChain Labs 与法律 AI 公司 Harvey 合作发布了一项联合研究,探讨如何设计更高效的 AI 工作流。研究聚焦于 LangChain 框架在法律场景中的应用,包括文档分析、合同审查等任务。该研究提供了实际案例和最佳实践,帮助开发者利用 LangChain 构建专业级 AI 应用。对于关注 AI 与法律结合、或使用 LangChain 的团队,这份研究值得参考。AI产品LangChainHarvey法律AI工作流AI应用推荐理由:LangChain 与 Harvey 的联合研究展示了 AI 在法律领域的落地路径,做法律 AI 或企业级应用的开发者可以直接参考其中的工作流设计。原文
00:04LangChain@LangChainAILangChain Labs 与 Harvey 合作,针对验证器设计的效率进行了系统研究。他们以 Sonnet 的逐标准验证为基准,对比了 5 种不同验证器设置。该研究旨在量化不同验证器设计在任务中的效率差异,为开发者选择验证策略提供数据支持。结果有助于优化 AI 工作流中的验证环节,提升整体系统性能。论文LangChain验证器效率基准AI工作流Harvey推荐理由:做 AI 工作流和验证器设计的开发者,这份基准对比能帮你直接选型,省去自己试错的时间,建议点开看具体数据。原文
08:20Cognition@cognition_labs精选Harvey 工程团队将其内部背景代理 Spectre 集成到 Devin Desktop 中。现在,Spectre 的组织上下文可以存在于每位工程师的笔记本电脑上,并在他们喜爱的代理之间流动。这一集成使得团队能够更高效地共享和利用组织知识,提升了协作和开发效率。对于使用 Devin 的开发者来说,这是一个重要的功能增强。AI产品DevinSpectre智能体组织上下文Harvey推荐理由:Harvey 团队通过集成 Spectre 解决了组织上下文在代理间流动的痛点,使用 Devin 的开发者可以直接受益,建议关注这一实践。原文
03:21Clement Delangue@ClementDelangueHugging Face CEO Clement Delangue 指出,通过路由(routing)和后训练(post-training)开源模型,不仅能提升系统准确性,还能显著降低成本和提高速度。法律 AI 公司 Harvey 与 Fireworks AI 合作,在 100 个法律任务上测试发现:混合智能体(GLM 5.1 为主,路由到 Opus 4.7 作为顾问)在质量和成本上均优于单一前沿模型,18% 全通过率 vs 14%,成本 $368 vs $954。后训练(SFT)将 Kimi 2.6 的全通过率从 11% 提升至 15%,超过 Opus 的 14%,成本仅 $84,是 Opus 的 1/11。这挑战了“前沿模型在所有场景都更好”的营销叙事,为开发者提供了更务实、经济的 AI 系统构建思路。AI产品路由/混合智能体开源/仓库法律 AIHarveyFireworks AI推荐理由:法律 AI 团队终于有了可落地的降本增效方案——路由+微调开源模型比纯用前沿模型便宜 11 倍还更准,做垂直领域 AI 应用的开发者可以直接参考 Harvey 的实践。原文
22:07LangChain@LangChainAIHarvey 推出 LAB 基准,模拟人类验证方式,每个任务包含 50 多条通过标准,每条标准由独立法官调用评估。LangChain Labs 与 Harvey 合作,探索如何在大规模场景下提升效率。该基准可审计性强,但成本较高,合作旨在优化这一过程。AI产品法律 AI智能体基准测试LangChainHarvey推荐理由:法律 AI 团队终于有了可审计的验证基准——每个任务 50+ 标准像人类一样逐条检查,做法律智能体开发的可以直接参考。原文
21:15LangChain@LangChainAI精选LangChain 与法律 AI 公司 Harvey 联合发布了一项研究,聚焦于为法律智能体(legal agents)设计和测量高效验证器(verifiers)。该研究评估了不同验证方法的性能,旨在提升法律领域 AI 系统的可靠性和准确性,为法律 AI 应用提供新的评估框架。论文LangChainHarvey法律AI智能体验证器推荐理由:LangChain和Harvey最新的法律AI验证器研究原文