全部 AI 动态 · AI 热点

6月25日

14:45

14:45

Fireworks AI@FireworksAI_HQ

精选

Fireworks AI 与 Harvey 合作研究发现，将前沿闭源模型（如 Opus 4.8）作为顾问代理，与微调的开源工作代理结合，在三个基准测试中均取得更优结果。相比全部使用 Opus 4.8，该混合方案成本降低40-67%。该方法简单部署即可提升效果，为模型调用提供新思路。

AI模型 Fireworks AI Harvey Opus 4.8 开源模型推理模型

推荐理由：Fireworks AI 的实验证明，把闭源大模型当参谋、开源模型当打手，效果更好还省40%-67%的钱，值得关注。

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

6月12日

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？

6月5日

23:46

23:46

LangChain@LangChainAI

LangChain Labs 与法律 AI 公司 Harvey 合作发布了一项联合研究，探讨如何设计更高效的 AI 工作流。研究聚焦于 LangChain 框架在法律场景中的应用，包括文档分析、合同审查等任务。该研究提供了实际案例和最佳实践，帮助开发者利用 LangChain 构建专业级 AI 应用。对于关注 AI 与法律结合、或使用 LangChain 的团队，这份研究值得参考。

AI产品 LangChain Harvey 法律AI 工作流 AI应用

推荐理由：LangChain 与 Harvey 的联合研究展示了 AI 在法律领域的落地路径，做法律 AI 或企业级应用的开发者可以直接参考其中的工作流设计。

00:04

00:04

LangChain@LangChainAI

LangChain Labs 与 Harvey 合作，针对验证器设计的效率进行了系统研究。他们以 Sonnet 的逐标准验证为基准，对比了 5 种不同验证器设置。该研究旨在量化不同验证器设计在任务中的效率差异，为开发者选择验证策略提供数据支持。结果有助于优化 AI 工作流中的验证环节，提升整体系统性能。

论文 LangChain 验证器效率基准 AI工作流 Harvey

推荐理由：做 AI 工作流和验证器设计的开发者，这份基准对比能帮你直接选型，省去自己试错的时间，建议点开看具体数据。

6月4日

08:20

08:20

Cognition@cognition_labs

精选

Harvey 工程团队将其内部背景代理 Spectre 集成到 Devin Desktop 中。现在，Spectre 的组织上下文可以存在于每位工程师的笔记本电脑上，并在他们喜爱的代理之间流动。这一集成使得团队能够更高效地共享和利用组织知识，提升了协作和开发效率。对于使用 Devin 的开发者来说，这是一个重要的功能增强。

AI产品 Devin Spectre 智能体组织上下文 Harvey

推荐理由：Harvey 团队通过集成 Spectre 解决了组织上下文在代理间流动的痛点，使用 Devin 的开发者可以直接受益，建议关注这一实践。

03:21

03:21

Clement Delangue@ClementDelangue

Hugging Face CEO Clement Delangue 指出，通过路由（routing）和后训练（post-training）开源模型，不仅能提升系统准确性，还能显著降低成本和提高速度。法律 AI 公司 Harvey 与 Fireworks AI 合作，在 100 个法律任务上测试发现：混合智能体（GLM 5.1 为主，路由到 Opus 4.7 作为顾问）在质量和成本上均优于单一前沿模型，18% 全通过率 vs 14%，成本 $368 vs $954。后训练（SFT）将 Kimi 2.6 的全通过率从 11% 提升至 15%，超过 Opus 的 14%，成本仅 $84，是 Opus 的 1/11。这挑战了“前沿模型在所有场景都更好”的营销叙事，为开发者提供了更务实、经济的 AI 系统构建思路。

AI产品路由/混合智能体开源/仓库法律 AI Harvey Fireworks AI

推荐理由：法律 AI 团队终于有了可落地的降本增效方案——路由+微调开源模型比纯用前沿模型便宜 11 倍还更准，做垂直领域 AI 应用的开发者可以直接参考 Harvey 的实践。

6月3日

22:07

22:07

LangChain@LangChainAI

Harvey 推出 LAB 基准，模拟人类验证方式，每个任务包含 50 多条通过标准，每条标准由独立法官调用评估。LangChain Labs 与 Harvey 合作，探索如何在大规模场景下提升效率。该基准可审计性强，但成本较高，合作旨在优化这一过程。

AI产品法律 AI 智能体基准测试 LangChain Harvey

推荐理由：法律 AI 团队终于有了可审计的验证基准——每个任务 50+ 标准像人类一样逐条检查，做法律智能体开发的可以直接参考。

21:15

21:15

LangChain@LangChainAI

精选

LangChain 与法律 AI 公司 Harvey 联合发布了一项研究，聚焦于为法律智能体（legal agents）设计和测量高效验证器（verifiers）。该研究评估了不同验证方法的性能，旨在提升法律领域 AI 系统的可靠性和准确性，为法律 AI 应用提供新的评估框架。

论文 LangChain Harvey 法律AI 智能体验证器

推荐理由：LangChain和Harvey最新的法律AI验证器研究