全部 AI 动态 · AI 热点

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

6月12日

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？

5月28日

01:11

01:11

Milvus@milvusio

长期运行的 RAG 系统最危险的 bug 不是单次错误答案，而是错误被反复检索、强化，最终被系统当作事实。CRAG（Corrective RAG）通过在检索和生成之间加入轻量级评估步骤，对文档进行置信度评分（0.9 以上直接使用，0.5-0.9 补充网络搜索，低于 0.5 丢弃），并在下次检索前预过滤掉低分内容，从而打破“检索→存储→强化”的恶性循环。CRAG 需要向量数据库支持动态存储置信度、混合检索和分区键，Milvus 原生支持这些能力。

AI产品 RAG CRAG Milvus 向量数据库 AI工程

推荐理由：做 RAG 系统的开发者最怕错误被反复放大，CRAG 用简单评估机制切断雪球效应，值得在长期运行的生产环境中试试。

5月27日

01:38

01:38

Milvus@milvusio

传统 RAG 管道无法区分不同年份的文档，向量搜索按语义而非时间排序，导致过时结果与最新内容混在一起。CRAG（Corrective RAG）通过在检索和生成之间增加一个评估步骤来解决这个问题：轻量级模型对检索结果打分，当结果不准确或模糊时，自动转向网络搜索获取最新信息。Milvus 向量数据库支持多租户隔离、混合检索和灵活模式，适合部署 CRAG 的生产环境。

AI产品 RAG CRAG 向量数据库 Milvus 信息检索

推荐理由：CRAG 解决了 RAG 系统的时间感知痛点，做知识库问答或实时信息检索的团队可以直接参考 Milvus 的实现方案。

5月26日

00:52

00:52

Milvus@milvusio

精选

RAG 管道常犯一个错误：把语义相似度当成相关性，导致返回主题相近但实际不匹配的结果。CRAG（Corrective RAG）通过引入评估步骤，在检索后对文档进行相关性评分，并分三条路径处理：正确则精炼使用，模糊则补充网络搜索，错误则丢弃并回退搜索。评估器使用微调后的 T5-Large 模型，比通用 LLM 更快更精准。CRAG 能有效拦截 Apache 指南回答 Nginx 配置这类错误，确保生成只基于真正相关的内容。

论文 RAG CRAG 检索增强生成相关性评估 Milvus

推荐理由：做 RAG 系统的团队终于有了解决检索错配的实用方案——CRAG 在检索后加一道评估关卡，直接过滤掉相似但不相关的文档。做知识库问答或搜索增强应用的开发者，值得看看这个改进管道的方法。