全部 AI 动态 · AI 热点

6月30日

09:56

arXiv cs.LG@Khan Raiyan Ibne Reza, Omar Ibne Shahid

KrishokChat是首个基于引文的孟加拉语农业咨询指令微调数据集，从129份领域手册中提取290个层次化知识节点。利用分区种子生成矩阵扩展为139,200个监督微调对，并增强5,300个化学品安全和1,000个对抗安全实例，总计145,500个QA对覆盖18种作物类别。引入Farmer Benchmark包含1,001个真实农民查询用于评估。在Gemma-4-E2B上评估发现，微调提升结构化格式，但独立模型仍难准确泛化化学剂量。

论文 KrishokChat Gemma-4-E2B 孟加拉语农业咨询 RAG

推荐理由：做农业AI的朋友看过来！KrishokChat是首个孟加拉语农业咨询的引文数据集，提供14.5万条QA对和Farmer基准，比直接微调更适合做RAG。

原文

6月25日

09:40

arXiv: OpenAI@Nikolaos D. Tantaroudas, Ilias Karachalios, Andrew J. McCracken

论文介绍了Falco eleonorae，一个面向希腊小岛农民的双语（希腊语主、英语次）对话式AI助手。系统利用OpenAI GPT-5家族模型进行回答生成，并通过MCP工具查询本地作物、季节性日历、方言词汇等结构化数据。它支持语音输入（使用欧盟流式语音转文字服务）和图像描述（由视觉模型处理），并设计为渐进式Web应用以适应低带宽环境。作者论证，对于资源受限的农村部署，这种托管式检索增强方案比自托管模型更可靠且更易实现。

论文 Falco eleonorae GPT-5 MCP/工具多模态 RAG

推荐理由：OpenAI的GPT-5给希腊农民做了个接地气的AI助手，能说方言、看图、查作物日历，比通用聊天更实用。

原文

6月19日

09:53

arXiv cs.LG@Ali Asaria, Tony Salomone, Deep Gandhi

论文使用Qwen2.5-7B-Instruct对比了零样本、仅SFT、仅RAG和SFT+RAG混合四种方法在安大略住宅租赁法条文引用上的效果。混合方法以0.481精确匹配（节+条）取得最高分，且将幻觉降至零。SFT提升了高召回候选集中条款选择的鲁棒性，而仅用bge-small嵌入就超越了更大专用检索模型。扩大训练集未带来提升，0.70目标尚未达到。

论文 Qwen2.5-7B RAG SFT 零幻觉法律引用

推荐理由：这篇论文用Qwen2.5-7B做了个四路对比，发现微调加检索混合方案在法条引用上精确匹配0.481还零幻觉，比纯微调或纯检索都强，而且用轻量bge-small就够用。

原文

09:37

arXiv: OpenAI@Jose Manuel Suarez, Luis Mariano Bibbo, Joaquin Bogado, Alenandro Fernandez

论文提出一种结合大语言模型与检索增强生成（RAG）的混合方法，自动迁移Qiskit代码版本。该方法利用自动生成的迁移场景分类作为结构化的版本特定知识源。实验评估了Google Gemini Flash-2.5和OpenAI Gpt-oss-20b两种模型，在限制性检索方案下显著减少幻觉，提升描述质量。Google Gemini Flash-2.5在检测复杂重构场景中表现更优。研究证实了数据驱动方法在量子软件工程中的潜力。

论文 Qiskit 代码迁移 RAG Google Gemini Flash-2.5 量子软件工程

推荐理由：量子开发者福音！用LLM+RAG自动搞定Qiskit代码跨版本迁移，减少手动返工。Google Gemini Flash-2.5效果最佳，值得看看。

原文

6月17日

09:31

arXiv: DeepSeek@Esteban Schafir, Xu Zheng, Hojat Allah Salehi, Zhuomin Chen, Mo Sha, Wei Cheng, Dongsheng Luo

精选

DecoSearch是一个无需训练的Text-to-SQL框架，通过轻量级Schema Selector修剪数据库模式，LLM Judger判断查询是否需要分解为DAG子问题。在BIRD上达到70.53%执行准确率，在Spider上达88.31%，使用DeepSeek作为骨干模型，比训练无关基线消耗少一个数量级的token。该方法还可作为模型无关包装器，一致提升微调后的SQL生成骨干性能。

AI模型 DecoSearch DeepSeek Text-to-SQL 推理模型 RAG

推荐理由：DecoSearch不用训练就能把自然语言转SQL，在BIRD和Spider上准确率分别超70%和88%，比同类方法省十倍token。想提升SQL生成效率可以看看。

原文

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

09:52

arXiv cs.LG@Weihang Su, Jiacheng Kang, Jingyan Xu, Qingyao Ai, Jianming Long, Hanwen Zhang, Bangde Du, Xinyuan Cao, Min Zhang, Yiqun Liu

论文提出ReGrad（Retrievable Gradients）范式，将梯度视为可检索的知识单元。方法预先离线计算文档特定梯度并存入索引梯度库，推理时仅检索查询相关梯度进行临时权重适应。为解决原始语言建模梯度不适于查询驱动知识使用的问题，引入双层元学习目标重塑梯度为通用适应信号。实验在通用和领域特定设置中表明，ReGrad优于CPT和RAG基线，实现可扩展且可逆的参数化知识注入，不累积权重漂移。

论文 ReGrad CPT RAG 持续学习可检索梯度

推荐理由：这篇论文提出了ReGrad，把梯度当知识存起来，推理时才取用，不破坏原有模型参数，效果比CPT和RAG都好。

原文

6月12日