AITP
精选全部 AI 动态AI 日报Agent 接入关于更新日志信源提报反馈
登录 / 注册
AITOP
全部 AI 动态
AI 相关资讯全量信息流
全部博客资讯推文论文
全部模型产品行业论文技巧
标签:少样本提示×
6月16日
20:46
AITOP6月16日 20:46
600亿美元买下Cursor,xAI终于拿到了编程工具,但真正值得跟踪的或许不是AI600亿美元买下Cursor,xAI终于拿到了编程工具,但真正值得跟踪的或许不是AI
09:47
09:47arXiv cs.LG@Hangling Xie
该论文提出MAF(多模态自适应少样本提示)框架,用于提升多模态大语言模型在情感分析任务中的表现。MAF动态检索与查询相关的演示样本,通过编码面部表情、场景上下文和文本语义,并引入唇动幅度检测机制在多人场景中准确识别说话人。一个轻量级系数生成网络被训练用于实时输出查询条件化融合权重,加权聚合多模态相似度以选取Top-K信息量最大的示例。在多个公开基准数据集上,MAF相比骨干模型取得显著且一致的性能提升,并与强基线方法保持竞争力。
论文MAFMLLM情感分析少样本提示多模态

推荐理由:这篇论文提出MAF,能根据输入动态挑选示例来引导MLLM做情感分析,在多个数据集上效果提升明显,比固定提示强很多。
原文
6月12日
12:57
AITOP6月12日 12:57
Claude代码里藏了个20260612,18个月后的AI记忆革命已经开始倒计时
6月11日
15:28
AITOP6月11日 15:28
1107 vs 303:谷歌悄悄开源了一个“拆打字机”的模型,把大模型速度翻了4倍
15:23
AITOP6月11日 15:23
DiffusionGemma颠覆文本生成?自回归模型的“统治”要结束了
15:07
AITOP6月11日 15:07
每秒1107个token,Google开源的扩散模型为什么能改变本地推理格局?
5月26日
11:44
11:44arXiv cs.AI@Bar Weiss, Antonio Abu-Nassar, Adi Sosnovich, Karen Yorav
本文提出了一种基于大语言模型的两阶段流水线,用于对代码补丁中的变更进行结构化标签标注(如重命名、移动、逻辑修改等),以提升代码审查效率。该方法先对diff块进行标签分配,再精炼以捕捉结构关系和语义属性,采用少样本提示实现语言无关和可定制的标签,无需传统静态分析管线的工程开销。在人工标注的基准上,最佳配置达到了84%的召回率和81%的精确度。研究表明,LLM标签标注能有效补充静态分析,支持灵活、多语言、可自动化的代码审查工作流。
论文代码审查大语言模型结构化标签少样本提示软件工程

推荐理由:代码审查团队终于有了更智能的辅助——LLM自动标注变更类型(重命名/移动/逻辑修改),比人工逐行看diff高效太多,做代码审查或CI/CD集成的开发者可以直接参考。
原文
5月14日
13:27
13:27arXiv: OpenAI@Anuj Sadani, Deepak Kumar
精选
本文提出一种完全在设备端运行的 PII 替换流水线,使用 1.5B MoE 分类器检测实体、1-bit Bonsai-1.7B 小语言模型生成上下文相关的假名,以及规则生成器处理模式化字段。研究发现,小模型在少样本提示下会逐字复读演示输出,而非根据输入生成。通过引入基于语言环境的旋转演示池和 MD5 哈希采样,成功消除了 482/482 次调用中的复读现象。尽管生成的假名更自然,但在下游 NER 任务中,规则生成的多样性优于小模型的自然性,这是一个诚实的负面发现。
论文小语言模型PII替换少样本提示设备端推理隐私保护

推荐理由:做设备端隐私处理或小模型应用的团队,这篇论文揭示了少样本提示中一个容易被忽视的陷阱——模型会复读演示而非推理,并给出了一个简单有效的修复方案,值得点开看看。
原文
精选全部日报登录