论文精选

FlowPipe:LLM增强条件生成流网络构建数据管道

FlowPipe: LLM-Enhanced Conditional Generative Flow Networks for Data Preparation Pipeline Construction

精选理由

自动搭数据管道的难题,FlowPipe用LLM+生成流网络解决了,74个数据集上准确率升12%,训练快12倍多,比老方法强一截。

AI 摘要

论文提出FlowPipe,将数据预处理管道构建转化为有向无环图上的条件概率流生成问题。FlowPipe基于条件生成流网络(C-GFlowNets)与轨迹平衡目标,将终端验证奖励与早期决策联系。通过深度语义调制(FiLM)注入LLM提取的逻辑先验,并加入失败感知机制避免无效状态。在包含74个真实数据集的基准测试中,FlowPipe比Multi-DQN基线平均准确率提升11.96%,训练收敛速度提升12.5倍。

AI 翻译 · 中文

论文提出FlowPipe,将数据预处理管道构建转化为有向无环图上的条件概率流生成问题。FlowPipe基于条件生成流网络(C-GFlowNets)与轨迹平衡目标,将终端验证奖励与早期决策联系。通过深度语义调制(FiLM)注入LLM提取的逻辑先验,并加入失败感知机制避免无效状态。在包含74个真实数据集的基准测试中,FlowPipe比Multi-DQN基线平均准确率提升11.96%,训练收敛速度提升12.5倍。

arXiv cs.LGData preparation pipelines improve data quality in machine learning by transforming raw tables into learning-ready data through sequential cleaning and feature transformation operators. However, automatically constructin