近期,'Fusion'在AI与工程交叉领域呈现两大趋势:一是多模态CAD程序生成中融合策略的标准化,二是人体动作编辑中跨轴特征融合的精细化。背景上,随着大模型向专业工程领域渗透,如何有效融合不同模态数据(如文本、图像、CAD模型)成为关键瓶颈。
- 主要进展包括:
- CADGenBench基准测试提出融合CAD几何与代码的评估框架,推动AI辅助设计标准化(AI 进入工程领域:CADGenBench 基准测试发布)。
- Cross-Axis Fusion方法在3D人体动作编辑中,通过跨姿态轴的特征融合显著提升了文本驱动的编辑自然度(Cross-Axis Fusion 提升文本驱动的3D人体动作编辑效果)。
- Rank-Aware Selective Fusion在混合情感识别任务中,通过选择性融合多模态特征(语音、文本、图像)获得亚军,验证了排名感知策略的有效性(Rank-Aware Selective Fusion 在混合情感识别中排名第二)。
- CADBench提供一个多模态CAD程序生成统一基准,将几何、文本和草图融合至程序生成管道(CADBench: 多模态CAD程序生成统一基准)。
当前焦点集中在:如何设计融合机制以平衡多模态数据的异构性——跨轴融合强调空间结构对齐,而选择融合则关注信息冗余排除。未来观察点包括:融合从感知任务向生成任务的泛化能力,以及像CAD这种高精度领域对融合可解释性的需求。