11:42arXiv cs.AI@Rahul Khedar, Mayank Malhotra, Avinash Karn, Mouli V, Prakhar MehrotraRhetor是一个多智能体系统,输入运行中的web应用和源码,输出带旁白和实时语音问答的排练直播演示。其跨模态特征表示融合UI探索与源码分析,并采用多策略语义定位器。在四个应用中测试,包括公共白板应用Excalidraw,定位器触发率(sigma-bar)在147个动作中为0.31-1.00。在53个动作的大负载任务上触发率约0.92,Excalidraw在迭代2收敛至1.00。论文还定义了十项指标的基准协议用于评估设计选择。论文Rhetor多智能体实时语音问答直播演示Excalidraw推荐理由:Rhetor能自动生成带实时问答的直播演示,比纯浏览器代理或固定视频强,在Excalidraw上达到100%定位准确率。原文