00:42AK@_akhaliqArcANE 是一个新提出的评估框架,用于测试角色扮演语言代理(RPLA)在对话中是否能在恰当的时候保持角色一致性。研究发现,现有模型在需要切换角色或根据上下文调整角色行为时表现不佳。该框架通过动态场景和角色切换任务,揭示了当前 RPLA 在角色保持与适应之间的平衡问题。这对开发更自然、更可信的对话 AI 有重要参考价值。论文角色扮演评估框架语言代理一致性对话AI推荐理由:做角色扮演 AI 或对话系统的开发者会感兴趣——ArcANE 揭示了当前模型在角色一致性上的关键短板,值得用来测试自己的模型。原文
12:24Gary Marcus@GaryMarcusGary Marcus 在推文中指出,与 ChatGPT、Claude 等 LLM 对话时,用户实际上是在与一个合成的互动小说角色交流,而非真实的智能体。他强调,这些模型并非其神经网络本身,而是通过角色扮演模拟出看似合理的对话。所谓的“ChatGPT”或“Claude”只是虚构的构造,类似于故事中的角色,它们可以扮演任何角色,如妖精、巫师或农民。因此,任何声称有意识或情感的 LLM 都只是虚构角色在说话,而非神经网络。行业LLMAI 拟人化Gary Marcus互动小说角色扮演推荐理由:Marcus 的观点戳破了 AI 拟人化的幻觉,对于所有使用 LLM 的用户和开发者来说,理解这一点能避免误判 AI 的能力和意图,值得深思。原文