Contagion Tensor:多智能体LLM输出分布耦合的测量框架

The Contagion Tensor: A Framework for Measuring Output-Distribution Coupling in Multi-Agent LLM Systems -- and Auditing the Claims It Enables

精选理由

想了解多智能体LLM之间怎么互相影响输出?这篇论文给出了可量化框架CAF,还拿DeepSeek和GPT-4o-mini做了实验,能看到图像条件会放大耦合效应。

AI 摘要

论文提出Contagion Tensor框架,量化多智能体LLM输出分布间的耦合。基于该张量定义Coupling Amplification Factor (CAF),形式为CAF=E[T_condition]/E[T_baseline],提供无单位基线比较。在2x2x2块正交仿真中,图像条件超线性效应(CAF=1.40)在禁用图像扰动模块后降为亚线性(CAF=0.87)。真实API实验:DeepSeek-Chat (R=30)和GPT-4o-mini (R=15,真实视觉)在统一人格下文本通信CAF≈1.0,多样人格导致收敛(CAF=0.88)。GPT-4o-mini内对比:C3 (文本) CAF=1.02 vs. C5(真实视觉,R=30) CAF=1.72,验证仿真预测。

AI 翻译 · 中文

论文提出Contagion Tensor框架,量化多智能体LLM输出分布间的耦合。基于该张量定义Coupling Amplification Factor (CAF),形式为CAF=E[T_condition]/E[T_baseline],提供无单位基线比较。在2x2x2块正交仿真中,图像条件超线性效应(CAF=1.40)在禁用图像扰动模块后降为亚线性(CAF=0.87)。真实API实验:DeepSeek-Chat (R=30)和GPT-4o-mini (R=15,真实视觉)在统一人格下文本通信CAF≈1.0,多样人格导致收敛(CAF=0.88)。GPT-4o-mini内对比:C3 (文本) CAF=1.02 vs. C5(真实视觉,R=30) CAF=1.72,验证仿真预测。

arXiv: DeepSeekWe introduce the Contagion Tensor, a measurement framework for quantifying how large language model (LLM) output distributions couple across modalities, agents, and time steps. From the tensor we derive the Coupling Ampl