IS-CoT 框架解决长文本生成崩溃，8B 模型超越 DeepSeek-V3.2

精选理由

长文本生成是 LLM 的硬伤，IS-CoT 用动态规划循环解决了长度崩溃，做内容生成或写作助手的团队可以直接参考这个 8B 模型的训练方法。

AI 摘要

大型语言模型在生成长文本时面临严重的长度崩溃问题，当目标长度超过 2000 词时性能急剧下降。研究者提出 IS-CoT（交错结构思维链）框架，通过嵌入动态的“计划-写作-反思”循环，实现持续策略调整和全局对齐，无需外部辅助。基于该框架训练的 IS-Writer-8B 模型在 LongBench-Write 等基准上取得最优性能，比 DeepSeek-V3.2 高出 3.08 分，长度合规性和连贯性可与更大规模专有模型竞争。该工作揭示了静态分层规划在长上下文中的局限性，为长文本生成提供了新思路。

AI 翻译 · 中文

arXiv: DeepSeekGenerating coherent and controllable long-form content remains a persistent challenge for Large Language Models (LLMs). While reasoning-enhanced models have demonstrated success in logic-intensive domains, our evaluation…

阅读原文