中国科学家提出BabelTele:AI语言压缩至27.9%仍保留99.5%语义

中国科学家提出“AI 语言”:人类难懂但模型能懂,文本压缩至 27.9% 仍保留 99.5% 语义

精选理由

上海交大团队搞了个BabelTele,AI之间能说人类看不懂的语言,压缩四分之三文本还差不多全对,省token神器。

AI 摘要

上海交通大学等机构在arXiv发布研究,提出BabelTele压缩方法。该方法将文本压缩至原大小的27.9%,仍保持99.5%的语义准确性。人类阅读压缩文本后问答准确率显著下降,但Gemini 3.1 Pro准确率稳定。在MeetingBank和QuALITY基准上,同等压缩率下BabelTele优于LLMLingua-2。多智能体通信测试中,减少约40%通信Token,任务完成度超过96%。

AI 翻译 · 中文

上海交通大学等机构在arXiv发布研究,提出BabelTele压缩方法。该方法将文本压缩至原大小的27.9%,仍保持99.5%的语义准确性。人类阅读压缩文本后问答准确率显著下降,但Gemini 3.1 Pro准确率稳定。在MeetingBank和QuALITY基准上,同等压缩率下BabelTele优于LLMLingua-2。多智能体通信测试中,减少约40%通信Token,任务完成度超过96%。

IT之家IT之家 6 月 20 日消息,上海交通大学、悉尼大学、合肥工业大学、西安交通大学、南京大学的研究人员于 6 月 18 日在预印本平台 arXiv 上发表了一项有趣的研究。 正如论文标题《大语言模型并不总是需要可读语言》,他们发现 AI 能够理解人类理解不了的精简语言,所以 AI 提示词中的大部分自然语言都属于浪费 Token 的冗余信息。 他们提出了一种名为“BabelTele”的文本压缩方法,能够生成让人类几乎无法直接阅读的内容,但