全部 AI 动态 · AI 热点

6月30日

10:37

arXiv: DeepSeek@Xuan Zhao, Haonan He, Qingyu Yang, Minglei Li, Jingqi Ye, Zelin Tan, Bo Wan, Peng Ye

提出ParametricSkills框架，将自由格式的文本技能在测试时转换为LoRA参数适配器。该框架利用大规模技能库和OpenCode合成的单/多轮轨迹训练超网络。在六个软件工程子任务上，比上下文学习平均提升6.44个点（由DeepSeek-V4-Flash评判），BERT Score和F1分数也更高。参数化技能具有累积性，为测试时持续学习提供了初步方向。

论文 ParametricSkills OpenCode DeepSeek-V4-Flash LoRA 软件工程

推荐理由：这篇论文把技能文本直接转成模型参数，编程任务上比上下文学习高出6分多，还能不断积累，挺实用的。

原文

6月29日

16:31

Pandaily@contact@pandaily.com (Pandaily)

中国AI大模型API调用量连续九周位居全球第一。DeepSeek-V4-Flash、MiMo-V2.5和MiniMax M3是调用量最高的三个模型。同期美国市场份额从72%暴跌至33%，中国模型的API调用优势正在扩大。

行业 DeepSeek-V4-Flash MiMo-V2.5 MiniMax M3 API调用量市场份额

推荐理由：中国AI模型API调用量九周全球第一，DeepSeek、MiMo、MiniMax这些国产模型很猛，美国份额从72%掉到33%，值得看看。

原文

6月23日

11:07

arXiv cs.AI@Alexander V. Kozachok, Alexander M. Nazimov, Shamil G. Magomedov

该研究扩展了Text2DSL自动生成领域特定语言代码的工作，用DeepSeek-V4-Flash作为教师模型，在结构化上下文（BNF语法、API规范、词汇表）下生成数据，经AST验证（使用esprima）和运行时验证（polkitd与pkcheck）的流水线，将PolkitBench语料从4,204对扩充到10,073对，其中AST有效性达100.0%、运行时通过率99.7%。在GigaChat-10B-A1.8B上对八种消融条件（C0-C7）评估发现：无上下文时语法有效从97.6%降至58.5%而完整上下文仅从98.6%降至97.4%，完整上下文C7在所有指标上最优，词汇表对语义质量贡献最大（组合得分+0.198），API和BNF分别对结构有效性贡献+24.7和+22.3个百分点。

论文 Text2DSL DeepSeek-V4-Flash GigaChat-10B-A1.8B PolkitBench 模型蒸馏

推荐理由：这篇论文用DeepSeek-V4-Flash生成了上万条验证过的Polkit规则，并通过消融实验证明结构化上下文不是锦上添花，词汇表才是提升语义质量的关键。

原文

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

6月12日