AITOP6月11日 15:28
精选
过去 24 小时,从 661 条中筛出 45 条
6月11日
15:28
1107 vs 303:谷歌悄悄开源了一个“拆打字机”的模型,把大模型速度翻了4倍
15:23
AITOP6月11日 15:23
15:07
AITOP6月11日 15:07
6月1日
00:09
AITOP6月1日 00:09
5月29日
5月19日
14:03
14:03
arXiv: DeepSeek@Dylan Marx, Marcel Dunaiski
精选72°
推荐理由:安全团队和LLM开发者需要警惕:多语言安全漏洞远未被堵住,低资源语言成为新的攻击面。建议立即检查自家模型的多轮对话安全机制。
5月15日
10:07
10:07
arXiv: Anthropic@Jean-Philippe Monteuuis, Cong Chen, Jonathan Petit
精选
推荐理由:做LLM安全评估的团队会发现现有ASR指标不可靠——论文用数据证明80%的ASR在连续测试中可能只剩50%,CAS-eval和CAS-gen直接解决了这个评估和生成的不一致问题,做红队测试的建议点开。
