AITOP6月11日 15:28
精选
过去 24 小时,从 958 条中筛出 57 条
6月11日
15:28
1107 vs 303:谷歌悄悄开源了一个“拆打字机”的模型,把大模型速度翻了4倍
15:23
AITOP6月11日 15:23
15:07
AITOP6月11日 15:07
6月1日
00:09
AITOP6月1日 00:09
5月29日
5月20日
10:51
10:51
arXiv: DeepSeek@Ali Mohammadi Esfahani, Nafiseh Kahani, Samuel A. Ajila
精选
推荐理由:做LLM代码生成或提示词工程的开发者,这个框架直接解决了提示词敏感性问题——用RL自动优化提示词,比手动调参高效得多,建议关注其混合动作空间和奖励设计。
5月19日
10:00
10:00
arXiv cs.AI@Zheqin Yin, Yupei Ren, Yadong Zhang, Yujiang Lu, Man Lan
精选
推荐理由:做教育AI或文本评估的团队,TIDE用辩论机制解决了提示词优化中的噪声和稳定性问题,值得在议论文分析场景中尝试。
