全部 AI 动态 · AI 热点

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

6月12日

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？

12:34

12:34

arXiv cs.AI@Xinni Zhang, Zijing Liu, He Cao, Yu Li, Irwin King

精选

针对SMILES字符串的Transformer模型存在局部性缺陷：标准字符级分词会破坏化学上有意义的基团，迫使模型重复学习局部语法而忽略长程依赖。MolGram通过条件n-gram记忆模块，将局部字符串模式映射为可学习的嵌入向量，并动态注入隐藏状态，在不破坏标准分词器的情况下解决该问题。在无条件分子生成、正向反应预测和单步逆合成三个任务上，MolGram一致提升性能，且仅用1/3参数即可超越基线模型。该工作表明，显式局部模式记忆是一种高效的归纳偏置，尤其适合化学信息学场景。

论文分子语言模型 n-gram记忆 SMILES 化学信息学高效归纳偏置

推荐理由：做分子生成或逆合成预测的团队，MolGram用更少参数就能超越3倍大模型，值得在自家任务上试试。