全部 AI 动态 · AI 热点

AITOP

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

6月12日

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？

11:03

arXiv cs.AI@Hui Wang, Tianyu Ren, Joseph Butler, Christopher Baker, Karen Rafferty, Simon McDade

针对生物科学应用中多模态数据常部分缺失的问题，研究者提出Latent World Recovery (LWR)框架。LWR通过将不同模态的嵌入对齐到共享潜在空间，并仅融合实际可用的模态嵌入来构建统一表示，避免了传统缺失模态重构带来的误差传播。该方法无需固定模态集或显式插补缺失数据，在真实多组学基准上对癌症表型分类和生存预测等下游任务表现有效。

论文多模态学习缺失模态潜在空间对齐生物信息学表示学习

推荐理由：做多模态学习或生物信息学研究的团队，LWR解决了缺失模态下的鲁棒表示学习痛点，直接利用可用模态避免误差累积，值得关注其实验结果。

原文

6月4日

11:32

arXiv cs.LG@Luca Thale-Bombien, Jan Ewald, Ralf König, Aaron Klein

精选

BBOmix 是首个针对真实生物数据的无监督表示学习超参数优化（HPO）开源表格基准。它包含来自 TCGA 和 SCHC 数据集的 105,000 次评估，涵盖四种自编码器架构和七种多组学模态。该基准量化了重建损失与下游任务性能之间的相关性，并评估了多种 HPO 方法，为无监督生物表示学习研究建立了严格基线。

论文超参数优化自编码器生物信息学组学数据基准测试

推荐理由：做生物信息学或组学数据降维的团队，终于有了一个标准化的 HPO 测试场——BBOmix 帮你省去从头调参的试错成本，做自编码器研究的可以直接用它验证方法。

原文

5月29日

09:17

arXiv: Anthropic@James P. Balhoff, Hilmar Lapp

精选

表型注释是将自由文本描述链接到本体术语的关键步骤，但传统上依赖高训练专家，难以规模化。本研究使用Anthropic和OpenAI的五个前沿LLM作为“智能体策展人”，在自包含工作空间中提供原始论文PDF、注释指南和本体文件，评估其与人类策展人的一致性。结果显示，所有智能体均达到原始研究中三位训练人类策展人的一致性范围，最佳智能体接近但未超越最佳人类策展人，且在所有指标上大幅优于传统NLP工具。这表明LLM智能体有潜力自动化表型注释，缓解本体策展瓶颈。

论文 LLM智能体表型注释本体策展生物信息学自动化

推荐理由：做生物信息学或本体工程的研究者终于有了可扩展的自动化方案——LLM智能体直接对标人类专家水平，建议点开看具体实现和评估细节。

原文

5月28日

11:31

arXiv cs.AI@Tirtharaj Dash

精选

BIRDNet 是一种新型神经网络架构，通过挖掘特征间的布尔蕴含关系（BIR）构建知识图，并将其编码为网络连接。该方法使用稀疏异常二项检验挖掘关系，形成有向图，等价于命题规则库。BIRDNet 的每层隐藏单元对应一条规则，仅连接两个特征，因此架构天然稀疏，最多只有 2/d 的权重活跃。模型保持可解释性，每个训练单元保留稳定的符号身份，规则可直接从网络读取。在六个转录组和蛋白质组基准测试中，BIRDNet 在 AUROC 上仅比最强基线低 0.02，但活跃参数减少高达 96 倍，且第一层规则能恢复已知生物标志物。

论文可解释AI 布尔蕴含稀疏网络生物信息学知识图

推荐理由：BIRDNet 解决了深度神经网络可解释性与稀疏性的矛盾，做生物信息学或知识图谱的团队可以直接用它的开源代码，在保持高精度的同时获得可读的规则。

原文

5月21日

10:07

arXiv: DeepSeek@Tianxiang Xu, Xiaoyan Zhu, Xin Lai, Xin Lian, Hangyu Cheng, Jiayin Wang

精选

现有软件缺陷检测研究缺乏针对生物信息学软件的专用数据集，导致模型在该领域表现受限。研究者推出了BioDefect，这是首个专为生物信息学软件缺陷检测设计的数据集，包含完整源代码仓库，保留了缺陷代码的真实上下文信息。该数据集解决了标签不一致和数据泄露问题，确保高质量和实验可靠性。在包括DeepSeek-R1在内的9个语言模型上的评估显示，BioDefect相比现有数据集平均F1分数提升29.61%至38.04%。这项工作填补了生物信息学软件缺陷检测的研究空白，为提升该领域软件质量保障提供了新方向。

论文缺陷检测生物信息学数据集 DeepSeek-R1 软件质量

推荐理由：做生物信息学软件质量保障的团队终于有了专用数据集——BioDefect 比通用数据集 F1 提升近 40%，做缺陷检测研究的可以直接用它来训练和评估模型。

原文

5月20日

21:08

Clement Delangue@ClementDelangue

83°

Hugging Face 发布了名为 Carbon 的开源 DNA 基础模型，包含开放权重、训练代码和数据管道。该模型专为下游生物学任务设计，可微调或持续预训练。Carbon 比同尺寸最佳模型快 275 倍，能在单 GPU 上不到 2 天处理整个人类基因组，甚至可在笔记本电脑上本地运行。其核心技术是 DNA 原生分词器，将序列分割为 6 碱基块以提升效率，同时保留单碱基分辨率。此举旨在推动生物学 AI 的透明化和本地化，避免个人健康数据依赖黑盒 API。

AI模型 Hugging Face DNA 模型开源/仓库生物信息学本地推理

推荐理由：Hugging Face 把 DNA 分析从黑盒 API 拉到了本地，做生物信息学或个性化健康研究的开发者可以直接在笔记本上跑基因组模型，值得试试。

原文

5月13日

21:35

21:35Anthropic: Research（资讯）

75°

Anthropic 推出了 BioMysteryBench，一个专门用于评估 AI 在生物信息学领域研究能力的基准测试。该基准包含 50 个来自真实生物信息学研究的难题，涵盖基因组学、蛋白质组学、系统生物学等多个子领域。Claude 在测试中展现了较强的分析推理能力，尤其在数据整合和假设生成方面表现突出。这项研究为 AI 在生命科学领域的应用提供了新的评估标准，也展示了 Claude 在专业科研场景中的潜力。

论文生物信息学基准测试 Claude 科研评估 Anthropic

推荐理由：生物信息学研究者或计算生物学家可以借此了解 Claude 在真实科研问题上的表现，评估其作为辅助工具的实用性。

原文

5月12日

19:11

arXiv cs.AI@Edward De Brouwer, Carl Edwards, Alexander Wu, Jenna Collier, Graham Heimberg, Xiner Li, Meena Subramaniam, Ehsan Hajiramezanali, David Richmond, Jan-Christian Hütter, Sara Mostafavi, Gabriele Scalia

AssayBench是一个面向LLM和智能体的表型筛选基准，基于1920个公开CRISPR筛选数据构建，覆盖5类细胞表型。它将任务转化为基因排名预测，并引入adjusted nDCG指标来评估不同实验间的性能。评估显示现有方法距离理论上限较远，且零样本通用LLM优于生物专用LLM和可训练基线。该基准为虚拟细胞模型和药物发现提供了标准化测试平台。

论文 LLM评估生物信息学虚拟细胞 CRISPR筛选表型筛选

推荐理由：为LLM在生物表型筛选任务中的能力评估提供了首个标准化基准，揭示了当前方法的不足和通用LLM的潜力，对药物研发自动化有实际参考价值。

原文