AITP
精选全部 AI 动态AI 日报Agent 接入关于更新日志信源提报反馈
登录 / 注册
AITOP
全部 AI 动态
AI 相关资讯全量信息流
全部博客资讯推文论文
全部模型产品行业论文技巧
标签:数据整合×
6月16日
20:46
AITOP6月16日 20:46
600亿美元买下Cursor,xAI终于拿到了编程工具,但真正值得跟踪的或许不是AI600亿美元买下Cursor,xAI终于拿到了编程工具,但真正值得跟踪的或许不是AI
6月12日
12:57
AITOP6月12日 12:57
Claude代码里藏了个20260612,18个月后的AI记忆革命已经开始倒计时
6月11日
15:28
AITOP6月11日 15:28
1107 vs 303:谷歌悄悄开源了一个“拆打字机”的模型,把大模型速度翻了4倍
15:23
AITOP6月11日 15:23
DiffusionGemma颠覆文本生成?自回归模型的“统治”要结束了
15:07
AITOP6月11日 15:07
每秒1107个token,Google开源的扩散模型为什么能改变本地推理格局?
6月1日
10:21
10:21arXiv cs.LG@Artur Szałata, Olga Novitskaia, Maiia Shulman, Matthew Mella, Altynbek Zhubanchaliyev, Fabian J. Theis
Chem-PerturBridge 是一个整合了37k+化合物、136种细胞环境和125万转录组样本的多数据集资源,覆盖8种实验类型,并统一了标识符、元数据和预处理流程。研究发现,不同数据集间相同化合物的logFC方向和幅度一致性较弱,但方向一致性相对稳定。该资源作为预训练数据,在化合物表示学习任务中优于仅使用L1000数据、Morgan指纹和基线方法。Chem-PerturBridge 支持跨数据集签名一致性的诊断评估,以及异质扰动转录组数据的模型复用。
论文药物发现转录组化合物表示学习数据整合Chem-PerturBridge

推荐理由:做药物发现或化学基因组学的团队终于有了一个标准化的多源转录组资源——37k化合物、136种细胞环境,直接拿来预训练或评估模型,省去数据清洗的麻烦。
原文
5月21日
10:48
10:48Google DeepMind@GoogleDeepMind
Google DeepMind 发布了 Science Skills,这是一套为 AI 配备的科学工具包,整合了来自 UniProt 和 AlphaFold 数据库等 30 多个主要生命科学来源的见解。该工具旨在加速日常研究流程,让 AI 能够直接利用权威科学数据辅助分析。对于生命科学领域的研究者来说,这有望大幅提升文献调研和数据处理的效率。
AI产品科研工具生命科学AlphaFoldGoogle DeepMind数据整合

推荐理由:生命科学研究者终于有了 AI 直接调用的权威数据工具——Science Skills 整合了 UniProt 和 AlphaFold 等关键资源,做分子生物学或药物发现的团队值得试试,能省下大量手动查库的时间。
原文
精选全部日报登录