精选 AI 资讯 · AI 热点

7月6日

12:01

AITOP7月6日 12:01

AI巨头瞄准'无利可图'疾病，颠覆传统制药逻辑

AI巨头瞄准'无利可图'疾病，颠覆传统制药逻辑

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？

6月1日

10:38

10:38

官方账号arXiv cs.AI@Arnau Marin-Llobet, Simon Henniger, Mahzarin R. Banaji

精选

研究发现，视觉语言模型（VLM）在处理性别模糊的图像（如全副武装的工人、背影）时，即使内部编码了女性关联，输出仍倾向于男性，尤其在传统女性职业上表现明显。研究者提出零样本指标LALS，通过将视觉token激活投影到文本嵌入空间，逐层测量概念关联。实验覆盖15个职业、800多张模糊图像和4个VLM，发现模型内部存在不对称过滤：男性信号从头到尾增强，女性信号在中间层达到峰值后被压制。服装颜色等文化线索会进一步调节内部关联。这项研究揭示了VLM在模糊输入下的性别偏见机制，对AI公平性评估有重要启示。

论文视觉语言模型性别偏见 LALS 模型对齐公平性

推荐理由：做AI公平性研究或模型对齐的团队，这篇论文直接戳破了VLM在模糊输入下的性别偏见黑箱——LALS方法让你能逐层看到模型内部编码与输出的脱耦，建议做模型审计的开发者点开看看具体实验设计。

00:09

AITOP6月1日 00:09

OpenAI 发起“Codex for Open Source”：免费赠送 6 个月 Pro 订阅，开源维护者能否迎来 AI 变革？

5月21日

12:17

12:17

官方账号arXiv cs.LG@Calvin Isley, Johann D. Gaebler, Sharad Goel

精选

在招聘、大学录取等难以获得真实标签的领域，模型常依赖历史人工评估训练，但历史评估可能包含对特定群体的偏见。本文提出用专家定义的标准（评分嵌入）替代传统黑盒嵌入作为预测基础，使模型锚定在语义有意义的维度上，从而避免继承偏见。理论和实验证明，该方法在合理条件下能有效缓解标签偏差。在大型硕士项目申请数据集上，基于评分嵌入的模型减少了群体差异，同时提升了录取群体的整体质量。

论文标签偏差可解释性公平性评分嵌入决策算法

推荐理由：做公平性AI或高利害决策系统的团队，这篇给出了一个可落地的方案——用专家评分嵌入替代黑盒特征，既减少偏见又提升质量，值得细读。

5月19日

14:29

14:29

官方账号arXiv cs.AI@Aditya Tanna, Nassim Bouarour, Mohamed Bouadi, Vinay Kumar Sankarapu, Pratinav Seth

精选

表格基础模型在健康数据集上表现优异，但高推理成本和基础设施需求限制了实际应用。研究者提出通过知识蒸馏将预测能力转移至轻量表格模型，并针对上下文表格模型在推理时依赖训练集导致的上下文泄露问题，采用分层折叠教师标注策略。在19个医疗数据集、6个教师模型、4个学生模型家族及多教师集成实验中，蒸馏学生模型保留了教师AUC的至少90%，部分甚至超越教师，同时CPU推理速度提升至少26倍，且保持校准性和公平性。多教师平均并未持续优于最佳单教师。该研究为推理受限的健康场景部署高质量预测提供了可行路径。

论文表格基础模型知识蒸馏健康数据推理效率公平性

推荐理由：医疗AI团队终于有了低成本部署高精度表格模型的方案——蒸馏后模型保留90%性能且快26倍，做健康数据预测的开发者可以直接用。