全部 AI 动态 · AI 热点

6月30日

10:15

10:15

arXiv cs.AI@Hyunwoo Park, Sang-Hyun Lee

针对仿真到真实迁移中目标数据稀缺的问题，该研究提出AIDA框架。AIDA通过自适应想象生成可靠轨迹，并利用分布偏移感知判别器截断低置信度过渡，仅保留可靠数据用于增强。在5个MuJoCo任务和2个Gymnasium-Robotics任务上，AIDA显著优于现有基线方法。实验表明自适应想象能有效截断不可靠轨迹，并通过自一致性损失学习有语义的状态表示。

论文 AIDA 域自适应视觉强化学习 Sim-to-Real MuJoCo

推荐理由：仿真到真实迁移一直难做，这篇论文的AIDA方法在目标数据极少时仍能大幅提升性能，比之前的方法强不少。

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

6月12日

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？

6月3日

10:01

10:01

arXiv: OpenAI@Nikhil Vincent

精选

CoughSense 是一个利用智能手机录音自动分类五种呼吸系统疾病（健康、COVID-19、哮喘、支气管炎、肺炎）的系统。它基于 OpenAI Whisper 编码器微调，并引入主动帧 QKV 注意力池化（Active-frame QKV attention pooling），解决了 Whisper 30秒输入窗口内短咳嗽信号被静音稀释的问题。系统还通过加权采样、数据增强、平衡混合、对比学习、症状条件化和域自适应等技术，处理了19:1的类别不平衡和跨数据集域偏移。在四个公开数据集共18,301条录音上，CoughSense（Whisper-tiny，8.6M参数）达到82.3%的平衡准确率，双编码器融合版本达到85.4%。主动帧池化是最大的单一贡献模块（提升5.1个点），对任何使用Whisper的短音频任务都有参考价值。

论文 Whisper 呼吸疾病分类咳嗽分析主动帧池化域自适应

推荐理由：做呼吸疾病音频诊断或短音频分类的团队，可以直接借鉴CoughSense的主动帧池化和域自适应方案，解决Whisper在短信号上的静音稀释痛点。