全部 AI 动态 · AI 热点

6月30日

11:24

arXiv cs.LG@Yousuf Moiz Ali, Jaroslaw E. Prilepsky, João Pedro, Sasipim Srivallapanondh, Antonio Napoli, Sergei K. Turitsyn, Pedro Freire

该论文提出一种混合主动在线学习框架，针对光网络故障检测中的概念漂移问题。采用基于边界的选择性标注策略，仅需查询3.4%的流式样本即可达到接近上限的准确率和AUC分数。相比于静态推理，该方法延迟开销可忽略不计。实验验证了该框架在标签高效场景下的有效性。

论文概念漂移主动学习在线学习光网络故障检测

推荐理由：这篇论文只用3.4%的标注数据就搞定了光网络故障检测中的概念漂移，效率高延迟低，做在线学习和故障检测的朋友可以看看。

原文

11:22

arXiv cs.LG@Haitao Wu, Qirui Zhang, Zhouheng Yao, Shangquan Sun, Qihao Zheng, Mianxin Liu, Chi Zhang, Wanli Ouyang, Chunfeng Song, Changqing Zhang, Jiamin Wu

BrainJanus是首个将脑、视觉和语言整合到单一框架的统一脑模型。它引入Unified Brain Tokenizer将连续神经活动量化为离散Token，并与视觉和语言表征对齐到共享的Omni空间。基于All-in-One自回归架构，该模型通过下一个Token预测实现图像到脑、文本到脑的编码以及脑到图像、脑到文本的解码。在多项基准测试中，BrainJanus取得优越性能，并展现出零样本泛化能力和可解释的生物拓扑结构。代码已在GitHub开源。

论文 BrainJanus 脑机接口多模态零样本学习脑解码

推荐理由：这篇论文提出了BrainJanus，一个能双向翻译脑信号与图像、文本的统一模型，在零样本和生物可解释性上突破传统方法。

原文

11:20

arXiv cs.LG@Jan Stenner, Alexander Kilian, Sebastian Peitz, Hermann de Meer

该论文研究了强化学习作为在线控制器，用于风电场内数据中心的高性能计算（HPC）工作负载转移。使用固定日仿真框架结合合成风能和电价信号以及延迟完成反馈进行测试。在单个风轮机和单个数据中心的基准场景中，纯强化学习存在信用分配问题，早期白天未能充分利用免费风能。评估了两种互补措施：基于优化的模仿学习和基于势能的奖励塑造。在200天测试集上，PPO和SAC变体表现出色，但性能仍低于具有全局视野的优化器。

论文强化学习数据中心风电场 PPO SAC

推荐理由：这篇论文用强化学习让风电场数据中心更省电，在单机场景下比较了PPO和SAC的效果，还试了模仿学习和奖励塑造。

原文

11:19

arXiv cs.LG@Alia Tarek, Hamsa Saberr, Hamza Elghonemy, Youssef Afify, Tamer Basha, Omair Shahzad Bhatti, Abdulrahman M. Selim, Hasan Md Tusfiqur Alam Daniel Sonntag

TRACE是一个概念瓶颈模型，用于对纵向3D MRI进行4分类胶质母细胞瘤反应评估，严格对齐RANO 2.0标准。该模型在LUMIERE数据集上通过5折患者交叉验证，实现了4类macro F1为0.4769，二分类（进展vs非进展）macro F1为0.7085。TRACE先预测肿瘤测量作为根概念，再通过确定性规则计算下游RANO衍生概念，并引入扫描间隔和新病灶信息。消融实验表明专家RANO图和干预一致性训练对性能至关重要，干预实验显示修正概念可提升下游预测。

论文 TRACE LUMIERE RANO 医学影像概念瓶颈

推荐理由：想理解脑肿瘤MRI评估的黑箱？TRACE用概念瓶颈让模型决策透明可验证，在LUMIERE上表现接近非可解释方法，值得看。

原文

11:16

arXiv cs.LG@Daniyel Ayupov, Artur Markov-Tsoy

研究人员发布DreamForge-World 0.1 Preview，这是一种面向实时交互的基座世界模型。系统基于LongLive 1自回归视频堆栈（衍生自Wan2.1-T2V-1.3B），并融入Matrix-Game家族的残差动作路径。该模型在单张RTX 4090上以480p分辨率达到14-15 FPS，支持键盘鼠标控制、多模态初始化、中流重提示和双视角操作。通过开源视频骨干和针对性微调，构建了高成本效益的预览系统。

AI模型 DreamForge-World LongLive Wan2.1-T2V-1.3B RTX 4090 世界模型

推荐理由：DreamForge-World 0.1 Preview让你在消费级显卡上实时操控世界模拟，支持键盘鼠标，15 FPS流畅运行，比那些需要超算的模型亲民多了。

原文

11:15

arXiv cs.LG@Bertram Taetz, Hugo Albuquerque Cosme da Silva, Gabriele Bleser-Taetz

本研究提出基于冻结大语言模型和LoRA变体的持续学习方法，使运动-语言智能体能在不遗忘旧知识的情况下增量学习新动作概念。采用混合专家架构和基于自编码器的路由器在推理时选择任务特定专家，无需任务标签。在从HumanML3D导出的5任务基准上，该方法在运动到文本（M2T)和文本到运动（T2M）两个方向上实现了近乎零遗忘，且保持高质量生成与描述。实验表明硬专家选择在质量指标上显著优于软专家混合，专家隔离对持续学习性能至关重要。

论文运动-语言智能体持续学习 LoRA 混合专家 HumanML3D

推荐理由：这篇论文提出用LoRA和混合专家架构让智能体不断学新动作而不忘旧的，5任务基准上几乎零遗忘，值得做持续学习或运动生成的看看。

原文

11:14

arXiv cs.LG@Aaryam Sharma

推测解码利用快速起草器生成候选 token，再由大模型验证以加速推理。现有理论主要针对随机采样，而实用系统多用贪婪解码和松弛接受规则。本文提出一类具有拒绝区域的接受准则，并给出其精确 KL 散度下界，覆盖严格贪婪、加性和乘性松弛、top-(m) 以及熵阈值等情形。对于树形解码，推导出目标贪婪 token 仍被起草器 top-(m) 覆盖的充分条件。在 Qwen3 模型上的实验表明，松弛和树形准则显著扩大了可保证接受的区域。

论文 Qwen3 speculative decoding 推理模型解码方法

推荐理由：这篇论文搞明白了推测解码里那些花式接受规则到底行不行，给出了数学保证，还在Qwen3上验证了，搞推理加速的值得一看。

原文

11:13

arXiv cs.LG@Boshko Koloski, Xiangjian Jiang, Senja Pollak, Blaž Škrlj, Mateja Jamnik, Nikola Simidjievski

论文针对TabPFN和TabICL等纳米级表格基础模型，提出KnowsTFM方法，通过知识图谱的结构注意力先验和参数高效低秩更新进行微调。在数据稀缺、高维且分布偏移的专业领域，KnowsTFM相比原始变体取得显著提升，但在通用任务上增益微小。研究还发现，对前沿模型持续微调可能导致预训练知识及机制崩溃。

论文 KnowsTFM TabPFN TabICL 微调知识图谱

推荐理由：这篇论文教你用小知识图谱提升小表格模型在专业领域的效果，比普通微调更靠谱，还揭示了持续微调的风险。

原文

11:12

11:12IT之家（博客/媒体）

亚马逊AWS与Anthropic达成新协议，按Token（词元）而非算力付费使用Anthropic模型。此举因亚马逊自研Nova模型竞争力不足，现有Alexa购物助手、Kiro编程工具、Quick职场助手等业务依赖Anthropic。亚马逊高级副总裁Peter DeSantis表示，目标在明年推出前沿水平模型，减少对第三方依赖。

行业 Anthropic 亚马逊AWS Token计费智能体合作模式

推荐理由：亚马逊和Anthropic搞了新合作，用Token付费不用算力，省钱还灵活，对双方都有好处。

原文

11:11

arXiv cs.LG@Feifan Wang

提出曲率引导的Sheaf扩散（CGSD），利用离散Forman-Ricci曲率作为拓扑信号进行无监督社区检测。在Cora、Cornell、Texas、Wisconsin、Chameleon五个异质图基准上，CGSD在Wisconsin和Chameleon上优于九个无监督基线，其余三个具竞争力。其曲率感知谱聚类器（CSpec）在相同嵌入下将平均NMI从0.091（K-Means）提升至0.107（+15%，p=0.008）。代码已在GitHub开源。

论文 CGSD 社区检测异质图无监督学习 Forman-Ricci曲率

推荐理由：这篇用边的曲率做无监督社区检测，在异质图上赢了九个基线，聚类器部分提升显著，代码也开源了。

原文

11:10

arXiv cs.LG@Shihao Zhang, Yuguang Yan, Junzhe Zhang, Wei Zhao, Bohan Wang, Hanwang Zhang

文本到视频扩散模型通常依赖额外奖励信号（如奖励模型或DPO）对齐人类偏好，但计算成本高且需人工标注。本文提出数据流形本身可作为奖励模型，通过显式建模高质量SFT数据的流形结构获得密集、可微、近乎零成本的奖励信号。基于局部坐标编码（LCC）捕获流形骨架，但LCC存在均值回归问题导致丢失高频细节。为此提出Shell-LCC，建模流形表面为各向同性壳层以对齐真实高密度区域。实验表明Shell-LCC能提升真实感、增强高频细节、减少过平滑伪影并缓解运动模糊。

论文 Shell-LCC LCC T2V 视频生成奖励模型

推荐理由：这篇论文发现数据流形本身就是好奖励，提出Shell-LCC，不花啥钱就能让AI生成的视频更清晰、少模糊，比加奖励模型省事多了。

原文

11:08

arXiv cs.LG@Floor van Maarschalkerwaart, Subhadip Mukherjee, Christoph Brune, Marcello Carioni

该论文提出一种结构化分布鲁棒优化（DRO）框架，在逆问题学习重建中对抗训练与测试噪声分布不匹配的问题。与标准 Wasserstein DRO 对全部联合分布均匀扰动不同，该方法将不确定性集限制在符合测量过程的扰动子集上（如条件分布 P(Y|X)），更真实地建模前向算子与噪声模型。理论推导了强对偶性与显式最坏情况风险界，表明该框架等效于在重建算子 Lipschitz 常数上施加 Tikhonov 正则化。在去模糊和 sinogram-to-CT 重建实验上，该方法相比标准 DRO 和 MSE 基线，在鲁棒性、稳定性和可解释性上均有提升，且在线性设置下学习到的算子呈现低秩结构，可视为截断 SVD 的数据驱动变体。

论文分布鲁棒优化逆问题学习重建鲁棒性 Tikhonov正则化

推荐理由：这篇论文解决了逆问题模型在噪声变化时性能暴跌的痛点，用结构化的 DRO 替代傻均匀扰动，实验还发现它自动学出低秩算子。搞图像重建或鲁棒学习的可以细看。

原文

11:06

11:06IT之家（博客/媒体）

OPPO ColorOS官宣小布助手接入微信A2A（Agent-to-Agent）机制，用户通过语音唤醒即可自动打开微信向联系人发消息或拨打微信电话，重名联系人可确认后发送。该功能基于双重授权机制保障数据安全与隐私合规。微信正与华为、荣耀、小米、OPPO、vivo等厂商合作逐步开放A2A助手能力。

AI产品 OPPO ColorOS 小布助手微信智能体

推荐理由：OPPO用户喊一声小布就能直接发微信消息和打电话，不用手动操作，重名还带确认，很实用。

原文

11:05

arXiv cs.LG@Marcelina Marjankowska, Valerio Modugno, Paolo Barucca

该论文研究训练过程中Hessian矩阵领先特征向量的动态演化。作者在多层感知机分类任务上，通过位移和逆参与率两个统计量跟踪特征向量变化。结果显示SGD训练下曲率方向逐渐趋于稳定，而Adam则持续重组特征向量。Adam还表现出局部化现象，少量参数主导领先曲率方向。这些发现揭示了优化器差异对训练轨迹的影响。

论文 SGD Adam Hessian 优化器训练动态

推荐理由：这篇论文分析了SGD和Adam训练中Hessian特征向量的不同行为，发现Adam会让少量参数主导曲率方向，直观解释了为什么两种优化器训练结果不同。

原文

11:01

arXiv cs.LG@Naeem Paeedeh, Mahardhika Pratama, Wolfgang Mayer, Mukesh Prasad, Weiping Ding, Yew-Soon Ong

本文定义了少样本领域增量学习（FSDIL）问题，针对传统方法在数据极少时过拟合的痛点。提出持续视觉-语言整合（CVLC）算法，关键思想是在基领域预留隐空间和双融合投影（DCP）参数高效微调。通过LLM生成多模板和同义词校准视觉与语言原型并融合，再用DCP适应新领域。在多个基准上，CVLC相比此前方法提升最高达16%。代码已开源。

论文 FSDIL CVLC Domain Incremental Learning 少样本学习持续学习

推荐理由：这篇论文提出了一个叫FSDIL的新问题和一个叫CVLC的算法，用双融合投影微调视觉语言模型，在少样本领域增量学习上比之前的方法好16%。

原文

11:00

11:00IT之家（博客/媒体）

73°

美团今日发布LongCat-2.0，总参数1.6T，平均激活约48B，动态范围33B-56B，原生支持1M超长上下文。该模型在五万卡国产算力集群上完成全流程训练，预训练数据规模超30T tokens。其在SWE-bench Pro中得分59.5，领先Gemini 3.1 Pro（54.2）、GPT-5.5（58.6）和Claude Opus 4.6（57.3）；在SWE-bench Multilingual中取得77.3，接近Claude Opus 4.6。推理阶段采用LongCat Sparse Attention和零计算专家机制，实现token级动态激活，降低解码延迟。

AI模型 LongCat-2.0 美团 MoE 推理模型编程助手

推荐理由：美团开源了LongCat-2.0，国产芯片跑万亿参数，编程和Agent能力很强，还支持百万上下文，值得上手试试。

原文

10:59

arXiv cs.LG@Matthias Blaschke, Daniel Kienzle, Zsuzsanna Koczor-Benda, Julian Lorenz, Rainer Lienhart, Fabian Pauly

新发布的Nanotechnology Molecular Optimization (NMO) Benchmark 替代传统药物发现中的代理指标，使用量子模拟评分。该基准对生成式分子模型提出严格结构约束和崎岖适应度景观。测试发现先进的分子优化方法在NMO任务上表现不及更简单的基线方法。研究团队开发了新基线方法，包含用于建模结构约束的新表示和消除制药数据集偏见的域无关预训练策略。该方法超越了最先进的物理性质结果，并揭示此前未知的结构基序。

AI模型 NMO Nanotechnology Molecular Optimization 分子优化纳米技术基准测试

推荐理由：科学家们搞了个新基准NMO，专门用来测试分子优化算法在纳米技术上的表现，直接用量子模拟打分，结果发现之前的先进方法还不如简单方法好用。

原文

10:58

arXiv cs.LG@Dario Fenoglio, Daniil Kirilenko, Martin Gjoreski, Marc Langheinrich

该论文提出了一种基于条件随机场(CRF)的联邦学习聚合权重优化框架。它通过定义客户端的一元势函数和客户端对的成对势函数，建模单个客户端的可靠性以及客户端间的交互。CRF推理生成的自适应聚合权重改进了全局训练目标的收敛性。在非IID数据异质性场景下，该方法在多个联邦学习基线方法上持续提升了性能。

论文联邦学习条件随机场非IID数据聚合权重

推荐理由：这篇论文用CRF替代固定加权规则，解决了客户端数据分布不均的问题，在非IID场景下比经典联邦学习方法更稳定。

原文

10:57

arXiv: Anthropic@Carson Rodrigues, Oysturn Vas

该论文基于15个独立MCP服务器（5个来自ANSYR语音AI平台，10个来自官方注册表），识别出五种架构模式：Resource Gateway、Tool Orchestrator、Stateful Session Server、Proxy Aggregator和Domain-Specific Adapter。定量评估包括分类法跨两个LLM评分者的Cohen's kappa为0.76，并定位了三处模式边界模糊问题。端到端传输开销测量了环回和跨主机路径。工具计数研究显示Claude Haiku 4.5在10-15个工具时工具选择准确率低于90%，Sonnet 4在20-30个工具时准确率下降。

论文 MCP Claude Haiku 4.5 Sonnet 4 架构模式工具选择

推荐理由：想给LLM挂外部工具？这篇论文把MCP服务器架构拆成五种模式，还有反模式和性能数据，Claude Haiku和Sonnet用户值得看看。

原文

10:45

Ate-a-Pi@svpino

Scout 是一个自动构建智能体的平台，用户只需设定一个 KPI 目标，平台就会自动生成对应的 Agent，无需编写任何代码。输入从代码变为目标，大幅降低 Agent 创建门槛。这一思路可能改变 Agent 开发方式，让非技术用户也能直接定义业务指标并得到自动执行方案。

AI产品 Scout 智能体 KPI 无代码自动化

推荐理由：Scout 让你不用写代码，只定 KPI 就能自动生成 Agent，适合想快速验证想法的人。

原文

10:43

Ate-a-Pi@svpino

精选

建议用“value per token dollar”指标评估智能体：将智能体产生的价值除以消耗的token成本。比值低于1表示成本大于回报；等于1表示收支平衡；高于1则可用该智能体构建业务。不同智能体即使使用相同模型和token数，创造的价值也可能完全不同。@matrix_build 团队首次采用这一指标。

技巧 value per token dollar matrix_build 智能体成本效益评估方法

推荐理由：别再纠结智能体能不能干了，试试用“值多少token”来算账，看投入产出比高不高。

原文

10:41

arXiv: DeepSeek@Sebastian Kula, Martin Tamajka

该论文提出一种多智能体虚假信息检测方法，模仿人类标注者的决策过程，采用共识机制、认知与知识多样性以及层次结构。系统使用开源模型LLaMA、Qwen、Deepseek等，确保透明度。在英语、波兰语、斯洛伐克语、保加利亚语数据集上评估，性能超过GPT-4和GPT-3.5。任务包括直接检测虚假信息、识别值得验证的文本、检测可验证事实主张。

论文 LLaMA Qwen Deepseek GPT-4 虚假信息检测

推荐理由：这篇论文用多个开源模型合作检测假新闻，效果比GPT-4还好，还用了四种语言测试，值得搞安全或内容审核的人看看。

原文

10:40

arXiv: DeepSeek@Camilo Chacón Sartori

EMPATH是一个多语言审计-法官基准，用于评估情感支持聊天机器人的安全性。该基准使用审计模型模拟求助用户，基于140个种子指令和34个人设生成多轮对话，法官模型从19个指标（分属五个维度）评分。基准在墨西哥西班牙语和美国英语上构建，研究发现标准评分在19个指标中的10个上存在膨胀，校准后恢复了区分度。在三个前沿模型（含一个开源模型）上测试，聚合分数差异在0.74分内，但具体指标差异可达6分。运行间可靠性差，deepseek-v4-pro在温度0下每次运行生成不同对话。

AI模型 EMPATH 情感支持聊天机器人 AI安全多语言基准测试

推荐理由：这个新基准EMPATH专测情感支持聊天机器人的安全漏洞，用AI模拟求助者进行多语言多轮对话，发现主流模型评分虚高且不稳定，值得一做。

原文

10:38

arXiv: Google DeepMind@Qijun Li, Zheng Fu, Qi Song, Yifei He, Weitao Zhou, Kun Jiang, Diange Yang

精选

Dual-Flow RL利用条件流匹配（CFM）同时建模回报分布和多模态策略分布，克服了传统单峰高斯价值估计的偏差问题。该方法引入熵-协方差探索调节器（ECER），实现基于状态的自适应探索。在DeepMind Control Suite的36个任务中，Dual-Flow RL在32个任务上取得最优，并在Humanoid-Bench上显著优于diffusion-based和flow-based方法。ECER通过策略熵与动作不确定性协方差动态调节探索强度，避免了模式坍塌。

论文 Dual-Flow RL DeepMind Control Suite Humanoid-Bench 强化学习多模态探索

推荐理由：这篇论文用条件流匹配把回报分布和多模态策略一起建模，解决了强化学习中的多模态探索难题，在DeepMind控制任务上吊打了扩散方法。

原文

10:37

arXiv: DeepSeek@Xuan Zhao, Haonan He, Qingyu Yang, Minglei Li, Jingqi Ye, Zelin Tan, Bo Wan, Peng Ye

提出ParametricSkills框架，将自由格式的文本技能在测试时转换为LoRA参数适配器。该框架利用大规模技能库和OpenCode合成的单/多轮轨迹训练超网络。在六个软件工程子任务上，比上下文学习平均提升6.44个点（由DeepSeek-V4-Flash评判），BERT Score和F1分数也更高。参数化技能具有累积性，为测试时持续学习提供了初步方向。

论文 ParametricSkills OpenCode DeepSeek-V4-Flash LoRA 软件工程

推荐理由：这篇论文把技能文本直接转成模型参数，编程任务上比上下文学习高出6分多，还能不断积累，挺实用的。

原文

10:36

arXiv: DeepSeek@Hui Zang, Pengfei Xia, Hong Liu, Jiajia Chu, Tuo Hao, Minghao Chen, Rui Zhang, Ziyang Zhang

精选

Mixture-of-Experts (MoE)架构通过稀疏激活扩展模型规模，但数据移动瓶颈导致推理效率低下。两个关键问题：低贡献专家带来几乎均等的内存与传输成本（成本收益比低），以及多设备部署中受最慢设备限制。CAEE框架利用轻量级成本模型估算硬件开销，选择性剪枝低重要性高成本专家，并通过低开销补偿机制避免额外数据传输。在DeepSeek-R1（671B参数）上的评估显示，CAEE将端到端推理延迟降低8%-18%（专家卸载与设备内执行），模型准确率下降小于1%。

论文 CAEE MoE DeepSeek-R1 推理优化多设备

推荐理由：CAEE框架能降低MoE模型推理延迟8%-18%，且准确率几乎不受影响。DeepSeek-R1用户可重点关注。

原文

10:33

techcrunch@Anna Heim

Base44是Wix旗下的vibe coding平台，近日开始推出自己的AI模型。此举旨在让平台在AI初创公司中建立防御性，减少对外部前沿模型的依赖。Base44表示希望该模型最终能超越当前最先进模型的表现。目前该模型已在部分用户中测试。

AI模型 Base44 Wix vibe coding AI模型编程平台

推荐理由：Base44搞了个自己的AI模型，想不靠别人，自己干翻前沿模型。vibe coding玩家可以期待一下。

原文

10:29

pandaily@contact@pandaily.com (Pandaily)

72°

DeepSeek计划于7月中旬发布V4官方版本。高峰时段（9am-12pm和2pm-6pm）API定价将为标准费率的2倍，类似电力分时计价模式。此举旨在引导开发者在非高峰时段调用API。

AI模型 DeepSeek V4 API定价分时收费

推荐理由：DeepSeek V4马上要来了，7月中旬发布。高峰时段API价格翻倍，想省成本就避开那段时间，适合用API的开发者留意。

原文

10:28

pandaily@contact@pandaily.com (Pandaily)

精选

由于EUV光刻工具受限，中国AI芯片设计者正押注3D混合键合与堆叠技术。该技术通过垂直堆叠芯片来提升性能，绕过传统制程缩放瓶颈。此举旨在缩小与西方先进芯片的性能差距。

行业 3D堆叠混合键合 EUV光刻 AI芯片先进封装

推荐理由：中国芯片厂用3D堆叠绕过EUV限制，这个弯道超车的技术路线值得一看。

原文

10:26

arXiv: DeepSeek@Liu Zewen

论文提出EPC诊断框架，包含多模态偏好崩溃指数(MPCI)、评估器耦合矩阵和JS散度(JSD)。在8种实验条件下（N=122次重复）发现耦合系数均值范围0.00-1.18，其中GPT-4o May、GPT-4o-mini、Qwen3.7-plus和DashScope 30r四个条件显示强耦合（N=36），而GPT-4o June、qwen-plus N=30等四个条件崩溃到近零。特别地，GPT-4o从5月到6月的版本漂移（N=8重复实验）导致结论反转，自评估条件97%为零（JSD=0.003）。

论文 GPT-4o DeepSeek Qwen3.7-plus EPC 评估器漂移

推荐理由：这篇论文告诉你，你以为可靠的GPT-4o评估器可能几周后就失效了，它还给了你一个EPC框架来自己检查。

原文

10:25

arXiv: DeepSeek@Caglar Uysal, Baturay Birinci, Süha Orhun Mutluergil, Orçun Çetin

该论文对DeepSeek、GPT、Gemini、Grok、Llama和Qwen六种前沿LLM进行了提示注入漏洞实证评估。测试涵盖直接攻击与多阶段混淆攻击，涉及多种语言和字符编码。结果显示所有模型均存在系统性漏洞，非英语语种的恶意合规率显著高于英语。DeepSeek、Gemini和Grok在复杂指令下尤其易受攻击，简单字符编码仅部分降低风险。

论文 DeepSeek GPT Gemini 提示词注入 AI安全

推荐理由：这篇论文告诉你，DeepSeek、GPT这些模型在非英语场景下有多容易被黑客利用来生成钓鱼内容，安全对齐的漏洞比想象中大。

原文

10:24

arXiv: DeepSeek@Avisha Dilhara, Nevidu Jayatilleke

研究者发布 sinhala-ocr-lk-acts-1010 数据集，包含1,010页来自斯里兰卡立法法案（1981-1989与2000-2019年）的页面级图像与转录文本，划分为707训练、101验证和202测试样本。使用QLoRA在8次实验中微调 DeepSeek-OCR V1、DeepSeek-OCR V2 和 LightOnOCR-2-1B 三个模型。LightOnOCR-2-1B 取得最佳性能，在全部测试样本上字符错误率(CER)为1.05%，优于 Surya-OCR（8.84%）、Tesseract v5（10.69%）和 Google Document AI（2.06%）。该模型在不同印刷年份的文档上表现一致，即使文档严重退化仍保持性能。

论文 sinhala-ocr-lk-acts-1010 LightOnOCR-2-1B DeepSeek-OCR V1 DeepSeek-OCR V2 OCR

推荐理由：新数据集让僧伽罗语OCR有了真实评测基准，LightOnOCR-2-1B 只用1.05%错误率碾压商业和开源方案，适合做古籍或法律文档自动识别。

原文

10:23

arXiv cs.AI@Buğra Alperen Uluırmak, Rifat Kurban

该研究结合系统搜索、叙事综合与灰色证据，对2018-2026年评估-安全测量工作进行梳理，涵盖八个证据流（基准有效性、动态评估、LLM-as-judge可靠性等）。引入EvalSafetyGap作为组织假设，借助Goodhart法则及作者提出的不稳定分解与对齐三难困境生成可检验比较。对10个模型进行审计，发现能力与持续对抗鲁棒性之间统计不显著（Pearson r=+0.232, p=0.520），开放-封闭安全差距主要由治理与披露驱动，而非行为鲁棒性。贡献在于提供共享词汇表与证据地图，支持动态评估、透明来源报告、多尝试安全测量及可审计对齐实践。

论文 LLM评估 AI安全 EvalSafetyGap 模型审计对齐

推荐理由：这篇论文梳理了LLM评估与安全之间测量问题的八大证据流，还审计了10个模型，发现很多看似安全差距其实来自信息披露。搞模型安全的人值得看看怎么避免被表面指标骗到。

原文

10:22

pandaily@contact@pandaily.com (Pandaily)

百度旗下AI芯片子公司昆仑芯片（Kunlun Chip）在IPO前要求投资者承诺购买其芯片。该策略旨在通过绑定客户需求提升市场信心，并加速国产AI芯片的生态建设。昆仑芯片成立于2018年，已推出包括K200、K300系列在内的多款芯片，覆盖云端和边缘计算场景。此次IPO预计在2026年6月前完成，融资规模或达数十亿元。

行业昆仑芯片百度 IPO AI芯片捆绑采购

推荐理由：昆仑芯片IPO要求投资者先买芯片，这招挺硬核的，想看国产AI芯片如何用捆绑采购抢市场。

原文

10:21

arXiv cs.AI@Chao Tian, Zikun Zhou, Chao Yang, Guoqing Zhu, Zhenyu He

本文提出一种稀疏跨模态融合机制用于RGB-T目标检测，避免传统方法中双重骨干网络和全局融合的高计算成本。该方法先通过轻量级单模态检测器快速扫描图像，生成高召回率的候选区域（RoI），再对稀疏的候选区域进行跨模态特征融合以精化检测结果。两阶段框架显著降低了参数和计算成本，同时在高分辨率图像上保持可扩展性。实验证明该方法在保持竞争力的前提下实现高效检测。

论文 RGB-T 稀疏融合目标检测多模态

推荐理由：这篇论文找到了一种聪明的方法：先快速扫一遍图像找出可能的目标区域，再只对这几个区域做多模态融合，省了很多计算。适合想做轻量级多模态目标检测的人读。

原文

10:17

arXiv cs.AI@Marcin Korecki, Cesare Carissimo

论文(arXiv:2606.30206)提出数据中心常是AI的具身化体现，并从生物学视角揭示其有机体特性。它分析了数据中心作为非唯一、普遍化具身形式所引发的多体问题。论文还探讨了计算与人类欲望的深层关联，指出数据中心存储和处理的数据皆源自人类欲望。最终，资本通过AI的定价机制将智能价值量化，跨越了有机体与机械的鸿沟。

论文数据中心有机体类比资本智能定价

推荐理由：这篇论文把数据中心比作AI的身体，还讲了资本怎么给智能定价，角度挺新鲜的。

原文

10:16

arXiv cs.AI@Elys Allesiardo, Antoine Caubrière, Valentin Vielzeuf

该论文深入分析了非序列多模态句子级嵌入，重点研究SONAR模型。研究发现某些嵌入维度对扰动敏感，可作为解码异常的指示器。通过利用编码与解码间的一致性，构建了准确的异常检测器。论文还探索了修改特定维度以尝试纠正异常。

论文 SONAR 多模态嵌入异常检测

推荐理由：这篇论文用SONAR模型把嵌入维度玩出花了，直接用一致性检测解码异常，还尝试修正，挺有意思的。

原文

10:15

arXiv cs.AI@Hyunwoo Park, Sang-Hyun Lee

针对仿真到真实迁移中目标数据稀缺的问题，该研究提出AIDA框架。AIDA通过自适应想象生成可靠轨迹，并利用分布偏移感知判别器截断低置信度过渡，仅保留可靠数据用于增强。在5个MuJoCo任务和2个Gymnasium-Robotics任务上，AIDA显著优于现有基线方法。实验表明自适应想象能有效截断不可靠轨迹，并通过自一致性损失学习有语义的状态表示。

论文 AIDA 域自适应视觉强化学习 Sim-to-Real MuJoCo

推荐理由：仿真到真实迁移一直难做，这篇论文的AIDA方法在目标数据极少时仍能大幅提升性能，比之前的方法强不少。

原文

10:13

arXiv cs.AI@Haoliang Han

精选

论文在Nengo LIF/PES尖峰网络上展示了agency-gated slow credit机制。实验显示，移除缓冲区后自我保存行为保留分数0.96（N=50），慢解码器重置或去门后行为崩溃。在24维部分观测控制中，自我信用产生持久行为（0.74 vs 0.00）。多任务学习中，乘法否决防止遗忘，最终准确率0.88，遗忘0.13，而基线方案性能接近随机。论文将持久残留形式化为操作性的行为自我。

论文 Spiking Agent Self-Caused Credit 智能体尖峰神经网络

推荐理由：这篇论文用实验硬数据展示了尖峰智能体如何通过自我因果信用形成持久行为，对比了多种条件，对构建有自我认知的AI很有启发。

原文

10:11

Ethan Mollick@emollick

大型语言模型（LLM）表现出一条反直觉的规律：参数规模更大的模型在编程、创意构思、伦理建议、医学和数学等多个任务上同步提升。例如，一个在编程上表现优异的模型，其伦理推理能力也往往更强。但这种通用性存在例外——在小说创作等开放领域，模型能力可能出现“锯齿效应”，即某些任务反而变差。这一发现挑战了传统AI能力高度分化的假设。

AI模型 LLM 模型通用性规模定律多任务学习

推荐理由：LLM越大越全能，编代码和讲道理一起涨——但写小说可能反而会翻车，挺有意思的。

原文

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

6月12日

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？

仅展示最近 2000 条内容。更早的内容请查阅 AI 日报存档（侧边栏 → AI 日报 → 顶部「往期日报」）。