13:50François Chollet@fcholletFrançois Chollet 指出当前 AI 技术栈存在 3-4 个数量级的数据效率低下和 4-5 个数量级的计算效率低下。他预测 2040 年的 AI 将更接近最优,而符号学习(symbolic learning)是实现这一目标的关键路径。Chollet 认为现有深度学习架构在数据和算力利用上远未达到理论极限。行业François Chollet符号学习深度学习效率AI趋势推荐理由:AI 大神 Chollet 直言现在的深度学习数据效率差 1000 倍、算力差 10000 倍,未来要靠符号学习翻盘。原文
10:36arXiv cs.LG@Dan Zimmerman, Dimitris A. Pados, George Sklivanitis针对水下图像中海洋物种自动分类面临的域迁移、细粒度相似性和标注粒度不均衡问题,研究者提出了一种结合分类学层次结构的深度学习框架。该方法包括分类学加权损失、最小风险贝叶斯推理、多尺度特征编码和独立的分层分类头。在FathomNet 2025数据集(包含7个分类等级的79个海洋类别)上评估,系统实现了1.581的平均分类学距离,接近第一名方案(1.535),差距在3%以内。主要改进来自于与度量对齐的推理以及简单解耦组件,它们在分布变化下比学习依赖关系具有更好的泛化能力。论文FathomNet海洋物种分类分层分类深度学习分类学加权损失推荐理由:这篇论文用分层损失和贝叶斯推理搞定水下物种分类,在FathomNet上只比第一名差3%,思路很实在。原文
09:46arXiv cs.LG@Itay Lavie, Noam Levi, Yonatan Kahn本文从物理学视角分析了深度学习训练与泛化的统计特性,指出其打破了经典统计学的多项直觉。重点讨论了神经缩放定律(neural scaling laws)及其与约束、归纳偏置的相互作用。文章还回顾了构建深度学习模型时的多种选择及其合理性。论文深度学习神经缩放定律统计特性物理学视角推荐理由:这篇论文从物理学角度拆解深度学习的统计特性,解释了神经缩放定律如何打破经典统计直觉,做研究的值得看看。原文
02:03MIT CSAIL@MIT_CSAILMIT CSAIL 研究员 Alexander Amini 主讲的深度学习免费课程已更新至 2026 版。该课程涵盖监督学习、无监督学习和强化学习三大范式。第 5 讲专门讲解三者的核心差异。课程完全免费开放,适合入门到进阶学习者。技巧MIT深度学习免费课程监督学习强化学习推荐理由:MIT 出了新版深度学习免费课,Alexander Amini 讲第 5 讲,把监督、无监督、强化学习的区别掰开揉碎,想入门可以看看。原文
11:03arXiv cs.LG@Abdul-Rauf Nuhu, Parham M. Kebria, Vahid Hemmati, Mahmoud N. Mahmoud, Edward Tunstel, Abdollah Homaifar现有深度学习模型泛化误差上界往往过于松散,尤其在0-1损失下。本文提出基于局部鲁棒性与稳定性的新泛化界,通过按输入空间子区域中稳定与不稳定样本数量缩放鲁棒项。在ImageNet数据集上,该界保持非空且比现有方法得到更紧的上界,与多个鲁棒深度神经网络的真实性能紧密对齐。论文泛化误差鲁棒性ImageNet深度学习推荐理由:这篇论文提出了更紧的深度学习泛化误差上界,在ImageNet上比现有方法更准,值得一看。原文
10:38arXiv cs.LG@Gauthier Boeshertz, Razvan Pascanu, Claudia Clopath反向传播(BP)因需要反馈权重与前向权重的转置一致而被认为生物上不可信。反馈对齐(FA)使用固定随机反馈权重来规避此问题,但在深层架构中效果不佳。研究发现FA误差的有效秩远低于BP,限制了参数空间的探索。通过使用Muon优化器正交化权重更新和隐藏活动归一化促进激活正交性,可提高FA的有效维度。在CIFAR100和ResNet-18上,这些方法将准确率提升了9个百分点。论文反馈对齐秩坍缩Muon优化器正交化深度学习推荐理由:这篇论文揭示了反馈对齐在深层网络中失效的根本原因——低维梯度动力学,并给出了可落地的解决方案(Muon+归一化)。做生物启发学习或替代反向传播研究的团队值得关注,实验方法可以直接复现。原文
10:47Viking@vikingmute精选一篇名为《How LLMs Actually Work》的文章近日登上 HackerNews 榜首。文章用直观的例子和恰当的比喻,向有编程基础但未深入学 Transformer 的读者解释大模型工作原理。作者强调写作乐趣,坚持不用 AI 辅助,文章风格自然,没有 AI 味。适合想理解 LLM 底层逻辑的开发者阅读。论文LLMTransformer深度学习技术文章HackerNews推荐理由:想搞懂 LLM 原理但被 Transformer 劝退的开发者,这篇用活人语言讲清楚了,比看论文轻松太多,建议直接点开。原文
11:56arXiv cs.AI@Thomas T. Zhang, Alok Shah, Yifei Zhang, Vincent Zhang, Nikolai Matni, Max Simchowitz精选论文提出一种名为双预处理(DoPr)的新优化范式,专门解决深度学习模型在部署时因自身预测滚动(如自回归语言模型、流生成模型、机器人策略学习)导致的误差累积问题。DoPr 结合梯度预处理(如 Adam、Muon)和激活预处理(如 KFAC),能直接提升下游任务性能(如成功率、生成质量),而不一定改善验证损失。这挑战了传统以验证损失为优化目标的评估方式,为训练-测试不匹配问题提供了新的优化维度。实验表明,DoPr 在多种测试时反馈(TTF)场景中作为即插即用模块有效。论文优化器测试时反馈误差累积DoPr深度学习推荐理由:DoPr 解决了训练和部署性能不一致的痛点,做自回归模型、流生成或机器人学习的团队可以直接尝试这个即插即用优化器,可能会发现验证损失没变但实际效果提升。原文
11:28arXiv cs.LG@Kelan Gray, Finlay Brown, Nicolas Boullé, Matthew J. Colbrook精选Koopman理论将非线性动力学转化为线性谱问题,但计算中依赖硬性的有限维选择。DeepMDMD结合深度Koopman方法与结构保持方法,学习潜在空间及其划分,同时强制Koopman乘积规则作为精确代数约束。训练在精确乘法算子更新和可微潜在聚类步骤之间交替,后者促进Koopman封闭性。结果在哈密顿、混沌和流体示例中,学习到的字典比几何MDMD划分更紧凑且动态一致,减少谱污染,揭示更丰富的连续谱结构,并在高维流动中保持相干结构和长期谱统计。论文Koopman理论非线性动力学深度学习结构保持流体仿真推荐理由:做非线性动力学建模或流体仿真的研究者,DeepMDMD用代数约束解决了Koopman学习中的字典选择难题,值得关注其如何在高维噪声下保持稳定预测。原文
08:04Gary Marcus@GaryMarcusGary Marcus 回应批评者,重申他从未说深度学习完全失败,而是认为需要神经符号 AI 作为补充。他指出 Claude Code、代码解释器、工具使用和符号框架等正是他多年来主张的方向。Marcus 强调,不理解这一点的人对 AI 架构缺乏基本认知。这条推文是对他 2022 年文章《深度学习撞墙》的辩护,并认为当前 AI 进展验证了他的观点。行业深度学习神经符号 AIClaude CodeAI 架构Gary Marcus推荐理由:Gary Marcus 的回应澄清了关于深度学习局限性的常见误解,关注 AI 架构争论的读者会看到他的预测如何被 Claude Code 等产品验证,值得点开了解他的完整论点。原文
12:01arXiv cs.AI@Shuo Zhang, Chenqi Li, Tingting Zhu长尾识别是深度学习中的难题,两阶段解耦范式中的自适应范数缩放技术虽有效,但依赖超参数调优,性能波动大。本文提出 Self-Adaptive Monotonic Normalization (SAMN),通过 Pool Adjacent Violators Algorithm 直接对每类权重范数施加单调性约束,无需参数正则化,彻底消除超参数敏感性。SAMN 是一种通用策略,可无缝集成到其他方法中提升性能。在多个基准数据集上,SAMN 显著提升长尾识别准确率,常达到最优结果。论文长尾识别自适应范数缩放超参数友好SAMN深度学习推荐理由:做长尾识别或类别不平衡任务的开发者,终于可以告别调参噩梦了——SAMN 直接省去超参数搜索,即插即用还能涨点,建议试试。原文
17:17Marc Andreessen@pmarca精选Marc Andreessen转发了一条关于AI领域新人如何避免落后的建议。建议包括深入学习模型内部原理、线性代数、非凸优化、训练小模型和大模型、掌握vLLM和Tensor并行、手写内核、集群编排、合成数据、SFT和PPO、学习Triton、了解半导体供应链、构建大型集群、预训练800B模型并后训练、服务数百万用户、在基准测试上超越DeepSeek。这些建议强调从理论到实践的全面技能,是AI领域职业安全的关键。行业AI职业发展技能路线深度学习集群训练模型部署推荐理由:AI新人想快速成长?这份硬核路线图从数学到集群全覆盖,建议逐条对照执行,做AI开发的值得收藏。原文
07:59rohanpaul_ai@rohanpaul_aiSam Altman 在 TreeHacks 访谈中回顾了 2014 年 OpenAI 创立初期的艰难处境。当时业界普遍认为 AGI 还需 100 年,OpenAI 的愿景被资深人士斥为“疯狂”和“骗局”。Altman 表示,他们选择押注“扩展深度学习”这一当时不受欢迎的方向,坚信增加算力能带来更好结果。尽管当时尚未发现 scaling laws 的精确规律,但团队决定全力推进。这段历史揭示了 OpenAI 早期信念与主流认知的巨大差距。行业OpenAISam AltmanAGI创业历史深度学习10 个信源在谈推荐理由:这段历史对 AI 从业者很有启发——当主流共识说“不可能”时,OpenAI 选择了逆势押注 scaling。做 AI 研究或创业的人看完会重新思考“共识”与“创新”的关系。原文
10:22Gary Marcus@GaryMarcusGary Marcus在X上发帖,重申他2022年论文中“深度学习正在撞墙”的观点,并指出神经符号AI正在拯救这一困境。他批评有人误解了原始论点,并以一个寓言故事说明:深度学习在预训练扩展效果下降后,通过推理时计算、强化学习和工具使用取得突破。Marcus强调,这些进展恰恰验证了深度学习需要符号AI补充的预测。行业神经符号AI深度学习Gary Marcus推理时计算AI范式推荐理由:Gary Marcus的神经符号AI观点再次被验证,关注AI范式演进的读者值得一看,尤其是对深度学习局限和未来方向有思考的开发者。原文
11:46arXiv: Google DeepMind@Mohammadreza Narimani, Alireza Pourreza, Parastoo Farajpoor精选加州大学团队利用Google DeepMind的AlphaEarth地理空间嵌入,结合U-Net深度学习模型,实现了加州加工番茄田的像素级精准识别。研究基于LandIQ 2018年作物多边形构建了平衡参考数据集,在独立测试集上达到99.19%像素精度和99.04% F1分数。该方法无需手工特征工程,且通过蒙特卡洛dropout提供了不确定性估计,边缘区域不确定性最高。结果表明AlphaEarth嵌入可作为分析就绪的替代方案,支持跨年稳健的作物制图。论文AlphaEarth深度学习作物制图遥感U-Net推荐理由:农业遥感团队终于有了无需手工特征工程的端到端方案——AlphaEarth嵌入+U-Net直接输出高精度作物图,做供应链预测和政策分析的可以直接复现。原文
10:22arXiv cs.LG@Minh Hoang Nguyen, Dai Do, Huu Hiep Nguyen, Dung Nguyen, Kien Do, Hung Le精选现代深度学习模型在时间序列预测中表现优异,但在长期预测中因自回归推理的误差累积导致性能下降。经典误差校正机制(ECM)在统计方法中有效,但在深度学习中应用有限。本文提出一种架构无关的通用误差校正器UEC-STD,通过将预测分解为趋势和季节成分分别校正,显著提升校正精度和鲁棒性。该方法无需重新训练即可集成到现有预测器中,在4种骨干网络和10个数据集上验证了有效性。代码已开源,为缓解深度时间序列模型的自回归误差提供了实用工具。论文时间序列预测误差校正深度学习自回归开源/仓库推荐理由:时间序列预测的长期误差累积是实际应用中的痛点,做时序预测的团队可以直接用UEC-STD提升现有模型性能,无需重新训练,值得一试。原文
10:22arXiv cs.LG@Alexander Gebhard, Andreas Triantafyllopoulos, Dominik Arend, Sandra Müller, Svenja Schmidt, Michael Scherer-Lorenzen, Björn W. Schuller精选生态声景由生物声、地声和人类声组成,但现有分析工具难以区分这些成分。CoarseSoundNet 是一个深度学习模型,能在真实被动声学监测条件下区分三类声音。研究发现,加入与目标域相似的 PAM 数据、引入静音类训练、使用类别阈值和时长约束能显著提升性能。案例验证表明,用 CoarseSoundNet 预过滤录音可获得与人工过滤相当的声学指数趋势,适合作为生态声学分析的预处理工具。论文生态声景深度学习被动声学监测CoarseSoundNet声学分类推荐理由:生态声景分析终于有了一个能处理真实噪声的可靠模型,做生态监测和声学研究的团队可以直接用它做预处理,省去大量人工标注时间。原文
14:34arXiv cs.AI@Amritpal Singh, Andrey Barsky, Mohamed Ali Souibgui, Ernest Valveny, Dimosthenis Karatzas精选可解释AI(XAI)技术对深度学习模型的验证和负责任使用日益重要,但缺乏可靠的评估标准。研究者提出了一种基于连续输入扰动的量化指标,用于衡量XAI方法的质量,该指标从充分性和必要性两个维度评估归因信息对模型决策的影响。实验表明,该指标比现有方法更符合人类对解释质量的直觉。基于此指标,团队还提出了一种新的XAI方法,通过可微分的近似指标作为监督信号微调模型,在不降低模型性能的前提下生成因果解释。该方法在多个量化指标上优于现有XAI技术。论文可解释AI量化评估因果解释模型微调深度学习推荐理由:这项研究解决了XAI领域缺乏可靠评估标准的痛点,做模型可解释性研究的团队可以直接用这个指标来量化自己的方法,值得关注。原文
09:56arXiv cs.AI@Emad Abukhousa, Saman Zonouz, A. P. Sakis Meliopoulos精选该研究提出了一个延迟感知的基准框架,用于评估深度学习模型在电力系统异常检测中的表现。研究使用工业级电磁暂态模拟器生成的高保真时域信号,系统评估了从MLP到Transformer的八种神经网络架构。所有模型都能在15毫秒内实时分类多事件序列,但端到端推理延迟在50-90毫秒之间,超过了保护级部署的要求。结果表明算法能力与实际部署之间存在关键差距,需要进一步优化和硬件加速。该工作为亚周期异常检测建立了可复现的基准,指导机器学习方法从研究原型向实际保护应用过渡。论文深度学习电力系统异常检测延迟感知基准测试推荐理由:电力系统安全研究者终于有了一个可复现的延迟感知基准——它揭示了AI模型在逆变器主导电网中实时分类故障与攻击时的实际性能瓶颈。做电力系统保护或AI部署的团队可以直接参考这些数据来优化模型和硬件选择。原文
10:35arXiv cs.LG@Chaeyeon Lee, Sehwan Kim, Hyungrok Do精选QSurv 是一个可扩展的深度学习框架,用于非参数连续时间生存建模,避免了传统方法对时间离散化或分布假设的依赖。它采用 Gauss-Legendre 数值积分来近似累积风险函数,实现高效端到端训练。此外,QSurv 引入了时间条件低秩适配机制,使神经网络能够动态捕捉非平稳风险动态。理论分析证明了累积风险评估的误差界。在合成数据、大规模表格数据和医学影像任务上,QSurv 在预测性能和风险函数估计方面均优于现有方法。论文生存模型非参数建模数值积分深度学习医学影像推荐理由:生存分析领域终于有了一个不依赖离散化或分布假设的深度学习方案,做医学影像或高维数据风险建模的团队可以直接用 QSurv 获得更准确的风险曲线,值得关注。原文
10:04arXiv cs.AI@Yoshia Abe, Tatsuya Daikoku, Yasuo Kuniyoshi精选73°该研究提出了一种结合深度学习与大型语言模型(LLM)的系统,用于个性化图像审美评估。系统通过LLM进行半结构化访谈主动收集用户的审美偏好,并提取图像的高层语义特征与低层特征进行预测。实验表明,该系统在预测个体审美评价上优于传统模型、人类预测者,甚至目标个体自身的重新评估。尤其在高评分图像上表现突出,且预测误差小于个体自身的时间波动。研究暗示AI可能比他人或未来的自己更能捕捉特定时刻的个体审美偏好,引发AI能否成为比人类更深刻审美解释者的新问题。论文LLM图像审美评估个性化推荐深度学习语义特征推荐理由:这项研究解决了AI审美评估中主观性强的痛点,做个性化推荐、图像编辑或用户体验优化的团队值得关注——它用LLM访谈替代了传统问卷,效果甚至超过本人复评,建议点开看看实验设计。原文
10:00arXiv cs.AI@Lata B T, Savitha N J该研究提出使用深度确定性策略梯度(DDPG)深度学习算法来改进犯罪调查中的嫌疑人识别。传统方法依赖有限数据分析,易产生误报和漏报。DDPG模型通过训练犯罪现场材料、证人陈述和嫌疑人档案等复杂数据集,最大化识别罪犯的可能性,同时减少噪声和无关数据的影响。实验结果显示,该方法在识别罪犯时准确率高达95%,优于现有多种方法。论文DDPG深度学习犯罪识别刑侦AI准确率95%推荐理由:这项研究为刑侦领域提供了AI驱动的精准识别方案,做犯罪数据分析或公共安全研究的团队值得关注,能显著降低误判率。原文
05:39François Chollet@fcholletKeras 包在 PyPI 上的月下载量近日突破 2100 万次,创下历史新高,日下载量峰值约 90 万。五年前首次达到 1000 万月下载时,作者曾认为这已是极限。这一里程碑表明 Keras 在深度学习社区中的持续增长和广泛采用。AI产品Keras深度学习PyPI下载量里程碑推荐理由:Keras 的下载量新高反映了其作为深度学习入门和快速原型工具的持久生命力,做 AI 模型训练的开发者值得关注这一趋势。原文
15:51腾讯混元 Tencent Hunyuan@tencentcloud精选腾讯云推出了实时H.266 VVC编码器,支持复杂直播场景的大规模商业部署。该编码器结合深度学习与原生编码架构,突破了实时计算限制,同时保留了广播级视频质量。它支持稳定的10 Tbps并发带宽,大幅降低带宽成本,并优化了核心QoS,实现更快的启动和更少的卡顿。三个AI核心模块提升了编码效率,支持灵活的计算调度,并在所有场景下保护精细的视觉纹理细节。该编码器仅需1.8 Mbps即可实现清晰的1080p超高清流媒体,性能优于传统AVC。AI产品H.266/VVC视频编码腾讯云深度学习直播推荐理由:腾讯云将H.266 VVC编码器推向商用,视频直播平台和CDN服务商可以大幅降低带宽成本,同时提升画质,做视频技术的团队值得关注。原文
13:03Greg Brockman Blog(博客/媒体)70°这篇文章由Greg Brockman和Ilya Sutskever共同撰写,阐述了OpenAI的核心使命:确保通用人工智能(AGI)造福全人类。他们宣布成立新的法律结构OpenAI LP,以便筹集更多资金来构建安全的AGI。文章强调深度学习的通用性、可扩展性和竞争力使AGI变得可认真对待,并讨论了AGI可能带来的巨大影响,包括科学突破、商业化和社会效益,同时警示了其潜在风险。最后呼吁社会各界合作确保AGI安全与利益共享。行业AGIAI安全OpenAI深度学习社会影响7 个信源在谈推荐理由:这是OpenAI首次系统阐述其使命和战略架构,对于理解AI行业领导者对AGI的路线图、安全考量及商业化方向具有重要参考价值。原文