02:29Google Research: Blog(资讯)Google Research 推出 Earth AI 机器学习模型,通过分析高分辨率卫星图像识别土地覆盖类型与植被健康度,支持生态恢复项目的规划与监测。该模型在 Global Land Cover 数据集上训练,覆盖 10 米分辨率地表信息,并已在巴西、澳大利亚等地测试。Google 还开源了相关模型与数据集,供研究社区使用。AI模型Earth AIGoogle开源模型卫星图像生态恢复推荐理由:Google 用 AI 看卫星图帮你规划种树恢复生态,模型和数据集都开源了,想做生态项目可以试试原文
02:17kimmonismus@kimmonismus77°GLM-5.2 以 MIT 许可证开源,权重开放。该模型支持 1M token 上下文窗口。提供 max 和 high 两种推理模式。专门针对大规模部署、自动化研究、性能优化和复杂调试进行训练。API 定价与 GLM-5.1 保持一致。AI模型GLM-5.2智谱开源模型长上下文推理模型推荐理由:智谱开源了 GLM-5.2,1M 上下文还能选推理模式,做长代码任务更强了。原文
01:59lmarena.ai@lmarena_aiAgent Arena 在其官方博客中介绍了用于智能体评估的因果追踪方法论。该方法可帮助研究人员分析智能体决策背后的因果链路。Agent Arena 平台本身支持多种智能体基准测试。AI模型Agent Arena智能体评估基准因果追踪推荐理由:Agent Arena 的因果追踪方法能帮你搞懂智能体为什么那么做,比单纯看分数更有用。原文
01:57Jim Fan@jimfan76°NVIDIA联合CMU和伯克利推出ENPIRE系统,让AI智能体完全自主控制真实机器人循环,包括重置环境、搜索文献、实现想法、训练部署、自我验证等步骤。该系统在整理别针、安装GPU、绑扎带等灵巧任务上达到99%成功率。机器人通过自提出启发式成功信号进行爬坡优化,无需人类介入。AI模型ENPIRENVIDIA机器人智能体自主循环8 个信源在谈推荐理由:NVIDIA搞了个ENPIRE,让AI自己操控机器人反复试错,真实任务成功率干到99%,连GPU都能自己插。原文
01:31lmarena.ai@lmarena_ai精选MiniMax M3 在全新 Agent Arena 排行榜上位列第18,是排名第5的开源模型。相比 M2.7,M3 从第22名升至第18名,主要改进是任务成功确认和 bash 错误恢复能力。工具幻觉保持低位,与最佳模型并列第一。排行榜基于30万+任务、200万+工具调用和4000万行代码的代理会话评估。AI模型MiniMaxM3Agent Arena开源模型智能体推荐理由:MiniMax M3 在 Agent Arena 上排名上升了4位,是最强开源模型之一,能写代码、做PPT、查资料,幻觉控制也顶级。原文
00:59AK@_akhaliqJoyAI发布了JoyAI-VL-Interaction模型,这是一个实时视觉语言交互智能系统。该模型支持实时视觉理解与语言生成,能够处理视频帧序列并生成自然语言响应。目前尚未公布具体基准测试成绩或版本号。AI模型JoyAI-VL-InteractionJoyAI多模态实时交互推荐理由:JoyAI出了个能实时看懂画面并跟你聊天的模型,适合做交互式AI应用。原文
00:55marktechpost@Asif Razzaq精选73°Qwen团队推出Qwen-RobotSuite,包含三个具身AI模型。RobotManip是基于Qwen3.5-4B的视觉-语言-动作模型,用于操作任务。RobotWorld是一个60层MMDiT架构的语言条件视频世界模型。RobotNav是基于Qwen3-VL的导航模型,提供2B、4B和8B三种参数量。AI模型Qwen-RobotSuiteRobotManipRobotWorldRobotNav具身AI推荐理由:一口气发了三个模型,从操作到导航都管了,全用自家Qwen3.5和Qwen3-VL,做机器人研究的可以看看。原文
00:10Justine Moore@venturetwinsIdeogram 发布了名为 Ideogram 2.0 的开源权重图像模型,宣称在开放权重类别中排名第一。该模型体积足够小,可在消费级 GPU 上运行,但在设计任务上与 Nano Banana 和 GPT Image 竞争。研究团队由 @mo_norouzi 领导,分享了技术细节和观点。AI模型Ideogram开源模型图像生成消费级GPUGPT Image推荐理由:Ideogram 这个开源权重图像模型能在普通显卡上跑,还能和 GPT Image 掰手腕,适合不想烧钱又想要好效果的人。原文
22:10阿里云 Alibaba Cloud@alibaba_cloud76°阿里云发布Qwen-Robot Suite,包含三个基础模型:Qwen-RobotNav统一5种导航任务(指令跟随、点目标、物目标、目标跟踪、自动驾驶);Qwen-RobotManip在38,100+小时开源语料上预训练,实现异构机器人统一状态-动作空间;Qwen-RobotWorld支持20+具身化身,通过自然语言接口预测物理世界未来。三个模型可独立使用或组合,构成通用具身智能系统的底层工具包。AI模型QwenRobot具身智能机器人导航基础模型推荐理由:阿里云一口气发了三个机器人基础模型:导航、操作、世界模型,每个都能单独用,还能组合。Qwen-RobotManip在3.8万小时数据上预训练,挺实在的。原文
22:10量子位@允中一种新模型使机器人实现手脚腰身全身协同,完成精细操作。该模型在仿真环境中提升任务成功率,真实机器人上验证了效果。手部动作问题根源在于全身协调,而非单关节。AI模型机器人控制全身协同精细操作控制模型推荐理由:这个模型让机器人能全身配合做精细活,手的问题原来在腰身协调,挺有意思的新思路。原文
19:46Decoder@Jonathan Kemper爱沙尼亚语言研究所发布了一项基准测试,用于评估AI语言模型对俄语宣传的抵抗力。测试涵盖了GPT-4o、Claude 3.5 Sonnet、Llama 3.1等8个模型,发现部分模型在30%的测试样本中会生成亲俄内容。Meta的Llama 3.1 70B表现最差,错误生成率高达42%;而OpenAI的GPT-4o错误率最低,仅为12%。该基准测试还包含一个包含1000个样本的俄语宣传语料库,用于衡量模型对政治操纵的脆弱性。AI模型GPT-4oClaude 3.5 SonnetLlama 3.1AI安全基准测试10 个信源在谈推荐理由:想知道你用的AI会不会被俄语宣传带跑偏?爱沙尼亚语言研究所测了8个主流模型,GPT-4o最扛打,Llama 3.1中招率最高。看看你的AI排第几。原文
19:02kimmonismus@kimmonismusVibeThinker-3B是仅3B参数的小模型,在AIME26上取得94.3分,在LiveCodeBench v6上Pass@1达80.2,在未见过的LeetCode比赛中正确率96.1%。其训练基于Qwen2.5-Coder,结合课程SFT、多领域RL、离线自蒸馏和最终RL指导阶段。结果表明,部分可验证推理能力可被高效压缩到小密集模型中。AI模型VibeThinker-3BQwen2.5-Coder推理模型小模型代码生成推荐理由:3B的小模型在数学和代码推理上快追上大模型了,适合部署在低算力场景,值得关注。原文
16:34AI Will@FinanceYF583°NVIDIA 发布了 SANA-Streaming 模型,支持对长达一分钟的视频进行实时编辑。用户可以在视频播放过程中更改服装、背景、风格和场景。该模型无需等待渲染,即可直接看到修改结果。AI模型NVIDIASANA-Streaming视频生成实时编辑8 个信源在谈推荐理由:NVIDIA 出了 SANA-Streaming,放视频时就能实时换衣服换背景,一分钟的长视频也能改原文
15:49IT之家(博客/媒体)精选OpenRouter于6月14日发布Fusion API复合AI模型,通过并行调用多个模型并汇总结果实现协同回答。基准测试中,Claude Opus 4.8+GPT-5.5+Gemini 3.1 Pro组合得分68.3%,超过Claude Fable 5的65.3%。而Gemini 3 Flash+Kimi K2.6+DeepSeek V4 Pro组合以约一半成本实现64.7%的得分,差距不到1%。该服务分为并行请求、审查模型分析、调用模型生成最终答复三个步骤。AI模型OpenRouterFusionClaude Fable 5多模型协同推理模型9 个信源在谈推荐理由:OpenRouter用多个便宜模型拼出顶级效果,成本砍半但性能追上Claude Fable 5,预算有限又想用好模型可以试试。原文
14:55量子位@量子位的朋友们阿里发布Qwen-Robot系列,包含Qwen-Robot-V1、Qwen-Robot-V1-Pro和Qwen-Robot-V1-Plus三款模型。该系列将视觉、语言与行动能力整合,支持在复杂环境中完成抓取、导航等任务。在RoboBench基准上,Qwen-Robot-V1-Pro任务成功率较基线提升15.3%。模型参数规模从7B到72B不等,可适配不同硬件平台。AI模型Qwen-Robot阿里具身大模型机器人开源模型推荐理由:阿里刚出的Qwen-Robot系列,三个模型从7B到72B,让机器人能边看边想边动,RoboBench成绩提升15%,搞具身智能的值得看看。原文
14:22AlphaSignal@AlphaSignalAI精选CUA-Gym是一个端到端流水线,通过三个协调编码智能体自动生成可验证的计算机使用任务。它构建了94个流行应用的模拟版本,包括Slack、Notion、Salesforce和Gmail克隆,并直接读取状态设计奖励函数。生成的训练数据集包含32,112个验证元组,覆盖110个环境。基于该数据训练的模型在OSWorld-Verified基准上达到72.6%,与Claude Sonnet 4.6持平。一个3B参数的小模型以十分之一参数匹配了17B基座模型的性能。AI模型CUA-GymClaude SonnetOSWorld-Verified智能体开源模型5 个信源在谈推荐理由:CUA-Gym用三个AI智能体自动生成训练数据,省去人工标注。它克隆了94个常用软件,训练出的模型追平了Claude Sonnet 4.6,小模型3B参数达到17B效果,还完全开源。原文
14:08AlphaSignal@AlphaSignalAI研究人员在论文《Training-Free Looped Transformers via Numerical ODE Integration》中提出一种无需重新训练即可提升冻结大模型性能的方法。该方法将每一层视为解常微分方程的一步,用多个小阻尼步骤替换原始大步骤,使模型获得更多推理时间。在MMLU-Pro上取得+2.64分提升,在GPQA上取得+2.01分提升,并在87%的测试组合中保持正向效果。AI模型Looped TransformersMMLU-ProGPQA推理模型无训练优化1 个信源在谈推荐理由:这篇论文教会你一种骚操作:不重新训练,就能让现成模型在推理时多思考几轮,MMLU-Pro和GPQA分数都涨了,值得看看。原文
14:05berryxia@berryxia78°Unsloth团队用Dynamic 2-bit方案将1万亿参数的Kimi K2.7 Code模型压缩48%,重要层保留更高精度。量化后模型仅需325GB RAM/VRAM即可本地运行,推理速度达40+ tok/s。全精度版本需要610GB显存。该优化并非粗暴量化,而是保留了模型的推理效率,尤其适合长程任务、复杂推理和agent工作流。AI模型Kimi K2.7 CodeUnsloth量化本地部署开源模型4 个信源在谈推荐理由:Unsloth把1万亿参数的Kimi K2.7 Code压到325GB本地能跑,速度40+ tok/s,长程推理和agent工作流全闭环,开源社区终于能自己跑了。原文
13:55@hebbia@hebbia71°在Hebbia金融服务业基准测试中,Anthropic的Fable 5模型总分超过所有其他前沿模型。该模型在基于文档的推理任务上提升显著,并在图表与表格解读、问题解决两个子项中取得最高分。测试结果来自Hebbia发布的金融行业专属评测集,涵盖多个复杂金融场景。AI模型Fable 5AnthropicHebbia基准测试金融AI10 个信源在谈推荐理由:Hebbia测了金融场景,Fable 5在文档推理和图表解读上碾压其他模型,搞金融AI的可以看看具体分数对比。原文
13:50@hebbia@hebbia精选73°Hebbia CTO 指出 Claude Opus 4.8 在金融工作流中实现了更强的引用准确性。相比前代,它在处理复杂金融文档时 token 效率显著提升。新模型适用于需要高精度引用的财务分析场景。AI模型Claude Opus 4.8Hebbia金融引用准确率token效率1 个信源在谈推荐理由:Hebbia 的 CTO 亲测说 Claude Opus 4.8 在金融任务上引用更准、省 token,做财报分析的团队可以试试。原文
13:08arXiv cs.AI@Jiaju Han, Ben Zhang, Xuemeng Sun, Qike Zhang, Yuxian Dong, Chengyin Hu, Fengyu Zhang, Yiwei Wei, Jiujiang GuoFusionRS是用于遥感双模态视觉语言学习的首个大规模RGB-红外-文本数据集。它由超过100万对对齐的RGB和红外风格图像组成,每对包含场景描述和红外感知描述。基于FusionRS训练的CLIP-style和生成式VLM模型在RGB-红外对齐、红外-文本检索和双模态描述任务上均优于纯RGB训练基线。消融实验表明,红外感知描述对强化红外-语言对齐至关重要。AI模型FusionRSRGB-红外遥感数据集视觉语言模型双模态学习推荐理由:FusionRS填补了RGB-红外双模态遥感数据集的空白,用公开RGB图转红外风格,加上两种描述,让模型同时理解可见光和红外信息。原文
12:42berryxia@berryxia77°据社交媒体传闻,OpenAI可能于6月23日发布GPT-5.6。该模型运行成本仅为Fable的三分之一,上下文窗口扩展至150万token,智能体编程工作流将全面升级。目前信息仍属未经证实的泄露阶段。AI模型GPT-5.6OpenAI上下文窗口智能体编程10 个信源在谈推荐理由:传GPT-5.6成本更低、上下文超长,还能提升智能体编程,6月23日可能有动作,值得关注后续。原文
12:28arXiv cs.LG@Jisang Han, Seonghu Jeon, Jaewoo Jung, René Zurbrügg, Honggyu An, Tifanny Portela, Marco Hutter, Marc Pollefeys, Seungryong Kim, Sunghwan HongGeometric Action Model (GAM) 将预训练的几何基础模型 (GFM) 拆分为观测编码器和未来预测解码器两部分,在中间层插入因果未来预测模块,结合语言、本体感受和动作历史,预测未来潜在标记,再利用剩余 GFM 块进行特征传播与动作解码。在多个仿真和真实机器人操作基准上,GAM 的准确率、鲁棒性、速度和模型大小均优于当前基于基础模型尺度的基线方法,例如在 RoboMimic 和 ManiSkill2 任务中表现显著提升。AI模型GAM几何基础模型机器人策略学习操作视觉-语言-动作模型推荐理由:这篇论文提出了一种新思路:用几何基础模型直接做机器人操作策略,不依赖二维图像,效果更快更准更轻。原文
12:25IT之家(博客/媒体)谷歌 6 月 15 日更新 Android Bench 榜单,测评 AI 模型在安卓开发任务中的表现。OpenAI 的 GPT-5.5 以 74 分排名第一,GPT-5.4 以 72.4 分第二,谷歌 Gemini 3.1 Pro Preview 同分第三。谷歌自家 Gemini 3.5 Flash 仅得 63.7 分,排第六,且单次运行平均成本 147.1 美元,为榜单最贵。DeepSeek V4 Flash 得分 52.7 排第 12,成本仅 8.4 美元,Gemini 3.5 Flash 成本是其 17.5 倍。AI模型Android BenchGemini 3.5 FlashGPT-5.5DeepSeek V4 Flash开发辅助10 个信源在谈推荐理由:谷歌新榜单实测,Gemini 3.5 Flash 在安卓开发任务中得分低、成本高,性价比远不如 DeepSeek V4 Flash。原文
12:23IT之家(博客/媒体)阿里巴巴发布千问具身智能大模型 Qwen-Robot 系列,包含 VLA 操作模型 Qwen-RobotManip、VLN 移动模型 Qwen-RobotNav 和世界模型 Qwen-RobotWorld。这三个模型分别为机器人提供灵巧的手、认路的脚和会思考的大脑,可单独部署也能协同运转。此前,Qwen3.7-Max 在 Arena 全球大模型盲测中超过 Kimi-K2.6、DeepSeek-v4-pro、GLM-5.1,位列国产模型第一。AI模型Qwen-Robot阿里巴巴具身智能Qwen-RobotManip机器人1 个信源在谈推荐理由:阿里推出了首个具身智能模型系列 Qwen-Robot,包含操作、移动和世界模型,为机器人打造通用底座。原文
12:22arXiv cs.LG@Alper YıldırımHAMON是一种基于无源衍射光学的时序预测核心,将历史值编码到光瞳面上,未来位置留暗,通过级联可训练相位掩模和自由空间衍射直接输出预测场。在ETTm2数据集上所有预测区间均超越最强数字基线,在ETTh2上除最长区间外也领先,MSE最多降低14%。在Weather数据集上表现有竞争力,在Traffic和Electricity等高通道数据集上稍弱。消融实验和交叉仿真验证了预测来自光学场而非数字头部。AI模型HAMON时间序列预测光学计算无源衍射光学长程预测推荐理由:这篇论文用纯光学硬件做时序预测,在多个基准上不输甚至超过数字模型,为低功耗预测提供了新思路。原文
12:16arXiv cs.LG@Wei Xiao, Weiliang Tang, Yuying Ge, Hui Zhou, Yao Mu, Li Zhang, Yixiao GeROVE 是一个用于人形机器人视觉-语言-动作(VLA)模型后训练的强化学习框架,能够应对不完美的人类干预数据。它引入人类在环流水线收集部署与干预数据,并使用乐观价值估计(OVE)从混合质量轨迹中筛选高价值行为。ROVE 还利用跨实体人类经验视频为长尾失败与恢复模式提供丰富监督,引导 VLA 聚焦于高价值行为。在真实世界的接触丰富且精细的人形操作任务中,ROVE 超越了经验学习基线,并在多轮部署-干预迭代中持续提升。AI模型ROVE人形机器人强化学习VLA模型操作推荐理由:人形机器人操作新方法ROVE,用强化学习从糟糕的人类演示中挑出好动作,真实任务效果比基线好。原文
12:08shao__meng@shao__meng精选Cua与Snorkel AI联合发布Cua-Bench基准,首个公开数据集聚焦KiCad电子设计自动化工具,包含25道专家编写的任务。测试显示最强模型GPT-5.5仅完全通过6道(24%),Claude Sonnet 4.5和Haiku 4.5各通过5道。关键发现:模型在编辑已有原理图方面表现尚可,但16道从零搭建任务全部失败。失败原因包括导航开销大(约84%)、操作粒度过细(约84%)和布线未完成(约72%),同时自我校验不可靠。AI模型Cua-BenchKiCadGPT-5.5Claude Sonnet 4.5Agent推荐理由:想看看AI Agent在专业软件上到底行不行?Cua-Bench用KiCad的25道真实任务给模型打分,最强的也只过了6道,从零建电路全挂。看完你就知道瓶颈在哪了。原文
11:43arXiv cs.AI@Jialei Chen, Kai Wang, Kang Chen, Shuaihang Chen, Feng Gao, Wenhao Tang, Zhiyuan Li, Weilin Liu, Zhuyu Yao, Boxun Li, Yuanbo Xu, Chao YuLaWAM通过潜在视觉子目标替代重建未来视频,在LIBERO基准上达到98.6%的成功率,在RoboTwin上达到91.22%,并在真实世界操作任务中取得竞争性表现。该模型每次动作块预测仅需187毫秒,延迟比像素空间世界行动模型低24倍。LaWAM的核心是潜在动作条件潜在世界模型(LaWM),利用预训练视觉基础模型的潜在空间预测未来观测特征。AI模型LaWAM机器人策略世界模型潜在空间推荐理由:机器人策略新框架LaWAM,不用生成视频就能预测场景变化,又快又准,成功率98.6%还低延迟,推荐做机器人控制的看看。原文
11:07arXiv cs.LG@Daniel Csillag, Rodrigo Schuller, Pedro Dall'Antonia, Leonidas Guibas, Luiz Velho, Tiago Novello这篇论文提出了一个新型的泛函梯度下降(FGD)算法,该算法在优化过程中自适应调整泛函梯度的表示,解决了固定近似引入误差的问题。作者证明,在光滑损失条件下该算法收敛到平稳点,在附加Polyak-Lojasiewicz条件时收敛到全局最小值,这是首个在一般环境下具有此类保证的可实现FGD方法。在回归、偏微分方程数值求解和现代计算机视觉任务中,该方法在效率和准确度上均优于固定近似FGD和神经网络基线。AI模型FGD自适应表示优化算法收敛性推荐理由:这篇论文提出了首个可实现的泛函梯度下降算法,能自适应调整梯度表示,理论上有收敛保证,实验上比传统FGD和神经网络更快更准。原文
10:51arXiv: Google DeepMind@Junjian Zhang, Hao Tan, Ruonan Li, Dong Zhu, Aiping Li, Zhaoquan GuARB4WM提出一个统一的评估框架,用于测试世界模型在视觉扰动下的对抗鲁棒性。该框架定义了五个白盒损失目标,涵盖策略、价值和潜在动力学三个层面。在MetaWorld和DeepMind Control Suite的20个任务上评估了四种Dreamer-style代理。结果显示,针对值估计、潜在表示和RSSM动力学的攻击与直接策略破坏同等有害,早期或频繁扰动尤其严重。代码已开源并提供使用接口。AI模型ARB4WMDreamer世界模型对抗鲁棒性连续控制推荐理由:想检验你的世界模型扛不扛揍?ARB4WM这个新基准专门测视觉扰动下的鲁棒性,比单看动作空间全面多了。原文
10:46arXiv: DeepSeek@Sen Xu, Shixi Liu, Wei Wang, Jixin Min, Yingwei Dai, Zhibin Yin, Yirong Chen, Xin Zhou, Junlin ZhangVibeThinker-3B是一个3B参数的小型稠密模型,基于Spectrum-to-Signal后训练范式,通过课程监督微调、多域强化学习和离线自蒸馏提升。在AIME26上达到94.3分(测试时扩展至97.1),LiveCodeBench v6上Pass@1为80.2,最新LeetCode竞赛接受率96.1%。其性能与DeepSeek V3.2、GLM-5和Gemini 3 Pro等旗舰大模型相当或超越。IFEval得分为93.4,表明强推理未损害指令遵循能力。该工作提出了参数压缩-覆盖假说:可验证推理可压缩为紧凑推理核心,而开放域知识需宽参数覆盖。AI模型VibeThinker-3B推理模型可验证推理小语言模型基准成绩推荐理由:想看看3B小模型怎么打平千亿级大模型?VibeThinker-3B用AIME 94.3分、LiveCodeBench 80.2%的成绩告诉你,小模型也能杀进顶级推理梯队。原文
10:07Gary Marcus@GaryMarcusAnthropic 发布的 Claude Fable 5 在 Epoch AI 的 Epoch Capabilities Index 上获得 161 分,以 1 分之差超越 GPT-5.5 Pro 的 160 分。这是 Anthropic 一年多来首次在该基准上领先。该指数综合评估模型能力,当前最高分为 161。尽管成绩创下新高,但专家指出进步幅度仍属渐进。AI模型Claude Fable 5GPT-5.5 ProAnthropicEpoch Capabilities Index基准测试10 个信源在谈推荐理由:Claude Fable 5 刚在 Epoch 能力指数上以 161 分微弱领先 GPT-5.5 Pro,这是 Anthropic 一年多来首次登顶,你可以看看它具体强在哪。原文
09:52IT之家(博客/媒体)火山引擎于 6 月 15 日上线 Seedance 2.0 Mini 模型,官方称其生成速度快于 Seedance 2.0 Fast 约 2 倍,输出质量相当。定价方面,图生视频 0.023 元/千 tokens,视频生视频 0.014 元/千 tokens,720P 规格下单秒成本约 0.5 元,较标准版降低约一半。该模型主要面向电商内容、营销素材、UGC 创作等高频率生产场景。AI模型Seedance 2.0 Mini字节跳动火山引擎视频生成性价比推荐理由:字节跳动刚出的视频模型,成本只有上一代一半,速度还快两倍,电商和做UGC的可以试试批量出素材。原文
09:46IT之家(博客/媒体)AMD在COMPUTEX 2026宣布,Radeon RX 7000系列显卡通过INT8 AI加速全面适配FSR超分辨率4.1,质量与FP8版本持平。RX 6000系列因缺乏专用AI加速器,需利用传统流处理器单元优化,减少着色器周期占用难度大,发布时间推迟至明年初。FSR 4.1的开发流程使用Instinct MI显卡训练,Radeon PRO优化,并在数十万种PC配置中测试验证。AI模型FSR 4.1RX 7000RDNA 3INT8超分辨率推荐理由:AMD确认了,RX 7000用INT8跑FSR 4.1画质不输FP8,RX 6000得等到明年。想玩新超分可以关注。原文
09:37AWS Machine Learning Blog@Aris Tsakpinis精选Google DeepMind 发布的 Gemma 4 开源权重模型系列现已在 Amazon Bedrock 上可用。该系列包含三个指令调优变体:Gemma 4 31B(密集架构)、26B-A4B(MoE 架构,每次激活 4B 参数)和 E2B。所有变体均支持内置推理、原生函数调用以及文本和图像多模态输入。模型基于 Apache 2.0 许可发布,旨在多种部署场景下实现每参数智能最大化。AI模型Gemma 4Amazon BedrockGoogle DeepMind开源模型多模态4 个信源在谈推荐理由:Google DeepMind 把最新的 Gemma 4 放到 AWS 上了,三种规格可选,带推理和图文理解,正好拿来玩开源项目。原文
09:32lmarena.ai@lmarena_ai精选Kimi-K2.7-Code是Kimi新发布的编码模型,在Code Arena: Frontend中排名第3(开源模型),整体第19。相比K2.6,该模型在Kimi Code Bench v2上提升21.8%,Program Bench提升11.0%,MLS Bench Lite提升31.5%。推理效率提升,推理token使用量降低30%。模型已通过Kimi API和Kimi Code开源提供。AI模型Kimi-K2.7-CodeKimiCode Arena开源模型编码模型3 个信源在谈推荐理由:Kimi新出的编码模型K2.7-Code,在Code Arena前端排名第三,比上代提升明显,推理更省token,开源可玩。原文
09:32lmarena.ai@lmarena_aiKimi-K2.7-Code 在 Code Arena: Frontend 基准测试中排名第19位。该基准评估前端代码生成能力。作者提示 Agent Arena 的分数即将发布。AI模型KimiK2.7-CodeCode Arena前端代码智能体推荐理由:Kimi 的新代码模型在前端任务上排到第19,想看Agent成绩的可以蹲一下。原文
09:16IT之家(博客/媒体)AMD "Zen 6" 微架构桌面级处理器 "Olympic Ridge" 据 X 平台爆料将集成 NPU 单元但取消核显。该处理器引入 CUDIMM 支持,可提升 DDR5 内存频率上限,仍无原生 USB4 控制器需外挂芯片。此举旨在平衡 AI PC 需求与芯片制造成本,与英特尔 "Nova Lake S" 正面竞争。AMD 此前 AM4 时期无核显处理器策略已获成功。AI模型AMDZen 6Olympic RidgeNPU桌面处理器推荐理由:AMD要在桌面处理器里加NPU,砍掉核显,看来是为了推AI PC和降成本,跟英特尔的新品对标。原文
09:07GitHub Blog@Natalie GuevaraGitHub发布了一个新的repository-level数据集,许可证为CC0-1.0,包含多语言开发者内容,涵盖README、issues和pull requests。该数据集旨在帮助研究人员和开发者训练或改进多语言AI模型。数据集中于2025年4月发布,可直接下载使用,无需额外申请。AI模型GitHub多语言AI开源数据集代码文档推荐理由:GitHub新出的多语言数据集,免费开源,里面各种语言的README和讨论都有,做多语言AI模型训练正好用上。原文