IT之家(博客/媒体)精选63高德宣布推出华为鸿蒙HarmonyOS首个生成式UI开源框架AGenUI,基于谷歌A2UI协议,以C++为核心,能将AI大模型生成的界面意图直接转化为鸿蒙原生组件渲染。该框架只需一套通用界面协议即可无缝适配鸿蒙手机、平板、车机、智慧屏、穿戴等多种终端设备,无需单独适配调试。性能上,鸿蒙版AGenUI相较iOS、Android端渲染性能提升20%,内存占用降低18%。目前该项目已在GitHub全面开源,面向开发者和学术界。AI产品生成式UI鸿蒙/HarmonyOS开源/仓库多终端适配AGenUI推荐理由:鸿蒙开发者终于有了原生生成式UI框架,一套协议搞定多终端适配,省去大量重复调试工作,做鸿蒙应用或AI界面的团队值得直接上手试试。
arXiv cs.AI@Zhigao Huang, Zhengqing Hu, Dong Chen, Shaohan Zhang, Zhao Jin, Bo Zhang, Han Wu, Mingliang Xu精选58针对现代战场环境下传统作战规划生成不可行、验证不充分的问题,研究者提出IFPV框架。该框架包含多视角分层智能体(MPHA)用于生成可执行的多平台战术动作序列,以及对抗认知仿真引擎(ACSE)用于高保真验证。ACSE引入带有定制世界模型的对手,能预测关键平台未来演化并动态对抗候选计划。在非对称作战战术模拟器(ACTS)中,IFPV相比单步大语言模型基线,任务成功率提升19.4%,作战成本降低41.7%;相比传统规则验证器,平均压制率提高31.8%。代码已开源。论文多智能体作战规划仿真验证开源/仓库IFPV推荐理由:军事AI和仿真验证领域的团队终于有了一个可落地的多智能体框架——IFPV不仅生成计划,还能通过对抗仿真找出漏洞,做作战规划或复杂系统验证的开发者可以直接用开源代码复现。
berryxia@berryxia精选72Prime Intellect 让 Claude Code(Opus 4.5)和 Codex(GPT 5.5)在 nanoGPT speedrun 的 optimizer track 上完全自主运行,使用闲置算力完成约 1 万次实验,消耗 1.4 万 H200 小时。Claude Code 将记录推进到 2930 steps,超越人类基准的 2990 steps,整个过程无人值守。实验在 optimizer 搜索、超参数扫描和方法 stacking 上高效,但在真正创新上遇到瓶颈。Prime Intellect 已开源所有 scratchpad、运行日志、配置和生成的 idea,将 AI 研究自动化从概念变为可复现的现实。AI产品AI研究自动化Claude CodeCodex开源/仓库智能体推荐理由:AI 研究自动化从概念走向可复现现实,做 AI 研究的团队可以直接参考这套开源实验记录,省下大量试错成本。
AlphaSignal@AlphaSignalAI精选73CodeGraph 是一个开源的 MCP 服务器,通过预索引代码库为本地知识图谱,让 AI 代理直接查询图谱而非扫描文件,从而大幅减少工具调用。在六个真实项目测试中,平均减少 92% 工具调用,探索速度提升 71%,在 TypeScript 和 Java 代码库上分别减少 94% 和 96% 的调用。它基于 Tree-sitter 解析语法树,使用 SQLite 存储符号和调用关系,支持 19 种以上语言,完全本地运行,无需 API 密钥。只需一条 npx 命令即可设置,文件监视器可保持图谱实时更新。AI产品Claude CodeMCP/工具开源/仓库代码探索知识图谱推荐理由:对于频繁使用 Claude Code 进行代码库探索的开发者,CodeGraph 能显著降低 token 消耗和等待时间,实测效果惊人,值得立即尝试。
IT之家(博客/媒体)精选63腾讯云正式开源 TencentDB Agent Memory,面向 Agent 长任务场景提供短期记忆压缩与长期个性化记忆能力。该方案通过“上下文卸载”和 Mermaid 任务画布技术,将完整信息卸载到外部存储,同时以结构化任务图保留关键状态,使 Agent 在长任务中保持轻量上下文。在多任务连续 Session 实验中,最高降低 61% Token 消耗,并提升任务成功率。项目已适配 OpenClaw 和 Hermes 等主流 Agent 框架,支持一键集成,默认使用本地 SQLite 存储,零外部依赖。AI产品腾讯Agent Memory开源/仓库上下文压缩长任务推荐理由:做 Agent 长任务开发的团队终于有了省 Token 又保精度的开源方案——上下文卸载加任务画布让 Token 消耗降 61% 的同时成功率还上升,建议直接集成试试。
Anthropic: Engineering(资讯)精选50Anthropic 发布 Agent Skills,一套用于增强 AI 智能体在真实环境中执行任务能力的工具集。Agent Skills 包含多个预构建模块,如文件操作、网络请求、数据解析等,让开发者无需从零编写复杂逻辑即可快速部署实用智能体。该项目旨在解决当前智能体在现实应用中缺乏可靠基础能力的问题,降低开发门槛并提升任务成功率。Anthropic 同时开源了相关代码,鼓励社区贡献更多技能模块。AI产品智能体AnthropicAgent Skills开源/仓库工具集推荐理由:做智能体应用的开发者不用再重复造轮子了——Agent Skills 直接提供了文件处理、网络请求等高频基础能力,拿来就能用,建议直接看源码。
arXiv cs.AI@Jose E. Aguilar Escamilla, Lingdong Zhou, Xiangqi Zhu, Huazheng Wang精选40极端天气和波动的电力批发市场给居民用户带来巨大财务风险,但配电网级别的需求响应尚未被充分利用。DR-Gym 是一个开源、兼容 Gymnasium 的在线环境,从电力公司视角训练和评估需求响应策略。它通过状态切换的批发价格模型(校准自真实极端事件)和基于物理的建筑需求曲线,模拟定价信号与用户接受度之间的动态反馈。该环境支持可配置的多目标奖励函数,并已通过基线策略验证其可学习性。论文强化学习需求响应电网优化开源/仓库能源AI推荐理由:电力公司终于有了一个能模拟用户行为反馈的强化学习训练场,做电网调度或能源 AI 的团队可以直接用这个开源环境来优化需求响应策略,减少居民电费风险。
arXiv cs.AI@Xuhao Hu, Xi Zhang, Haiyang Xu, Kyle Qiao, Jingyi Yang, Xuanjing Huang, Jing Shao, Ming Yan, Jieping Ye精选75计算机使用智能体(CUA)在同时使用原子GUI操作(如点击、输入)和高级工具调用(如API文件操作)时,常因无法判断何时切换而导致执行路径次优。为解决这一问题,研究者提出ToolCUA,一种端到端智能体,通过分阶段训练范式学习最优GUI-工具路径选择。其核心包括:利用静态GUI轨迹合成工具库的轨迹缩放流水线、结合单步强化学习的工具引导GUI RFT,以及在线智能体强化学习优化。在OSWorld-MCP基准上,ToolCUA达到46.85%准确率,相比基线提升约66%,并比纯GUI设置提升3.9%,证明了混合动作空间训练的有效性。项目已开源。论文计算机使用智能体GUI自动化工具调用强化学习开源/仓库推荐理由:做GUI自动化或智能体开发的团队,这个工作解决了混合动作空间路径选择的痛点——不用手动收集真实工具轨迹也能训练出高效智能体,建议点开看看方法细节。
IT之家(博客/媒体)精选70小米技术发布并开源了 Xiaomi OneVL 一步式潜空间语言视觉推理框架,首次将 VLA(视觉语言动作)与世界模型统一到同一框架中。该模型在多个自动驾驶基准上刷新了潜在推理方法的性能上限,同时提供语言和视觉双维度的可解释性。相比传统方法,OneVL 在精度上超越显式 CoT,在速度上对齐“仅答案”预测。小米已将模型权重、训练和推理代码全面开源。AI模型自动驾驶VLA世界模型开源/仓库小米推荐理由:自动驾驶研究者终于有了一个统一 VLA 与世界模型的开源方案——OneVL 在精度和速度上均优于现有方法,做端到端驾驶或世界模型开发的团队可以直接拿来用。
IT之家(博客/媒体)精选70面壁智能联合清华大学及 OpenBMB 开源社区发布 MiniCPM-V 4.6,参数规模 1.3B,仅需约 6GB 内存即可在端侧流畅运行。该模型在 Artificial Analysis 评测中以 13 分超越 Ministral 3 3B,整体能力接近 Qwen3.5-2B 级别。效率方面,基于 vLLM 框架的 Token 吞吐量是 Qwen3.5-0.8B 的 1.5 倍,计算 Token 消耗仅为后者的 2.5%。技术创新包括 LLaMA-UHD v4 架构,将图像编码计算量降低 55.8%,处理 3132×3132 高清图首字延迟仅 75.7 毫秒。模型已全面开源,支持 iOS、Android 和 HarmonyOS 等系统。AI模型大模型多模态开源/仓库MiniCPM-V面壁智能推荐理由:1.3B模型6G内存就能跑