6月30日
07:51
07:51marktechpost@Asif Razzaq
精选
OpenClaw 推出了 iOS 和 Android 配套节点应用,通过 WebSocket 将手机连接到自托管的 Gateway。这些应用不是独立聊天机器人,而是为本地优先的 AI 代理添加设备硬件,包括相机、位置、语音和 Canvas。文章为构建者详解了架构、能力和权衡。
推荐理由:OpenClaw 出了 iOS 和 Android 的配套 App,连到你自家搭的 AI 网关,手机摄像头、位置、语音都能当智能体的感知器。想自己搞本地 AI 代理可以试试。
6月23日
11:03
11:03arXiv cs.AI@Yikun Fu, Bowen Fu, Zhenyu Wu, Shuang Cheng, Xiaowei Sun, Bowen Yang, Zehao Li, Yibo Zhao, Zichen Ding, Zhoumianze Liu, Shijie Wang, Biqing Qi, Bowen Zhou
MacAgentBench新基准包含676个任务覆盖25个macOS应用,近60%任务需要同时操作GUI和命令行。采用确定性规则评估并引入细粒度多检查点评分。实验在3个框架和16个模型上进行,最优配置Claude Opus 4.6 on OpenClaw达到73.7% Pass@1,优势主要来自技能库而非框架设计。细粒度指标显示相同Pass@1的模型在子目标完成上差异显著。

推荐理由:这篇论文发布了MacAgentBench,一个包含676个macOS桌面任务的智能体基准。它用细粒度评分发现Claude Opus 4.6配合OpenClaw能拿到73.7%的正确率,而且不同模型表面分一样但实际完成能力差很多,值得研究智能体的去看。
6月11日
6月4日
5月25日
5月22日
5月17日