全部 AI 动态 · AI 热点

6月25日

09:40

arXiv: OpenAI@Nikolaos D. Tantaroudas, Ilias Karachalios, Andrew J. McCracken

论文介绍了Falco eleonorae，一个面向希腊小岛农民的双语（希腊语主、英语次）对话式AI助手。系统利用OpenAI GPT-5家族模型进行回答生成，并通过MCP工具查询本地作物、季节性日历、方言词汇等结构化数据。它支持语音输入（使用欧盟流式语音转文字服务）和图像描述（由视觉模型处理），并设计为渐进式Web应用以适应低带宽环境。作者论证，对于资源受限的农村部署，这种托管式检索增强方案比自托管模型更可靠且更易实现。

论文 Falco eleonorae GPT-5 MCP/工具多模态 RAG

推荐理由：OpenAI的GPT-5给希腊农民做了个接地气的AI助手，能说方言、看图、查作物日历，比通用聊天更实用。

原文

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

6月12日

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？

10:56

arXiv cs.AI@Ripon Chandra Malo, Tong Qiu

72°

AI 编程助手目前每次新会话都需要重新读取项目文件、重新推导之前的决策，甚至重复失败的调试尝试，消耗大量 token。PROJECTMEM 是一个开源、本地优先的记忆与判断层，通过不可变的事件日志记录开发过程（问题、尝试、修复、决策、笔记），并通过 MCP 协议生成紧凑的 AI 可读摘要。它还能在代理执行前发出警告，防止重复失败修复或编辑脆弱文件，实现“记忆即治理”。该系统完全离线运行，无遥测，日志可作为可审计的溯源链。项目包含 14 个 MCP 工具、19 个 CLI 命令，并在 10 个项目、207 个事件的自我研究中得到验证。

AI产品 AI 编程助手记忆层 MCP/工具开源/仓库事件溯源

推荐理由：AI 编程助手每次会话浪费大量 token 重读上下文的问题终于有了解决方案——PROJECTMEM 用本地事件日志让代理记住历史，做复杂项目开发的团队可以直接集成，减少重复调试成本。

原文

6月2日

12:03

arXiv cs.AI@Wenhao Wang, Peizhi Niu, Gongyi Zou, Xiyuan Yang, Jingxing Wang, Haoting Shi, Yaxin Du, Jingyi Chai, Xianghe Pang, Shuo Tang, Yanfeng Wang, Siheng Chen

精选72°

MCP-Persona 是首个专门评估 LLM 智能体在真实个人化 MCP 工具上表现的基准。它覆盖了 Reddit、小红书、飞书、Slack 等主流社交和协作平台，测试智能体与个人账户和本地数据库交互的能力。实验发现，当前最先进的智能体在处理个人化工具时表现挣扎，凸显了该基准在识别和解决这些局限性的关键作用。该基准已开源，可供开发者直接使用。

论文 MCP/工具智能体基准测试个人应用开源/仓库

推荐理由：MCP-Persona 填补了现有基准忽视个人化工具交互的空白，做智能体开发和 MCP 工具集成的团队可以直接用它来测试和优化自己的模型。

原文

11:12

arXiv cs.AI@Lichao Wang, Zhaoxing Ren, Tianzhuo Yang, Jiaming Ji, Chi Harold Liu, Yaodong Yang, Juntao Dai

SafeMCP 是一个服务器端防御插件，针对 LLM Agent 使用 MCP 协议时因动作空间扩大带来的安全风险。它通过内部世界模型进行前瞻推理，实现两层防御：主动工具过滤限制危险权限扩展，以及即时干预作为故障安全机制。训练采用三阶段流程：环境动态基础、安全策略初始化和带双重可验证奖励的强化学习。在 PowerSeeking Bench、ToolEmu 和 AgentHarm 上的实验表明，SafeMCP 能在降低风险的同时保持 Agent 的实用性。

论文 MCP/工具 LLM Agent 安全防御前瞻推理强化学习

推荐理由：做 LLM Agent 安全防护的团队终于有了一个可落地的方案——SafeMCP 在服务器端用前瞻推理主动过滤危险工具调用，比事后审计更有效，建议关注其开源实现。

原文

5月22日

11:17

arXiv cs.AI@Edwin Jose

精选

HarnessAPI 是一个 Python 框架，旨在解决 LLM 工具部署中 HTTP 端点与 MCP 工具注册重复维护的问题。它通过将类型化的技能文件夹作为单一事实来源，从 handler.py 和 Pydantic 模式自动生成流式 HTTP 端点、交互式 OpenAPI/Swagger UI 和零配置 MCP 工具。该框架支持双模式内容协商，无需修改处理器即可同时服务 SSE 流和 JSON 返回客户端。动态代码生成机制确保 Pydantic 类型注解正确传播到 FastMCP 的检查层，解决了基于闭包注册的技术限制。在六个代表性技能上测试，HarnessAPI 相比手动维护的双栈实现减少了 74% 的框架相关样板代码。

AI产品 MCP/工具开源/仓库 Python框架流式API LLM工具部署

推荐理由：做 LLM 工具部署的开发者终于可以告别 HTTP 和 MCP 两套代码的重复维护了——HarnessAPI 用一个技能文件夹自动生成所有接口，减少 74% 样板代码，值得直接试试。

原文

5月21日

11:03

arXiv cs.AI@Junshu Pan, Panzhong Lu, Yixuan Weng, Qiyao Sun, Fang Guo, Zijie Yang, Qiji Zhou, Yue Zhang

精选

AiraXiv 是一个由AI驱动的开放获取平台，旨在解决传统学术出版系统在AI时代面临的投稿量激增、审稿压力大等问题。该平台支持人类科学家通过交互式UI参与，也允许AI科学家通过MCP协议进行交互。论文以开放预印本为基础，结合AI增强分析和读者反馈，实现持续迭代。AiraXiv 已在ICAIS 2025会议上作为投稿平台实际部署，验证了其作为快速、包容、可扩展的研究基础设施的潜力。

论文开放获取学术出版 AI科学家 MCP/工具预印本

推荐理由：学术出版系统正被AI生成论文淹没，AiraXiv 提供了一个让人类和AI科学家平等参与、论文持续演进的解决方案。做学术出版、科研管理或AI研究的人值得关注，它可能改变未来论文的发表和评审方式。

原文

5月20日

10:53

arXiv: DeepSeek@Aman Desai

精选

RooAgent 是一个基于 LLM 的自然语言接口，专为高能物理领域的 Root 数据分析设计。它将物理分析函数封装为工具，让 LLM 智能体根据自然语言指令调用，支持直方图检查、事件选择、运动学分布可视化、拟合和显著性估计等任务。该工具提供两种运行模式：基于 LangGraph 的智能体（兼容 GPT-4.1 和 DeepSeek-V3），以及 MCP 服务器模式（用于 Anthropic Claude CLI）。通过 Monte Carlo 模拟和 ATLAS 开放数据测试，RooAgent 展示了在多任务信号-背景工作流中的有效性。代码已开源在 GitHub 并可通过 PyPI 安装。

AI产品 LLM智能体高能物理 Root数据分析开源/仓库 MCP/工具

推荐理由：高能物理研究者终于有了一个能用自然语言操作 Root 数据的智能体，省去手动写脚本的繁琐，做粒子物理分析的团队可以直接试试。

原文