15:19berryxia@berryxia钟二信开源了Cowart插件,将Codex与无限画布工具结合,用户可直接在画布上用自然语言标注和修改图片。该插件支持GPT Image 2,操作方式类似设计软件:选中区域、给出修改意见、实时反馈迭代,替代传统多次prompt的流程。项目已开源,可免费使用。AI产品CodexCowartGPT Image 2图片编辑自然语言交互推荐理由:给用Codex和GPT Image 2画图的兄弟安利这个插件,画布上直接点选区域说修改,比来回敲prompt爽多了,还带历史痕迹。原文
05:16Ate-a-Pi@svpino一个AI代理产品允许用户直接标记目标并用自然语言下达指令,无需学习任何提示词技巧或理解工作原理。用户只需说出需求,代理即可自动执行并回答。这种零门槛交互方式大幅降低了AI使用门槛,使得更多非技术用户能够轻松上手。该产品因简单易用而逐渐流行起来。技巧智能体自然语言交互零门槛推荐理由:这个AI代理不用学提示词,直接说话就行,效率拉满。原文
18:06IT之家(博客/媒体)亚马逊发布了完全自主仓储机器人Proteus的新版本,该机器人现在可以通过自然语言接受指令,员工无需使用代码或专门软件即可像安排同事工作一样分配任务。Proteus外形像乌龟,主要负责重物搬运和移动大型推车,新版能自主判断优先级、路线和时间安排,活动范围也从装卸区扩展到任何需要移动物品的地方。新系统目前仍在实验室试点,计划2027年上半年部署到欧洲。亚马逊还计划推广其他机器人如Vulcan和协作式周转箱处理系统,并强调自动化在创造新岗位而非取代员工。AI产品仓储机器人自然语言交互亚马逊Proteus自动化推荐理由:仓储物流从业者或关注工业自动化的读者值得关注——Proteus的自然语言交互降低了机器人使用门槛,未来可能改变仓库工作流程,建议提前了解其能力边界。原文
21:15IT之家(博客/媒体)83°月之暗面 Kimi 宣布 Kimi Work Beta 版开启内测,随最新版 Mac 和 Windows 客户端推出。Kimi Work 是面向知识工作者的通用型本地 Agent,基于 Kimi Code 提供本地 Agent 基础能力,支持自然语言驱动任务拆解、工具调用、浏览器使用和文件管理。它内置了建站、PPT 等专业 Skills 和金融、科研、法律等数据库,并支持 Agent 集群,最高可创建 300 个子 Agent 处理复杂任务。值得注意的是,Kimi Work 自身 92% 的代码由 AI 自主生成,工程师仅用一周完成开发。AI产品智能体本地 AgentKimi知识工作者自然语言交互推荐理由:Kimi Work 把本地 Agent 的门槛降到自然语言即可使用,知识工作者(如分析师、研究员、项目经理)不用学命令行就能让 AI 帮你写报告、做 PPT、查数据库,值得立即申请内测体验。原文
22:51airtap_ai@airtap_aiAirtap 在 X 上分享了一个智能家居 AI 代理的演示,强调家庭控制是应用代理的理想场景。用户只需用自然语言提问,代理就能自动打开应用、检查设备状态并快速返回结果,无需额外解释。该示例展示了如何将日常家庭问题转化为实际应用操作,提升了智能家居的便捷性。Airtap 认为这种直接的价值体现是代理应用成功的关键。AI产品智能体智能家居Airtap自然语言交互应用代理推荐理由:智能家居用户和开发者会看到 AI 代理如何将复杂操作简化为一句话,值得直接体验这种「打开应用、检查设备、快速反馈」的流畅流程。原文
16:00AI Will@FinanceYF5OpenAI 推出了 ChatGPT for PowerPoint 插件,用户可以直接在 PowerPoint 中通过自然语言创建新幻灯片、针对整套演示文稿提问,以及实时修改内容。该插件将 AI 对话能力嵌入办公场景,大幅提升演示文稿制作效率。目前该功能已上线,支持常见 PowerPoint 版本。AI产品ChatGPTPowerPoint办公效率AI插件自然语言交互10 个信源在谈推荐理由:做演示文稿的团队和个人终于可以告别手动排版——ChatGPT 直接嵌入 PowerPoint,用自然语言就能生成和修改幻灯片,建议 PPT 重度用户立刻试试。原文
16:03pandaily@contact@pandaily.com (Pandaily)智谱AI发布了名为AutoClaw的移动应用,作为AI智能体的新交互入口。该应用旨在让用户通过自然语言与AI智能体进行更直观的交互,完成复杂任务。AutoClaw的推出标志着智谱AI在智能体领域的重要布局,为用户提供了更便捷的AI服务使用方式。AI产品智能体移动应用智谱AIAutoClaw自然语言交互推荐理由:智谱AI的AutoClaw App为AI智能体交互提供了更直观的移动入口,做AI应用开发或关注智能体生态的团队值得关注,可以直接体验其自然语言驱动的任务执行能力。原文
06:03rohanpaul_ai@rohanpaul_ai83°Google 推出 Gemini Omni,一个能从视频、图像、音频、文本和草图等多种输入生成并编辑视频的 AI 模型。用户只需用自然语言描述,即可添加角色、替换物体、改变动作、调整风格、同步声音或移动镜头,且每次编辑后场景保持稳定。Omni 具备更强的世界理解能力,能更真实地模拟重力、流体运动、动能和物理交互。该模型将集成到 Gemini 应用、Google Flow 和 YouTube Shorts 中。Google 还为 Omni 输出添加了 SynthID 水印和 C2PA 内容凭证,以标识 AI 生成或编辑的媒体。AI产品Gemini Omni视频生成视频编辑自然语言交互AI 水印2 个信源在谈推荐理由:视频创作者和内容团队终于有了一个能像导演一样反复指导修改的 AI 工具,而非一次性的 prompt 生成。做短视频、广告或影视后期的人,可以直接用自然语言调整画面细节,值得关注。原文
00:31airtap_ai@airtap_aiAirtap 展示了如何将一句简单的自然语言指令转化为结构化的应用内工作流,包括请求、搜索、选择和购物车操作。这解决了大多数真实任务并非单一动作、而是需要一系列决策和操作的问题。Airtap 的智能体能够全程跟随任务链,不仅提供建议,还能实际执行操作。这对于移动端自动化工作流和智能体应用具有重要意义。AI产品智能体工作流自动化移动执行Airtap自然语言交互推荐理由:Airtap 把自然语言直接变成可执行的多步工作流,做移动端自动化或智能体开发的团队值得关注——它让智能体从“建议”进化到“执行”,解决了真实任务需要连续决策的痛点。原文