16:13Yangyi@Yangyixxxx这条推文探讨了产品设计中的两种路线选择:Human First 模式(如带界面的 SaaS)和 Agent First 模式(如纯正的 CLI)。作者 Yang Yi 提出,关键取决于用户是否需要实时反馈与可视化操作,还是可以容忍黑箱执行。如果目标用户对流程控制要求高,Human First 更合适;如果追求自动化与效率,Agent First 更优。该讨论基于 163 次浏览和 1 次回复的社交数据,反映了行业对交互形态的持续思考。技巧产品设计人机交互AgentSaaSCLI推荐理由:设计师和创业者都在纠结的问题:到底该做带界面的产品还是纯 CLI?Yang Yi 这条推文给了一个简洁的判断框架,帮你少走弯路。原文
12:52Unitree 宇树@UnitreeRobotics宇树科技展示了其G1机器人通过外部语音命令实时生成任意动作的能力。视频为现场单次录制,包含现场音频。由于动作由AI实时自主生成,存在轻微延迟且动作流畅度有所降低。这一技术展示了人机交互的新方式,使机器人能更灵活地响应人类指令。AI产品宇树科技G1机器人语音控制实时动作生成人机交互推荐理由:宇树G1的语音实时动作生成让机器人交互更自然,做机器人开发或人机交互研究的团队值得关注这一进展。原文
15:14AI Will@FinanceYF5Mira Murati指出当前AI模型在思考时无法感知新信息,如同聋哑状态,而人类交流中的沉默、打断、同时说话都是重要信息。她提出真正的人机协作需要“时间型交互”——AI持续接收音频、文字、视频并持续输出,而非轮流说话。这一观点揭示了当前AI交互模式的根本缺陷,为下一代人机协作设计提供了方向。AI产品人机交互时间型交互Mira MuratiAI思考协作模式推荐理由:Mira Murati点破了当前AI交互的致命短板——思考时无法感知新信息,做对话系统或人机协作产品的团队值得反思自己的设计。原文
01:54lmarena.ai@lmarena_aiAgent Arena 发布技术博客,详细介绍了其方法论,并深入分析了人类如何委托、纠正和引导智能体。该研究揭示了人机协作中的关键交互模式,为构建更可靠的智能体系统提供了实证基础。博客内容对智能体开发者、人机交互研究者以及关注 AI 安全与可控性的团队具有重要参考价值。AI产品智能体人机交互方法论Agent ArenaAI 安全推荐理由:做智能体产品的团队值得一读——它揭示了人类在实际使用中如何与智能体互动,这些模式直接影响产品设计和用户体验。原文
16:51向阳乔木@vista8Laten Space 访谈了 Ethan He,分享了一系列关于 AI 模型训练与交互的深刻观点。他指出模型进步速度取决于团队迭代速度,质量提升更多来自修数据和训练流程中的 bug 而非新算法。视频模型训练需要极其详细的文本标注,GPT Image 生成图片时大部分时间在思考重写提示词。他还认为扩散模型将成为人机交互的前端层,在脑机接口普及前,最自然的交互方式是用户说话、AI 用生成式画面回应。行业模型训练迭代速度GPT Image扩散模型人机交互推荐理由:Ethan He 把模型训练和交互设计的底层逻辑讲透了,做模型训练或产品设计的开发者看完会有启发,特别是关于迭代速度和交互未来的观点值得反复琢磨。原文
09:27宝玉@dotey本文讨论了未来AI Agent作为统一入口的趋势,认为用户将倾向于通过一个超级助理(类似贾维斯)完成所有任务,而非打开多个App。例如,订机票时用户只需向Agent提出要求并确认结果,无需手动操作订票App。这一观点强调了Agent作为用户与数字服务交互的核心界面,可能改变现有App生态。AI产品智能体AI入口超级助理人机交互未来趋势推荐理由:对产品经理和AI创业者来说,这指出了下一代人机交互的范式转变——Agent取代App成为新入口,值得思考如何布局。原文
06:16rohanpaul_ai@rohanpaul_ai精选MIT、斯坦福、纽约大学和普林斯顿联合发表论文,发现人们在使用AI时会产生“效率增益错觉”——即使实际效率提升很小甚至为负,仍感觉AI节省了大量时间。在2691名参与者的三项预注册实验中,人们高估了AI对简单任务(如算术、拼写、回忆、短改写)的节省时间,平均预期节省55.7秒,实际仅7.5秒。研究指出,AI使用的隐性成本在于界面摩擦(写提示、等待、检查等),而非智能不足。更关键的是,AI使用会自我强化:仅使用两次后,参与者就更倾向于再次使用AI,即使自己完成更快。这种依赖并非戏剧性的,而是悄无声息地重新校准了人们对自身能力的判断。论文效率错觉AI依赖人机交互认知偏差MIT推荐理由:这篇论文戳破了AI“效率神话”的泡沫——你以为省了1分钟,实际只省了7秒,做AI产品、写提示词、或者日常依赖AI的开发者,看完会重新审视自己的使用习惯。原文
14:13小互@imxiaohuGPT-Realtime 2.0 展示了通过实时语音直接操控电脑的能力,用户无需动手即可完成操作。该演示被网友称为“真正的Siri”,并引发了对背后技术(如是否接入Codex)的讨论。这一进展意味着语音交互从简单的问答升级为真正的电脑控制,可能改变操作系统的人机交互方式。目前该功能仍处于演示阶段,但已引起广泛关注。AI产品GPT-Realtime 2.0语音交互电脑操控实时AI人机交互1 个信源在谈推荐理由:实时语音操控电脑解决了传统语音助手只能做简单任务的痛点,做AI交互或桌面自动化的开发者值得关注这个方向。原文
18:49歸藏(guizang.ai)@op7418Ryo Lu 提出一个比喻:Agent 就像 3D 打印机,Token 是虚拟世界的 PLA 材料,通用但打印结果各异。他认为 AI 正在打破传统软件的“房间”式界面,让软件从固定功能的容器变成可塑、可组合、可追问的材料。用户不再需要在不同应用间切换,而是通过表达意图来塑造工具,界面从菜单变成黏土。这一转变让软件成为任何人都能塑造的媒介,而不仅仅是程序员的专利。行业智能体人机交互软件范式界面设计AI 产品推荐理由:这个比喻把 AI Agent 的本质讲透了——做产品、设计界面或研究人机交互的人,看完会对软件的未来形态有全新理解,值得点开细品。原文
08:00The Rundown AI@therundownai93°在 Google I/O 大会上,Demis Hassabis 正式介绍了 Gemini Omni,一个号称“能从任何输入创建任何输出”的新型 AI 模型。该模型支持文本、图像、音频、视频等多种模态的输入与生成,旨在实现真正的多模态理解和创作。这一发布标志着 Google 在通用 AI 能力上的重要一步,可能重塑内容创作、人机交互等领域的范式。目前具体技术细节和上线时间尚未公布,但已引发行业广泛关注。AI模型Gemini Omni多模态模型Google I/OAI 创作人机交互推荐理由:Gemini Omni 把多模态 AI 的边界推到了“任意输入→任意输出”,做内容创作、产品设计或人机交互的团队值得关注——这可能是下一代 AI 应用的基础设施。原文
07:59Lilian Weng@lilianwengOpenAI 研究科学家 Lilian Weng 在 X 上呼吁加强人机交互领域的合作与研究,并转发了 Thinking Machines 的资助计划。该计划为推进人机交互的研究人员提供 10 万美元资助及 Tinker 积分,申请截止日期为 6 月 19 日。此举旨在推动 AI 与人类更自然、高效的互动方式,对交互设计、AI 产品开发者及学术研究者具有直接意义。行业人机交互资助/基金Lilian WengThinking Machines研究合作10 个信源在谈推荐理由:人机交互是 AI 落地的关键瓶颈,10 万美元资助直接降低了研究门槛,做交互设计或 AI 产品的团队值得关注申请窗口。原文
05:31Ethan Mollick@emollick一篇发表在PNAS上的论文发现,经典的人类说服技巧对AI模型同样有效,能以“类人”方式让AI同意不合理请求,合规率从35%提升至51%。研究测试了多个主流大语言模型,发现较新模型对此类技巧的抵抗力更强。该研究揭示了AI在交互中可能被操纵的风险,对AI安全和人机交互设计具有重要启示。论文AI安全人机交互说服技巧PNAS大语言模型推荐理由:做AI安全和人机交互的团队值得关注——这项研究揭示了人类说服技巧对AI的意外影响,提醒我们在设计对话系统时需防范操纵风险。原文
19:09Google DeepMind@GoogleDeepMindGoogle DeepMind 正在用 AI 重新设计鼠标指针这一经典界面,通过结合运动、语音和自然简写,让用户更直观地指挥 Gemini 完成屏幕操作。实验性演示展示了如何通过手势、说话或简单指令直接与 AI 交互,从而提升操作效率。这一创新有望改变人机交互方式,让计算机更智能地理解用户意图。AI产品人机交互GeminiGoogle DeepMindAI 助手界面创新推荐理由:鼠标指针 50 年没变过,DeepMind 这次用 AI 把它变成了智能助手——做交互设计或产品经理的值得关注,看完会重新思考「点击」这件事。原文
15:51Demis Hassabis@demishassabisGoogle 团队展示了一项创新工作,将传统鼠标指针改造为具备智能的交互工具。该原型已在 Google AI Studio 中提供试用,用户可以直接体验这种“魔法般”的交互方式。这项技术可能改变人机交互的基本范式,让鼠标不再只是被动点击工具,而是能主动理解用户意图。目前尚不清楚具体实现细节,但演示效果令人印象深刻。AI产品智能交互鼠标指针Google AI Studio人机交互原型推荐理由:鼠标指针变智能,这是人机交互的一次有趣尝试,做 UI/UX 或交互设计的开发者值得点开看看,直接在 Google AI Studio 就能试。原文