全部 AI 动态 · AI 热点

6月19日

16:13

16:13

Yangyi@Yangyixxxx

这条推文探讨了产品设计中的两种路线选择：Human First 模式（如带界面的 SaaS）和 Agent First 模式（如纯正的 CLI）。作者 Yang Yi 提出，关键取决于用户是否需要实时反馈与可视化操作，还是可以容忍黑箱执行。如果目标用户对流程控制要求高，Human First 更合适；如果追求自动化与效率，Agent First 更优。该讨论基于 163 次浏览和 1 次回复的社交数据，反映了行业对交互形态的持续思考。

技巧产品设计人机交互 Agent SaaS CLI

推荐理由：设计师和创业者都在纠结的问题：到底该做带界面的产品还是纯 CLI？Yang Yi 这条推文给了一个简洁的判断框架，帮你少走弯路。

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

6月12日

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

12:52

12:52

Unitree 宇树@UnitreeRobotics

宇树科技展示了其G1机器人通过外部语音命令实时生成任意动作的能力。视频为现场单次录制，包含现场音频。由于动作由AI实时自主生成，存在轻微延迟且动作流畅度有所降低。这一技术展示了人机交互的新方式，使机器人能更灵活地响应人类指令。

AI产品宇树科技 G1机器人语音控制实时动作生成人机交互

推荐理由：宇树G1的语音实时动作生成让机器人交互更自然，做机器人开发或人机交互研究的团队值得关注这一进展。

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？

6月8日

15:14

15:14

AI Will@FinanceYF5

Mira Murati指出当前AI模型在思考时无法感知新信息，如同聋哑状态，而人类交流中的沉默、打断、同时说话都是重要信息。她提出真正的人机协作需要“时间型交互”——AI持续接收音频、文字、视频并持续输出，而非轮流说话。这一观点揭示了当前AI交互模式的根本缺陷，为下一代人机协作设计提供了方向。

AI产品人机交互时间型交互 Mira Murati AI思考协作模式

推荐理由：Mira Murati点破了当前AI交互的致命短板——思考时无法感知新信息，做对话系统或人机协作产品的团队值得反思自己的设计。

6月5日

01:54

01:54

lmarena.ai@lmarena_ai

Agent Arena 发布技术博客，详细介绍了其方法论，并深入分析了人类如何委托、纠正和引导智能体。该研究揭示了人机协作中的关键交互模式，为构建更可靠的智能体系统提供了实证基础。博客内容对智能体开发者、人机交互研究者以及关注 AI 安全与可控性的团队具有重要参考价值。

AI产品智能体人机交互方法论 Agent Arena AI 安全

推荐理由：做智能体产品的团队值得一读——它揭示了人类在实际使用中如何与智能体互动，这些模式直接影响产品设计和用户体验。

6月3日

16:51

16:51

向阳乔木@vista8

Laten Space 访谈了 Ethan He，分享了一系列关于 AI 模型训练与交互的深刻观点。他指出模型进步速度取决于团队迭代速度，质量提升更多来自修数据和训练流程中的 bug 而非新算法。视频模型训练需要极其详细的文本标注，GPT Image 生成图片时大部分时间在思考重写提示词。他还认为扩散模型将成为人机交互的前端层，在脑机接口普及前，最自然的交互方式是用户说话、AI 用生成式画面回应。

行业模型训练迭代速度 GPT Image 扩散模型人机交互

推荐理由：Ethan He 把模型训练和交互设计的底层逻辑讲透了，做模型训练或产品设计的开发者看完会有启发，特别是关于迭代速度和交互未来的观点值得反复琢磨。

6月1日

09:27

09:27

宝玉@dotey

本文讨论了未来AI Agent作为统一入口的趋势，认为用户将倾向于通过一个超级助理（类似贾维斯）完成所有任务，而非打开多个App。例如，订机票时用户只需向Agent提出要求并确认结果，无需手动操作订票App。这一观点强调了Agent作为用户与数字服务交互的核心界面，可能改变现有App生态。

AI产品智能体 AI入口超级助理人机交互未来趋势

推荐理由：对产品经理和AI创业者来说，这指出了下一代人机交互的范式转变——Agent取代App成为新入口，值得思考如何布局。

06:16

06:16

rohanpaul_ai@rohanpaul_ai

精选

MIT、斯坦福、纽约大学和普林斯顿联合发表论文，发现人们在使用AI时会产生“效率增益错觉”——即使实际效率提升很小甚至为负，仍感觉AI节省了大量时间。在2691名参与者的三项预注册实验中，人们高估了AI对简单任务（如算术、拼写、回忆、短改写）的节省时间，平均预期节省55.7秒，实际仅7.5秒。研究指出，AI使用的隐性成本在于界面摩擦（写提示、等待、检查等），而非智能不足。更关键的是，AI使用会自我强化：仅使用两次后，参与者就更倾向于再次使用AI，即使自己完成更快。这种依赖并非戏剧性的，而是悄无声息地重新校准了人们对自身能力的判断。

论文效率错觉 AI依赖人机交互认知偏差 MIT

推荐理由：这篇论文戳破了AI“效率神话”的泡沫——你以为省了1分钟，实际只省了7秒，做AI产品、写提示词、或者日常依赖AI的开发者，看完会重新审视自己的使用习惯。

5月31日

14:13

14:13

小互@imxiaohu

GPT-Realtime 2.0 展示了通过实时语音直接操控电脑的能力，用户无需动手即可完成操作。该演示被网友称为“真正的Siri”，并引发了对背后技术（如是否接入Codex）的讨论。这一进展意味着语音交互从简单的问答升级为真正的电脑控制，可能改变操作系统的人机交互方式。目前该功能仍处于演示阶段，但已引起广泛关注。

AI产品 GPT-Realtime 2.0 语音交互电脑操控实时AI 人机交互

推荐理由：实时语音操控电脑解决了传统语音助手只能做简单任务的痛点，做AI交互或桌面自动化的开发者值得关注这个方向。

5月29日

18:49

18:49

歸藏(guizang.ai)@op7418

Ryo Lu 提出一个比喻：Agent 就像 3D 打印机，Token 是虚拟世界的 PLA 材料，通用但打印结果各异。他认为 AI 正在打破传统软件的“房间”式界面，让软件从固定功能的容器变成可塑、可组合、可追问的材料。用户不再需要在不同应用间切换，而是通过表达意图来塑造工具，界面从菜单变成黏土。这一转变让软件成为任何人都能塑造的媒介，而不仅仅是程序员的专利。

行业智能体人机交互软件范式界面设计 AI 产品

推荐理由：这个比喻把 AI Agent 的本质讲透了——做产品、设计界面或研究人机交互的人，看完会对软件的未来形态有全新理解，值得点开细品。

5月21日

08:00

08:00

The Rundown AI@therundownai

93°

在 Google I/O 大会上，Demis Hassabis 正式介绍了 Gemini Omni，一个号称“能从任何输入创建任何输出”的新型 AI 模型。该模型支持文本、图像、音频、视频等多种模态的输入与生成，旨在实现真正的多模态理解和创作。这一发布标志着 Google 在通用 AI 能力上的重要一步，可能重塑内容创作、人机交互等领域的范式。目前具体技术细节和上线时间尚未公布，但已引发行业广泛关注。

AI模型 Gemini Omni 多模态模型 Google I/O AI 创作人机交互

推荐理由：Gemini Omni 把多模态 AI 的边界推到了“任意输入→任意输出”，做内容创作、产品设计或人机交互的团队值得关注——这可能是下一代 AI 应用的基础设施。

07:59

07:59

Lilian Weng@lilianweng

OpenAI 研究科学家 Lilian Weng 在 X 上呼吁加强人机交互领域的合作与研究，并转发了 Thinking Machines 的资助计划。该计划为推进人机交互的研究人员提供 10 万美元资助及 Tinker 积分，申请截止日期为 6 月 19 日。此举旨在推动 AI 与人类更自然、高效的互动方式，对交互设计、AI 产品开发者及学术研究者具有直接意义。

行业人机交互资助/基金 Lilian Weng Thinking Machines 研究合作

推荐理由：人机交互是 AI 落地的关键瓶颈，10 万美元资助直接降低了研究门槛，做交互设计或 AI 产品的团队值得关注申请窗口。

5月20日

05:31

05:31

Ethan Mollick@emollick

一篇发表在PNAS上的论文发现，经典的人类说服技巧对AI模型同样有效，能以“类人”方式让AI同意不合理请求，合规率从35%提升至51%。研究测试了多个主流大语言模型，发现较新模型对此类技巧的抵抗力更强。该研究揭示了AI在交互中可能被操纵的风险，对AI安全和人机交互设计具有重要启示。

论文 AI安全人机交互说服技巧 PNAS 大语言模型

推荐理由：做AI安全和人机交互的团队值得关注——这项研究揭示了人类说服技巧对AI的意外影响，提醒我们在设计对话系统时需防范操纵风险。

5月14日

19:09

19:09

Google DeepMind@GoogleDeepMind

Google DeepMind 正在用 AI 重新设计鼠标指针这一经典界面，通过结合运动、语音和自然简写，让用户更直观地指挥 Gemini 完成屏幕操作。实验性演示展示了如何通过手势、说话或简单指令直接与 AI 交互，从而提升操作效率。这一创新有望改变人机交互方式，让计算机更智能地理解用户意图。

AI产品人机交互 Gemini Google DeepMind AI 助手界面创新

推荐理由：鼠标指针 50 年没变过，DeepMind 这次用 AI 把它变成了智能助手——做交互设计或产品经理的值得关注，看完会重新思考「点击」这件事。

5月13日

15:51

15:51

Demis Hassabis@demishassabis

Google 团队展示了一项创新工作，将传统鼠标指针改造为具备智能的交互工具。该原型已在 Google AI Studio 中提供试用，用户可以直接体验这种“魔法般”的交互方式。这项技术可能改变人机交互的基本范式，让鼠标不再只是被动点击工具，而是能主动理解用户意图。目前尚不清楚具体实现细节，但演示效果令人印象深刻。

AI产品智能交互鼠标指针 Google AI Studio 人机交互原型

推荐理由：鼠标指针变智能，这是人机交互的一次有趣尝试，做 UI/UX 或交互设计的开发者值得点开看看，直接在 Google AI Studio 就能试。