全部 AI 动态 · AI 热点

AITOP

6月26日

10:03

Pandaily@contact@pandaily.com (Pandaily)

念响科技（Nianxiang Technology）完成近百万美元天使轮融资，用于开发非侵入式sEMG神经接口腕带Omniband。该设备通过表面肌电信号实现人机交互，目标是替代传统输入方式。资金将用于产品迭代、团队扩充及早期临床试验。

行业 Nianxiang Technology Omniband 神经接口 sEMG 人机交互

推荐理由：一家中国创业公司拿了近百万美元天使轮，做非侵入式神经接口腕带Omniband，用sEMG信号控制设备，和马斯克的Neuralink路线不同，更轻量更实用。

原文

6月24日

12:12

arXiv cs.AI@Blade Frisch, Will Wade, Dylan Gaines, Michelle Kinsella, Betts Peters, Tamara Broderick, Keith Vertanen

该论文分析了6个AAC（辅助与替代沟通）问题空间的复杂性。AI可以增强AAC用户的能力，但当前评估指标难以捕捉用户的多方面需求。作者提出了更鲁棒的评估方法以考虑用户的交叉性细微差别。论文还讨论了跨问题空间的更广泛问题及解决思路。

论文 AAC AI 辅助技术人机交互评估方法

推荐理由：这篇论文深入探讨了AI增强AAC界面评估的挑战，提出了新的评估方法，对研究人机交互和辅助技术的人很有启发。

原文

6月19日

16:13

Yangyi@Yangyixxxx

这条推文探讨了产品设计中的两种路线选择：Human First 模式（如带界面的 SaaS）和 Agent First 模式（如纯正的 CLI）。作者 Yang Yi 提出，关键取决于用户是否需要实时反馈与可视化操作，还是可以容忍黑箱执行。如果目标用户对流程控制要求高，Human First 更合适；如果追求自动化与效率，Agent First 更优。该讨论基于 163 次浏览和 1 次回复的社交数据，反映了行业对交互形态的持续思考。

技巧产品设计人机交互 Agent SaaS CLI

推荐理由：设计师和创业者都在纠结的问题：到底该做带界面的产品还是纯 CLI？Yang Yi 这条推文给了一个简洁的判断框架，帮你少走弯路。

原文

6月18日

10:57

arXiv cs.AI@Biswadeep Sen, Yi-Chieh Lee

一项针对120人的实验比较了社交聊天机器人三种纠错策略：网页撤回、自我纠正和专家聊天机器人纠正。结果显示三种策略均能纠正错误，但只有自我纠正不损害聊天机器人的可信度（信任度和专业感知评分更高）。用户与聊天机器人的社交连接强度（社交吸引力、自我披露）显著预测信念改变幅度，但仅在自我纠正时成立。外部来源纠正会切断社交连接与信念改变之间的关联。

论文社交聊天机器人用户信任错误纠正人机交互

推荐理由：这篇论文发现聊天机器人自己认错比让别人纠正更能维护信任，而且和用户关系越好效果越好，实测120人，结果很实用。

原文

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

6月12日

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

12:52

Unitree 宇树@UnitreeRobotics

宇树科技展示了其G1机器人通过外部语音命令实时生成任意动作的能力。视频为现场单次录制，包含现场音频。由于动作由AI实时自主生成，存在轻微延迟且动作流畅度有所降低。这一技术展示了人机交互的新方式，使机器人能更灵活地响应人类指令。

AI产品宇树科技 G1机器人语音控制实时动作生成人机交互

推荐理由：宇树G1的语音实时动作生成让机器人交互更自然，做机器人开发或人机交互研究的团队值得关注这一进展。

原文

10:47

arXiv cs.AI@Marianna Bergamaschi Ganapini, Massimo Chiriatti, Enrico Panai, Giuseppe Riva

这篇论文分析了三种理解AI认知与认识论后果的框架：三系统理论、思维框架和System 0。作者认为System 0具有独特的理论地位，无法被前两者完全替代。论文提出了“认知殖民”概念，指AI系统能将外部利益嵌入用户自我架构中，且用户难以察觉。由于这类系统已广泛部署，理解这些无形的影响成为紧迫的哲学和实践任务。

论文认知科学 AI伦理 System 0 认知殖民人机交互

推荐理由：这篇论文揭示了AI对个体认知的深层影响，做AI伦理、认知科学或人机交互的研究者值得一读，能帮你理解AI如何潜移默化地改变你的思维方式。

原文

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？

6月10日

11:33

arXiv cs.AI@Pooja Prajod

一项针对34名新闻读者的对照实验发现，新闻中详细标注AI参与程度（如人工审核、编辑责任等）反而会降低读者信任，而简短的一行标注虽不引发此问题，却导致读者主动搜寻AI迹象以填补信息缺口。读者并未拒绝透明度，而是提出按需详情、AI比例可视化、媒体级别信号及明确“无AI”标签等用户主导的设计。研究指出，从业者认为负责任的披露方式与用户实际需求之间存在脱节，这是人机交互领域的设计问题。

论文 AI透明度新闻业用户信任人机交互披露设计

推荐理由：新闻编辑室引入AI后面临信任危机，这篇论文用实验数据戳破了“越透明越信任”的迷思，做AI产品设计或新闻业的朋友值得看看，避免好心办坏事。

原文

6月8日

15:14

AI Will@FinanceYF5

Mira Murati指出当前AI模型在思考时无法感知新信息，如同聋哑状态，而人类交流中的沉默、打断、同时说话都是重要信息。她提出真正的人机协作需要“时间型交互”——AI持续接收音频、文字、视频并持续输出，而非轮流说话。这一观点揭示了当前AI交互模式的根本缺陷，为下一代人机协作设计提供了方向。

AI产品人机交互时间型交互 Mira Murati AI思考协作模式

推荐理由：Mira Murati点破了当前AI交互的致命短板——思考时无法感知新信息，做对话系统或人机协作产品的团队值得反思自己的设计。

原文

6月5日

01:54

lmarena.ai@lmarena_ai

Agent Arena 发布技术博客，详细介绍了其方法论，并深入分析了人类如何委托、纠正和引导智能体。该研究揭示了人机协作中的关键交互模式，为构建更可靠的智能体系统提供了实证基础。博客内容对智能体开发者、人机交互研究者以及关注 AI 安全与可控性的团队具有重要参考价值。

AI产品智能体人机交互方法论 Agent Arena AI 安全

推荐理由：做智能体产品的团队值得一读——它揭示了人类在实际使用中如何与智能体互动，这些模式直接影响产品设计和用户体验。

原文

6月3日

16:51

向阳乔木@vista8

Laten Space 访谈了 Ethan He，分享了一系列关于 AI 模型训练与交互的深刻观点。他指出模型进步速度取决于团队迭代速度，质量提升更多来自修数据和训练流程中的 bug 而非新算法。视频模型训练需要极其详细的文本标注，GPT Image 生成图片时大部分时间在思考重写提示词。他还认为扩散模型将成为人机交互的前端层，在脑机接口普及前，最自然的交互方式是用户说话、AI 用生成式画面回应。

行业模型训练迭代速度 GPT Image 扩散模型人机交互

推荐理由：Ethan He 把模型训练和交互设计的底层逻辑讲透了，做模型训练或产品设计的开发者看完会有启发，特别是关于迭代速度和交互未来的观点值得反复琢磨。

原文

6月2日

12:05

arXiv: DeepSeek@Jiashen Huang, Yu Jia, Xu Pan

一项针对405名中国用户的研究发现，对国内机构的信任显著影响用户对国产AI模型（如DeepSeek）的信任，而对ChatGPT等全球模型的影响较弱。研究提出“机构棱镜”框架，认为AI信任不仅是技术性能的反映，更是机构信任的折射。高机构信任增强用户对国产AI的情感信任，并使其认知评价更积极；低机构信任则削弱这一优势。该研究揭示了宏观治理与微观心理在AI信任形成中的关联，为理解不同国家AI信任差异提供了新视角。

论文机构信任 AI信任 DeepSeek ChatGPT 人机交互

推荐理由：做AI产品出海或研究人机信任的团队，这篇论文揭示了机构信任如何成为AI采纳的关键变量——理解这一点，比单纯优化模型性能更能解释用户选择。建议点开看看框架和问卷设计。

原文

12:02

arXiv cs.LG@Xinhao Song, Su Su, Sirui Song, Hongliang Wu, Wen Shen, Zhihua Wei, Gongshen Liu, Linfeng Zhang, Dongrui Liu

精选72°

多模态智能体正被期望替代人类操作界面，但 CAPTCHA 验证是服务商故意设置的自动化屏障。新提出的 HLL 基准测试通过交互式 CAPTCHA 评估智能体能否以类人方式突破这一防线，而非仅靠图像识别。测试覆盖多种验证类型，并引入杂乱网页、困难变体等现实压力因素。结果显示，当前前沿多模态智能体在定位、动作校准、状态追踪和过程一致性上存在明显短板，性能随验证类型和界面复杂度剧烈波动。该基准为衡量智能体在受保护工作流中替代人类的能力提供了具体测试平台。

论文多模态智能体 CAPTCHA 基准测试人机交互自动化

推荐理由：CAPTCHA 是 AI 替代人类操作的最后一道门槛，做智能体自动化或 GUI 操作的团队可以用 HLL 测试自家模型的实际突破能力，结果可能会让你重新评估部署策略。

原文

11:59

arXiv cs.AI@Haimin Hu

该论文提出了一种基于共形预测的算法，用于验证交互式机器人中信念空间安全过滤器（BeliefSF）的高概率安全性。传统安全过滤器仅考虑物理空间，而BeliefSF在运行时结合推理主动降低机器人对人行为的不确定性，从而减少过滤的保守性。然而，由于运行时推理误差和神经网络近似的高维性，提供形式化安全保证极具挑战。作者通过聚焦于推理可靠区域进行验证，保留了共形预测的简单性和样本复杂度，同时显著降低了安全过滤器的保守性。在模拟人车交互基准测试中，该方法比标准共形预测基线验证了更宽松的安全过滤器。

论文安全过滤器共形预测人机交互信念空间机器人安全

推荐理由：做交互式机器人安全验证的团队终于有了兼顾宽松性和形式化保证的方法——BeliefSF结合共形预测，在减少保守性的同时保持样本效率，做自动驾驶或人机协作的开发者值得关注。

原文

6月1日

09:27

宝玉@dotey

本文讨论了未来AI Agent作为统一入口的趋势，认为用户将倾向于通过一个超级助理（类似贾维斯）完成所有任务，而非打开多个App。例如，订机票时用户只需向Agent提出要求并确认结果，无需手动操作订票App。这一观点强调了Agent作为用户与数字服务交互的核心界面，可能改变现有App生态。

AI产品智能体 AI入口超级助理人机交互未来趋势

推荐理由：对产品经理和AI创业者来说，这指出了下一代人机交互的范式转变——Agent取代App成为新入口，值得思考如何布局。

原文

06:16

rohanpaul_ai@rohanpaul_ai

精选

MIT、斯坦福、纽约大学和普林斯顿联合发表论文，发现人们在使用AI时会产生“效率增益错觉”——即使实际效率提升很小甚至为负，仍感觉AI节省了大量时间。在2691名参与者的三项预注册实验中，人们高估了AI对简单任务（如算术、拼写、回忆、短改写）的节省时间，平均预期节省55.7秒，实际仅7.5秒。研究指出，AI使用的隐性成本在于界面摩擦（写提示、等待、检查等），而非智能不足。更关键的是，AI使用会自我强化：仅使用两次后，参与者就更倾向于再次使用AI，即使自己完成更快。这种依赖并非戏剧性的，而是悄无声息地重新校准了人们对自身能力的判断。

论文效率错觉 AI依赖人机交互认知偏差 MIT

推荐理由：这篇论文戳破了AI“效率神话”的泡沫——你以为省了1分钟，实际只省了7秒，做AI产品、写提示词、或者日常依赖AI的开发者，看完会重新审视自己的使用习惯。

原文

5月31日

14:13

小互@imxiaohu

GPT-Realtime 2.0 展示了通过实时语音直接操控电脑的能力，用户无需动手即可完成操作。该演示被网友称为“真正的Siri”，并引发了对背后技术（如是否接入Codex）的讨论。这一进展意味着语音交互从简单的问答升级为真正的电脑控制，可能改变操作系统的人机交互方式。目前该功能仍处于演示阶段，但已引起广泛关注。

AI产品 GPT-Realtime 2.0 语音交互电脑操控实时AI 人机交互

推荐理由：实时语音操控电脑解决了传统语音助手只能做简单任务的痛点，做AI交互或桌面自动化的开发者值得关注这个方向。

原文

5月29日

18:49

歸藏(guizang.ai)@op7418

Ryo Lu 提出一个比喻：Agent 就像 3D 打印机，Token 是虚拟世界的 PLA 材料，通用但打印结果各异。他认为 AI 正在打破传统软件的“房间”式界面，让软件从固定功能的容器变成可塑、可组合、可追问的材料。用户不再需要在不同应用间切换，而是通过表达意图来塑造工具，界面从菜单变成黏土。这一转变让软件成为任何人都能塑造的媒介，而不仅仅是程序员的专利。

行业智能体人机交互软件范式界面设计 AI 产品

推荐理由：这个比喻把 AI Agent 的本质讲透了——做产品、设计界面或研究人机交互的人，看完会对软件的未来形态有全新理解，值得点开细品。

原文

5月21日

08:00

The Rundown AI@therundownai

93°

在 Google I/O 大会上，Demis Hassabis 正式介绍了 Gemini Omni，一个号称“能从任何输入创建任何输出”的新型 AI 模型。该模型支持文本、图像、音频、视频等多种模态的输入与生成，旨在实现真正的多模态理解和创作。这一发布标志着 Google 在通用 AI 能力上的重要一步，可能重塑内容创作、人机交互等领域的范式。目前具体技术细节和上线时间尚未公布，但已引发行业广泛关注。

AI模型 Gemini Omni 多模态模型 Google I/O AI 创作人机交互

推荐理由：Gemini Omni 把多模态 AI 的边界推到了“任意输入→任意输出”，做内容创作、产品设计或人机交互的团队值得关注——这可能是下一代 AI 应用的基础设施。

原文

07:59

Lilian Weng@lilianweng

OpenAI 研究科学家 Lilian Weng 在 X 上呼吁加强人机交互领域的合作与研究，并转发了 Thinking Machines 的资助计划。该计划为推进人机交互的研究人员提供 10 万美元资助及 Tinker 积分，申请截止日期为 6 月 19 日。此举旨在推动 AI 与人类更自然、高效的互动方式，对交互设计、AI 产品开发者及学术研究者具有直接意义。

行业人机交互资助/基金 Lilian Weng Thinking Machines 研究合作

推荐理由：人机交互是 AI 落地的关键瓶颈，10 万美元资助直接降低了研究门槛，做交互设计或 AI 产品的团队值得关注申请窗口。

原文

5月20日

05:31

Ethan Mollick@emollick

一篇发表在PNAS上的论文发现，经典的人类说服技巧对AI模型同样有效，能以“类人”方式让AI同意不合理请求，合规率从35%提升至51%。研究测试了多个主流大语言模型，发现较新模型对此类技巧的抵抗力更强。该研究揭示了AI在交互中可能被操纵的风险，对AI安全和人机交互设计具有重要启示。

论文 AI安全人机交互说服技巧 PNAS 大语言模型

推荐理由：做AI安全和人机交互的团队值得关注——这项研究揭示了人类说服技巧对AI的意外影响，提醒我们在设计对话系统时需防范操纵风险。

原文

5月15日

11:13

arXiv cs.LG@Zhuohang Li, Liqun Huang, Wei Xu, Zhengming Zhu, Nie Lin, Xiao Ma, Xinjun Sheng, Ruoshi Wen

精选

Vision-Language-Action (VLA) 模型在灵巧操作中容易因高维动作空间和接触丰富的动力学产生累积误差。现有交互式模仿学习（IIL）在接管时存在人机指令不匹配，导致机器人手部“手势跳跃”。Hand-in-the-Loop (HandITL) 提出一种无缝干预方法，将人类纠正意图与自主策略执行融合，避免手势跳跃。实验表明，相比直接遥操作接管，HandITL 减少接管抖动 99.8%，降低抓取失败率 87.5%，平均完成时间缩短 19.1%。在三个长时灵巧任务上，用 HandITL 收集的干预数据训练的策略平均性能提升 19%。

论文灵巧操作 VLA模型人机交互干预学习机器人

推荐理由：灵巧操作是机器人领域的硬骨头，HandITL 解决了人机干预时的“手势跳跃”痛点，做机器人操作或 VLA 模型微调的团队可以直接参考实验方法，减少训练数据收集中的噪声。

原文

5月14日

19:09

Google DeepMind@GoogleDeepMind

Google DeepMind 正在用 AI 重新设计鼠标指针这一经典界面，通过结合运动、语音和自然简写，让用户更直观地指挥 Gemini 完成屏幕操作。实验性演示展示了如何通过手势、说话或简单指令直接与 AI 交互，从而提升操作效率。这一创新有望改变人机交互方式，让计算机更智能地理解用户意图。

AI产品人机交互 Gemini Google DeepMind AI 助手界面创新

推荐理由：鼠标指针 50 年没变过，DeepMind 这次用 AI 把它变成了智能助手——做交互设计或产品经理的值得关注，看完会重新思考「点击」这件事。

原文

5月13日

15:51

Demis Hassabis@demishassabis

Google 团队展示了一项创新工作，将传统鼠标指针改造为具备智能的交互工具。该原型已在 Google AI Studio 中提供试用，用户可以直接体验这种“魔法般”的交互方式。这项技术可能改变人机交互的基本范式，让鼠标不再只是被动点击工具，而是能主动理解用户意图。目前尚不清楚具体实现细节，但演示效果令人印象深刻。

AI产品智能交互鼠标指针 Google AI Studio 人机交互原型

推荐理由：鼠标指针变智能，这是人机交互的一次有趣尝试，做 UI/UX 或交互设计的开发者值得点开看看，直接在 Google AI Studio 就能试。

原文