全部 AI 动态 · AI 热点

5月20日

03:02

03:02IT之家（博客/媒体）

72°

在 2026 年谷歌 I/O 大会上，谷歌宣布升级 AI 创意平台 Google Flow，整合 Gemini Omni Flash 模型，提升视频编辑的精细度和角色一致性。同时推出 Google Flow Agent，作为智能伙伴辅助头脑风暴、内容生成和后期修改。新增 Flow Tools 支持自然语言定制工作流和工具分享，Flow Music 则提供更细粒度的分段编辑和重制功能。这些更新已向全球用户开放，旨在降低创作门槛并增强协作效率。

AI产品 AI 创意平台视频编辑智能体 Gemini Omni Flash 协作工具

推荐理由：视频创作者和内容团队终于有了一个能保持角色一致性的 AI 工具，Flow Agent 还能帮你头脑风暴剧情——做短视频或电影制作的人可以直接上手试试。

原文

02:54

02:54IT之家（博客/媒体）

谷歌在 2026 I/O 大会上宣布，将通用世界模型 Project Genie 与街景服务结合，基于真实街景图像生成可互动、可探索的 3D 虚拟世界。用户可指定地点、风格（如“石器时代”）和角色，系统据此创建沉浸式环境。该能力目前仅支持美国地点，仍为实验性原型，主要用于 AI 智能体和机器人训练。谷歌计划未来扩展至更多地区，但未给出时间表。

AI产品谷歌 Genie 世界模型街景 AI 训练

推荐理由：Genie 街景版让 AI 训练和虚拟内容创作有了真实世界基础，做机器人导航或游戏场景生成的团队可以直接用这个原型来测试想法。

原文

02:26

02:26IT之家（博客/媒体）

88°

谷歌在2026 I/O大会上发布两大AI电商协议UCP和AP2，并推出Universal Cart通用购物车功能。UCP是开源协议，为智能体提供通用语言，类似HTTP对万维网的作用，已获亚马逊、Meta、微软等支持。AP2是智能体支付协议，可设置消费上限和支付验证。Universal Cart将于今夏在谷歌搜索、Gemini、YouTube、Gmail中推出，支持跨平台加购、追踪优惠、历史价格查询和补货提醒，还能智能推理用户选购，如检测CPU与主板不兼容并推荐替代品。这标志着AI电商从单点功能走向标准化生态，用户购物体验将更智能、更连贯。

AI产品智能体电商协议通用购物车谷歌开源/仓库

推荐理由：谷歌联合巨头定义AI电商标准，做电商或智能体开发的团队值得关注——UCP协议可能成为行业基础设施，通用购物车功能直接改变用户购物习惯。

原文

02:24

02:24IT之家（博客/媒体）

在 2026 谷歌 I/O 大会上，谷歌宣布升级 Google Workspace，将 Gmail、Docs、Keep 等工具转变为可语音对话的协作助手。新功能包括 Gmail Live（自然语音检索邮件）、Docs Live（口述起草与格式整理）和 Keep 更新（自动整理想法）。用户无需点击和输入，可直接用语音查询邮件、起草文档和整理笔记，旨在将办公流程转向更自然的语音交互与自动协作。此外，谷歌还推出独立图像编辑应用 Google Pics，基于 Nano Banana 模型实现精确局部编辑，支持对象分割、颜色替换和文本翻译。

AI产品语音交互办公协作 Gmail Docs Google Workspace

推荐理由：谷歌把办公套件全面语音化，Gmail Live 和 Docs Live 让日常邮件检索和文档起草效率大幅提升，经常处理大量邮件和文档的办公人员可以直接用语音完成操作，值得一试。

原文

02:22

02:22IT之家（博客/媒体）

谷歌在 2026 I/O 大会上宣布上线 Ask YouTube 功能，将传统关键词搜索升级为对话式搜索。用户可以用完整句子描述需求，如“如何教孩子学骑自行车”，系统会基于意图理解匹配更精准的视频结果。该功能还支持连续追问，允许用户逐步缩小搜索范围。目前仅向美国 18 岁及以上 YouTube Premium 会员开放，后续将推广至所有用户。这一变化旨在提供互动式、结构化的搜索结果，而非简单的视频链接列表。

AI产品谷歌 Ask YouTube 对话式搜索视频搜索 YouTube Premium

推荐理由：做视频内容搜索或内容创作的团队可以关注——Ask YouTube 把搜索从关键词匹配升级到意图理解，找教程或评测视频会更精准，值得一试。

原文

02:11

02:11IT之家（博客/媒体）

76°

谷歌在 2026 I/O 大会上宣布搜索业务迎来 25 年来最大改版，核心是用 AI 全面重塑搜索入口与交互方式。用户从“输关键词”转向“描述完整需求”，由 Gemini 3.5 Flash 模型提供快速响应。新版搜索支持多模态输入（文本、图片、视频、文件等），AI Overview 支持连续追问，形成聊天式交互。此外，谷歌计划推出 24 小时后台运行的搜索智能体，可追踪公寓、球鞋发售等目标，并在夏季上线。个人智能功能扩展到 98 种语言、近 200 个国家，可连接 Gmail、Google Photos 等个人数据。

AI产品谷歌搜索 AI 搜索 Gemini 3.5 Flash 搜索智能体多模态

推荐理由：谷歌搜索这次改版彻底改变了搜索方式，从关键词到完整需求，做内容、做运营、做产品的团队都该关注——搜索流量和用户行为即将发生根本变化，建议尽早了解并调整策略。

原文

01:58

01:58OpenAI Blog（博客/媒体）

OpenAI 宣布通过 Content Credentials、SynthID 和验证工具推进 AI 内容溯源，帮助用户识别和信任 AI 生成的媒体。Content Credentials 为 AI 生成内容添加数字水印和元数据，SynthID 则嵌入不可见标记。这些技术旨在应对深度伪造和虚假信息，提升 AI 生态的透明度和安全性。用户可通过验证工具检查内容来源，确保真实性。此举是 OpenAI 在 AI 伦理与安全领域的重要一步。

AI产品内容溯源 AI 安全数字水印 OpenAI 深度伪造

推荐理由：内容溯源是应对 AI 虚假信息的关键，做内容审核、媒体平台或 AI 安全研究的团队值得关注，可以直接了解如何用技术手段提升信任度。

原文

01:57

01:57IT之家（博客/媒体）

76°

谷歌在 2026 I/O 大会上发布了 Gemini Spark 个人 AI 智能体，它运行在专有虚拟环境中，用户合上电脑屏幕也不用担心数据被搞乱。Gemini Spark 由 Gemini 3.5 系列模型和 Google Antigravity 框架驱动，支持通过 MCP 协议与第三方工具集成。用户可通过手机自然语言对话创建任务，让 AI 在后台自动完成，例如整理邮件或筹划派对。该功能下周面向美国 Google AI Ultra 订阅用户推出，月费 100 美元起，今年夏天将实现在 Chrome 浏览器中直接运行。

AI产品智能体谷歌 Gemini Spark MCP/工具数据安全

推荐理由：谷歌终于解决了个人 AI 智能体的数据安全痛点——Gemini Spark 在隔离环境中运行，做多任务自动化的用户可以放心让它后台干活，不用盯着屏幕。

原文

01:55

01:55IT之家（博客/媒体）

72°

在 2026 年 Google I/O 大会上，谷歌宣布了 Android Halo 功能，旨在提升手机端 AI 助手的透明度。该功能会在屏幕顶部显示一个低调的状态提示，告知用户 AI 智能体是否正在运行、进入实时模式或发送消息。用户无需切换应用即可掌握 AI 执行进度，解决了过去需要反复查看 Gemini 等助手应用的痛点。Android Halo 首先支持 Gemini Spark，并计划在今年晚些时候扩展到其他 AI 智能体。这标志着 AI 行为从后台黑箱走向前台可感知的系统级透明化。

AI产品 Android Halo Gemini AI 智能体系统级透明化谷歌 I/O

推荐理由：Android Halo 解决了 AI 助手执行状态不透明的痛点，让手机用户无需频繁切换应用就能感知智能体进度。经常使用 Gemini 或 AI 助手的安卓用户，值得关注这项即将上线的系统级透明化功能。

原文

01:45

01:45IT之家（博客/媒体）

在 2026 年谷歌 I/O 大会上，谷歌宣布 Gemini 集成 C2PA 内容凭证，以增强对深度伪造的防御能力。此前，谷歌的 SynthID 已为 10 亿张图片和视频及 6 万年的音频添加水印，Gemini 平台上“数百万人”正在使用 SynthID。现在，用户可在谷歌搜索和 Chrome 浏览器中圈选或右键点击图片，询问是否经过 AI 编辑。谷歌 CEO 桑达尔现场演示了识别一张他与马斯克、奥特曼、黄仁勋吃汉堡的 AI 图像，并指出“这显然是假的”。

AI产品谷歌 Gemini C2PA 内容凭证深度伪造

推荐理由：AI 图片真假难辨的时代，谷歌把验证能力直接集成到搜索和浏览器里，关心信息可信度的用户和内容创作者可以直接用起来。

原文

01:34

Pandaily@contact@pandaily.com (Pandaily)

精选

Matrix Super Intelligence推出MATRIX-3全尺寸人形机器人，身高170cm、重65kg。该机器人具备完整的人形结构，目标在2027年实现10万台量产。公司位于浦东张江，专注于人形机器人研发。

AI产品 MATRIX-3 Matrix Super Intelligence 人形机器人量产

推荐理由：国产人形机器人量产新目标

原文

01:31

01:31IT之家（博客/媒体）

76°

在 2026 年谷歌 I/O 大会上，谷歌正式发布 Gemini Omni 模型，宣称能“从任何输入生成任何输出”，支持对话式编辑，用户可通过一句话改变视频中的角色、背景等元素。首款模型 Gemini Omni Flash 即日起在 Gemini App、Google Flow、YouTube Shorts 可用，未来将推出 API 服务。该模型标志着多模态 AI 进入更灵活、更直观的交互阶段，降低了视频编辑门槛。

AI产品谷歌 Gemini Omni 多模态模型视频编辑对话式交互

推荐理由：视频创作者和内容运营团队终于可以像聊天一样改视频了——Gemini Omni 让一句话替换背景、角色成为现实，建议做短视频或后期的人直接体验。

原文

5月19日

23:07

Cloudflare Blog@Mike Nomitch

76°

Cloudflare 宣布与 Anthropic 合作，将 Claude Managed Agents 集成到其平台中，为自主代码交付提供快速、隔离的执行环境。开发者现在可以全球范围内扩展代理工作流，同时严格控制对私有后端的访问，并轻松定制代理的工具和运行时。这一集成解决了代理部署中的安全性和可扩展性问题，使得构建者能够更安全、高效地运行 AI 代理。对于需要大规模部署自主代理的团队来说，这是一个重要的基础设施升级。

AI产品 Claude Cloudflare 智能体 MCP/工具部署/基础设施

推荐理由：做 AI 代理部署的开发者终于有了一个安全、可扩展的托管方案——Cloudflare 的全球网络加上 Claude 的智能，建议做自动化工作流的团队直接试试。

原文

18:13

18:13IT之家（博客/媒体）

火箭院自主研发的“智行”膝关节智能助行外骨骼机器人于5月16日在千灵山完成首次测试，20位志愿者参与。该设备重2.6千克，30秒内可穿戴，关节提供最大7公斤主动动力。测试数据显示，上坡可降低使用者15%体能消耗，下坡减少膝关节冲击力30%，续航达4小时。产品面向中老年人、户外运动爱好者及康复期患者，具备上坡助力、下山缓冲和膝关节防护功能。

AI产品火箭院智行外骨骼机器人智能助行具身智能

推荐理由：登山省力15%还护膝，航天技术下放

原文

18:05

18:05IT之家（博客/媒体）

72°

宇树科技发布一镜到底视频，展示其G1人形机器人通过外部语音指令自主实时生成各种动作。视频采用现场直接收声，一镜到底拍摄，展示了语音驱动的任意动作生成能力。由于是AI自主实时生成，存在一定延迟且动作丝滑程度稍差。G1机器人发布于2024年，拥有23-43个关节电机，配有力控灵巧手，体重约35kg、身高约127cm。

AI产品人形机器人语音控制宇树科技实时动作生成具身智能

推荐理由：人形机器人终于能听懂人话直接动起来了——宇树G1的语音驱动实时动作生成解决了传统预编程的僵化问题，做机器人开发或关注具身智能的团队值得一看，虽然目前还有延迟和流畅度瑕疵，但方向对了。

原文

15:30

15:30IT之家（博客/媒体）

76°

波士顿动力5月18日发布视频，展示其Atlas人形机器人通过AI驱动行为，成功将一台冰箱搬到桌子上。机器人利用强化学习模拟抬起重物，学会协调全身以负载重物，并准确平衡复杂接触点。视频中，Atlas用双手抬起冰箱，走到桌旁后上半身旋转180度，将冰箱平稳放置。官方表示，这是构建通用实体工作工具的重要一步，旨在提升真实环境下的性能和可靠性。该技术展示了身体智能在搬运重物中的关键作用，结合控制和感知能力，适应不同冰箱的位置、质量和抓力。

AI产品人形机器人波士顿动力 Atlas 强化学习搬运

推荐理由：波士顿动力让Atlas学会搬冰箱，解决了人形机器人搬运重物时平衡与适应性的难题，做机器人研发或自动化搬运的团队值得关注，看看强化学习如何让机器人学会“身体智能”。

原文

15:14

15:14IT之家（博客/媒体）

精选

科技媒体 sammyguru 报道，谷歌计划调整免费版 Gemini 的计量方式，从短周期恢复机制改为“每周额度”管理。用量页面已出现面向免费用户的每周上限展示方式，以百分比形式呈现总周用量。目前该限制仅向少量用户开放，谷歌尚未说明全面推送时间。高频用户可能比过去更容易在短时间内耗尽额度。

AI产品 Gemini Google 免费版周限额使用限制

推荐理由：谷歌要给 Gemini 免费版设周限额了，高频用户注意。

原文

14:56

14:56IT之家（博客/媒体）

精选

Anthropic 宣布上调所有套餐中 Claude Design 的 Token 上限翻倍，减少设计中断，支持更长上下文和更多迭代。同时，Claude Code 的快速模式默认切换为 Opus 4.7 模型，速度提升 2.5 倍，适合快速代码迭代和实时调试。快速模式定价为百万 Token 输入 30 美元、输出 150 美元，与 Opus 4.6 共享速率限制池。这些更新提升了创作和编程效率，尤其对需要频繁交互的用户有利。

AI产品 Claude Design Claude Code Opus 4.7 Token 上限快速模式

推荐理由：Claude Design 上限翻倍解决了复杂设计项目频繁中断的痛点，做原型和演示的团队可以更流畅地迭代；Claude Code 切到 Opus 4.7 让交互式编程快 2.5 倍，写代码的开发者值得立刻试试快速模式。

原文

13:55

13:55IT之家（博客/媒体）

88°

马斯克在推特上邀请用户测试 Cursor 最新 AI 模型 Composer 2.5，该模型基于月之暗面的 Kimi K2.5 训练，号称是 Cursor 最强模型。核心改进包括基于文本反馈的定向强化学习，能精准定位长任务中的错误步骤；合成任务规模扩大至 Composer 2 的 25 倍，并动态筛选更难任务。训练中使用了分片 Muon 与双网格 HSDP 等基础设施优化，单步耗时仅 0.2 秒。价格方面，标准版输入 0.50 美元/百万 token，输出 2.50 美元/百万 token；fast 版更贵但速度更快。

AI产品 Cursor Composer 2.5 Kimi K2.5 强化学习编程助手

推荐理由：Cursor 用户和 AI 编程重度依赖者值得关注——Composer 2.5 解决了长任务中错误定位的痛点，基于 Kimi K2.5 的强化学习让复杂指令执行更稳定，建议试试看能否提升你的编码效率。

原文

13:46

13:46IT之家（博客/媒体）

76°

上海张江企业矩阵超智发布 MATRIX-3 全能旗舰人形机器人，售价 58 万元起。该机器人搭载英伟达 AGX 算力、自研直线关节（峰值推力 5000N），身高 170cm，续航 4 小时，支持 20 分钟快充。同时发布 MFH 超智工厂（年产 1 万台）、WAVE 物理智能模型等生态产品。MATRIX-3 已开启预订，标准版 58 万元，PRO 版 68 万元。

AI产品人形机器人矩阵超智 MATRIX-3 英伟达 AGX 具身智能

推荐理由：人形机器人赛道又添新玩家，58 万起售的 MATRIX-3 在算力和关节性能上对标国际竞品，做具身智能或工业自动化的团队值得关注其量产能力和生态布局。

原文

13:45

13:45IT之家（博客/媒体）

谷歌正在逐步为 Workspace 应用部署渐变版图标，覆盖网页端应用启动器、Chrome 新标签页以及移动端。改版涉及 Gmail、Drive、Docs、Sheets 等 13 款应用，图标颜色和外形差异更明显，去掉了统一的外框，便于用户快速识别。旧版图标因颜色和轮廓相似而备受批评，新版旨在提升多应用切换时的查找效率。目前 iOS 和 Android 用户已能陆续看到新图标。

AI产品谷歌 Workspace 图标改版办公应用用户体验

推荐理由：谷歌终于解决了 Workspace 图标“长得太像”的老问题，经常在 Gmail、Docs、Sheets 之间切换的办公用户，更新后找应用会快不少，值得留意一下。

原文

13:14

GitHub Blog@Candy Ho

GitHub 宣布其 Copilot 远程控制功能正式全面可用，允许用户在 VS Code 或命令行中启动编码会话，然后通过 github.com 或 GitHub Mobile 在手机上继续完成。该功能解决了开发者需要切换设备时无法延续工作流的问题，提升了编码的灵活性和连续性。用户无需重新配置环境即可在不同设备间无缝切换，尤其适合需要移动办公或临时离开桌面的场景。

AI产品 GitHub Copilot 远程控制编码工具跨设备开发者体验

推荐理由：GitHub Copilot 的远程控制功能解决了跨设备编码的断点问题，经常需要在手机或网页上查看或继续编码的开发者可以直接用，省去重新搭建环境的麻烦。

原文

12:32

12:32IT之家（博客/媒体）

小鹏首台量产的 Robotaxi 在广州工厂下线，未来几个月将在广州开启示范运营。该车基于旗舰车型 GX 打造，搭载 4 颗自研图灵 AI 芯片，有效算力达 3000TOPS，为全球车端最高算力，并配备小鹏第二代 VLA 大模型，实现 L4 级自动驾驶。车内提供隐私玻璃、重力座椅、车载娱乐大屏等智能体验。小鹏已取得广州智能网联汽车道路测试许可，并成立 Robotaxi 业务部加速商业化。

AI产品小鹏 Robotaxi 自动驾驶 L4 智能出行

推荐理由：小鹏 Robotaxi 的量产下线标志着中国 L4 级自动驾驶商业化迈出关键一步，关注自动驾驶和出行服务的从业者与投资者值得关注其示范运营进展。

原文

10:51

10:51IT之家（博客/媒体）

76°

英伟达宣布其首批Vera CPU已交付给Anthropic、OpenAI、SpaceXAI和甲骨文，标志着这款专为Agentic AI设计的处理器进入量产阶段。Vera是英伟达首款定制CPU，采用88个自研奥林巴斯核心，内存带宽达1.2 TB/s，单核性能比前代Grace快50%。马斯克亲自签收，甲骨文计划从2026年开始部署数十万颗Vera CPU。Vera可独立发货，预计将为英伟达开辟数十亿美元的新业务领域。

AI产品英伟达 Vera CPU Agentic AI 数据中心定制芯片

推荐理由：Agentic AI的算力瓶颈终于有了专用解决方案，做AI推理和智能体开发的团队值得关注——Vera的高吞吐和能效设计可能改变大规模部署的成本结构。

原文

09:00

09:00IT之家（博客/媒体）

精选

西部数据介绍了业界首款后量子加密（PQC）机械硬盘Ultrastar DC HC6100 UltraSMR。该硬盘采用获得NIST PQC认证的ML-DSA-87代码签名算法，并与RSA-3072形成双重保护。HC6100支持PQC时代的公钥基础设施（PKI）和硬件安全模块（HSM）工作流，具备回滚保护机制。西部数据指出，企业存储设备寿命延长至5年以上，面临量子计算机破解经典密码的风险，因此需要及时强化加密。

AI产品西部数据 HC6100 后量子加密机械硬盘企业级存储

推荐理由：西部数据首款后量子加密硬盘，抵御量子威胁

原文

09:00

Claude Code: GitHub Releases@ashwin-ant

精选

Anthropic 发布了 Claude Code v2.1.144 版本，新增了 /resume 命令对后台会话的支持，后台会话（通过 claude --bg 启动）现在与交互式会话并列显示，并标记为 bg。后台子代理完成通知现在显示耗时。/model 命令现在仅更改当前会话的模型，按 d 键可设置新会话的默认模型。修复了多个关键问题，包括启动挂起（最长 75 秒）、终端输出乱码、macOS 后台会话崩溃、文件描述符耗尽等。MCP 服务器分页工具列表响应现在能正确返回所有页面，不再丢失工具。

AI产品 Claude Code 命令行工具后台会话 bug修复 MCP/工具

推荐理由：Claude Code 重度用户终于可以方便地管理后台会话了，/resume 支持让长时间任务更可控；同时修复了启动挂起和终端乱码等痛点，建议所有用户升级。

原文

08:27

08:27IT之家（博客/媒体）

精选

小米在 CVPR 2026 NTIRE 赛事中夺得三项奖项，包括高效超分辨率赛道冠军、人像修复赛道冠军和反光消除赛道亚军。高效超分辨率赛道中，玄戒多媒体算法团队提出 SPANV2 方案，通过自适应修复和显存优化实现推理速度提升。人像修复赛道采用双阶段级联框架加单步扩散细化，解决了老照片复合退化问题。反光消除赛道基于 RDNet-XL 架构，结合扩散模型知识蒸馏和渐进式训练，在主观评分中获第二名。这些技术突破展示了小米在图像恢复与增强领域的软硬融合能力。

AI产品小米 CVPR 2026 NTIRE 图像修复超分辨率

推荐理由：小米在 CVPR 2026 NTIRE 上连拿三项奖，说明其影像算法已跻身全球顶尖水平。做手机影像或图像处理的开发者，可以看看 SPANV2 和人像修复方案，直接参考技术报告来优化自己的模型。

原文

08:22

08:22IT之家（博客/媒体）

智元 WITA（硅光动语）大模型成为全国首个完成合规备案的具身智能交互大模型，核心应用于人形机器人交互场景，实现自然拟人的情感交互。该模型将用于导览导购、服务零售等场景，并计划在三季度推出 WITA Omni 1.0，将交互时延压缩至 500ms 以内，支持插话、打断和情绪呼应。智元还发布了“358 宏图计划”，目标 2027 年营收超 100 亿，2030 年超 1000 亿。

AI产品具身智能人形机器人交互大模型合规备案智元

推荐理由：人形机器人交互终于有了合规备案的里程碑，做服务机器人或导览导购的团队值得关注——WITA 的端到端多模态交互即将落地，三季度就能看到真机效果。

原文

01:20

01:20OpenAI Blog（博客/媒体）

72°

OpenAI与Dell宣布合作，将AI编程助手Codex部署到混合云和本地企业环境中。此举旨在帮助企业在不依赖公有云的情况下，安全地使用AI编码代理处理敏感数据和内部工作流。Codex能够自动生成代码、修复bug并优化现有代码库，而Dell提供的基础设施确保数据留在企业内部。这一合作解决了企业对数据隐私和合规性的核心关切，尤其适合金融、医疗等受监管行业。

AI产品编程助手企业部署数据隐私 OpenAI Dell

推荐理由：企业开发者终于可以安全地在本地使用AI编程代理了——Dell的硬件+OpenAI的Codex组合解决了数据隐私痛点，金融、医疗等受监管行业的团队可以直接部署，建议关注。

原文

00:30

00:30Hugging Face: Blog（博客/媒体）

精选

PaddleOCR 3.5 版本正式发布，新增对 Transformers 后端的支持，允许用户使用 Hugging Face 生态中的预训练模型进行 OCR 和文档解析任务。这一更新打破了原有框架对 PaddlePaddle 模型的依赖，提升了模型选择的灵活性和生态兼容性。新版本还优化了文档解析性能，支持更多语言和复杂版面分析。对于需要集成 OCR 能力的开发者来说，这是一个重要的升级，可以直接利用社区丰富的 Transformers 模型资源。

AI产品 OCR 文档解析 PaddleOCR Transformers 开源/仓库

推荐理由：PaddleOCR 拥抱 Transformers 生态，做文档解析和 OCR 的团队可以更灵活地选模型，不用被框架绑死，值得升级试试。

原文

5月18日

21:56

Cloudflare Blog@Grant Bourzikas

精选

Cloudflare 近期将安全大模型 Mythos 等应用于其关键基础设施的实时代码审计，并分享了观察结果。Mythos 在发现特定类型的安全漏洞（如注入攻击、权限提升）上表现出色，但在处理复杂逻辑错误和上下文依赖的漏洞时仍有局限。该实验揭示了当前安全 LLM 在规模化部署前需要解决的可靠性、可解释性和误报率问题。这项工作为 AI 辅助代码安全审计提供了宝贵的实践参考，表明模型需要与人工审查和传统工具协同工作。

AI产品安全大模型代码审计 Cloudflare Mythos AI 安全

推荐理由：安全团队和基础设施开发者可以从中了解当前安全 LLM 的真实能力边界——Mythos 能抓哪些漏洞、会漏哪些，以及规模化落地前必须补齐的短板，值得点开看具体案例。

原文

21:35

21:35IT之家（博客/媒体）

理想汽车为 AI 眼镜 Livis 推送 OTA 1.8.50 固件升级，新增 5 项功能并优化 11 项。核心亮点是全新理想 L9 首发 AI 眼镜指挥泊车功能，用户可通过语音指令控制车辆完成复杂泊车，后续将开放更多车型。此外，新增哨兵模式高风险提醒、英文唤醒词、语音唤醒开关和唤醒反馈选择等功能。优化了蓝牙电话拨打体验、视觉问答准确性和视频颜色饱和度。

AI产品理想汽车 AI 眼镜 Livis OTA 升级智能泊车

推荐理由：理想 L9 车主和 Livis 眼镜用户终于能用语音指挥泊车了，解决停车场景的双手操作痛点，建议升级体验。

原文

20:26

20:26IT之家（博客/媒体）

腾讯发布 AI 应用生成平台“吐司”，定位为“探索型氛围编程产品”，目前安卓版已上线，iOS 版稍后推出，公测期间限时免费。用户只需用自然语言描述想法，AI 自动拆解功能、生成原型，并一键打包成 APK 安装到手机。平台还提供社交分享、灵感广场和应用搜索功能，支持用户公开模板供他人二次创作。腾讯强调该平台聚焦“灵感实现”与“共创”，让无代码基础的用户也能将想法变成真实 App，并形成“想法→应用→分发→共创”的闭环生态。

AI产品 AI应用生成 Vibe Coding 腾讯无代码 App原型

推荐理由：腾讯把 Vibe Coding 从概念变成了可落地的产品，零代码用户也能直接上手做 App，想快速验证产品创意的产品经理和创业者值得试试。

原文

20:04

20:04IT之家（博客/媒体）

阿里云宣布 QoderWork 正式上线设计工作台（Design Desk），支持语音输入，用户可通过语音描述需求在无限画布上获得可运行、可编辑的设计产物。该工作台内置一百多种风格参考与数十个设计技能，实现了设计即代码，设计产物可一键交付至 Qoder IDE 等开发工具。它通过 Questions、Design Plan 和 Nudge 三个机制重构了 AI 生产设计流程，降低无效迭代，确保方向对齐，并支持参数化微调。该工具面向设计师、产品经理和市场运营，分别解决了传统流程中的反复导出修改、高保真原型制作周期长、多场景物料交付效率低等问题。

AI产品阿里云 QoderWork 设计工作台语音输入设计即代码

推荐理由：QoderWork 设计工作台把语音描述直接变成可交付的设计稿，解决了设计师、产品经理和运营在传统流程中的反复沟通和低效迭代问题，做 UI 设计或产品原型的人可以直接用语音试起来。

原文

19:59

19:59IT之家（博客/媒体）

大疆发布第二代扫地机器人 ROMO 2 系列，包括 P2（透明旗舰版）和 A2（进阶版），售价 4299-6499 元。相比初代，ROMO 2 吸力从 25000Pa 提升至 36000Pa，越障高度达 8.5cm，并配备 123° 外摆机械臂，边角清洁覆盖更广。大疆将无人机领域的 AI 算法和感知系统下放，实现智能识别颗粒物、液体、地毯等场景并自动调整清洁策略。IT之家实测显示，ROMO 2 在清洁效果、避障和越障方面均有显著提升，弥补了初代短板，成为行业旗舰级产品。

AI产品大疆扫地机器人 ROMO 2 AI 清洁智能家居

推荐理由：大疆用无人机技术降维做扫地机器人，解决了初代越障和吸力不足的痛点，追求极致清洁体验的家庭用户可以直接关注 P2 的透明设计和 8.5cm 越障能力。

原文

19:58

19:58IT之家（博客/媒体）

76°

小鹏汽车宣布其首款全栈自研、前装量产的Robotaxi车型GX正式下线，这是中国首款采用纯视觉方案实现L4级自动驾驶的Robotaxi。该车基于小鹏旗舰车型GX打造，搭载4颗自研图灵AI芯片，有效算力达3000TOPS，为全球车端最高算力，并配备第二代VLA大模型。小鹏计划于2025年下半年开始自动驾驶出租车试点运营，目标在2027年初实现无需现场安全员的完全自主运营。这一里程碑标志着中国L4级自动驾驶商业化进程加速。

AI产品自动驾驶 Robotaxi 小鹏GX L4级纯视觉方案

推荐理由：小鹏GX以3000TOPS算力和纯视觉方案突破L4级自动驾驶，做自动驾驶研发或关注出行商业化的团队值得关注，下半年试点运营将直接验证技术落地能力。

原文

19:43

19:43IT之家（博客/媒体）

精选

Meta 为雷朋 Display 智能眼镜推送 Update 125 更新，正式上线肌电手环手写输入（Neural Handwriting）功能。该功能依赖 Meta Neural Band 肌电手环，通过 sEMG 传感器识别手指和手腕肌肉动作，用户无需键盘即可在桌面或大腿上“空气书写”文字。目前已支持 WhatsApp、Messenger、Instagram 私信及系统短信应用，还可用于搜索联系人和回复通知。此外更新新增显示录制功能，可同时录制眼镜内画面、前置摄像头视角和音频。

AI产品 Meta 雷朋Display 肌电手环 Neural Band 智能眼镜

推荐理由：用肌电手环在空中写字，Meta 眼镜直接转文本

原文

19:42

19:42IT之家（博客/媒体）

摩尔线程在发布会上介绍了 MTT AICUBE 智能硬件在家庭场景的应用，支持语音点播影片、智能体交互和手游畅玩。用户可通过小麦智能体语音指令直接播放热播剧集或经典老片，无需手动搜索。在旅行规划场景中，用户只需说出目的地和偏好，即可一键生成专属攻略。娱乐方面，MTT AICUBE 可连接手柄畅玩《王者荣耀》《原神》等手游，无需模拟器配置。该产品依托全功能 GPU 图形渲染能力，填补国产 GPU 在端侧安卓生态的应用空白，为开发者提供高性价比测试平台。

AI产品摩尔线程 MTT AICUBE 智能硬件语音交互手游畅玩

推荐理由：国产 GPU 终于落地家庭场景，做智能家居或手游开发的团队可以关注这个端侧安卓生态的突破，直接体验语音交互和游戏性能。

原文

16:02

16:02IT之家（博客/媒体）

微信官方介绍了第四届小程序全球创新挑战赛飞龙组一等奖作品「今厕一定得」，由澳门教业中学五名高中生开发。该小程序能在3秒内找到最近的洗手间，并支持一键导航前往，同时显示是否免费、干净、可公用等细节。用户还可手动添加新发现的洗手间，分享给全网。小程序还内置小游戏和AI语音助手，用于打发如厕时间。该项目未来将在明湾基金会支持下正式上线。

AI产品小程序生活服务导航 AI语音助手微信

推荐理由：出门在外找厕所是刚需，这款小程序解决了紧急时刻的痛点，做生活服务类应用的开发者可以关注其产品设计思路。

原文

13:59

Pandaily@contact@pandaily.com (Pandaily)

精选

未岚科技发布了四足机器人BabyAlpha A3，搭载6芯片异构计算集群和66百万像素视觉系统。其计算效率达到行业标准的10倍。成本仅为Nvidia Jetson Thor的十分之一。

AI产品 Weilan Tech BabyAlpha A3 Nvidia Jetson Thor 四足机器人异构计算

推荐理由：十倍效率，十分之一成本

原文