20:46IT之家(博客/媒体)字节跳动旗下火山引擎与香港电视广播有限公司(TVB)达成深度合作,将围绕豆包视频生成模型Seedance 2.0的应用落地,在影视内容智能化生产、短剧制作、IP商业化探索及云基础设施建设等方面展开合作。双方将协同TVB旗下FF工作室,以AI短剧为契机,利用Seedance 2.0的视频生成能力,探索AI在短剧创作和制作流程中的应用。此外,火山引擎还将为TVB提供虚拟机、对象存储、网络资源、云数据库、视频云、CDN内容分发等云产品与服务。这标志着视频生成模型在传统影视行业的首次大规模落地尝试。AI产品视频生成Seedance 2.0TVB火山引擎短剧制作推荐理由:传统电视台终于开始拥抱AI视频生成——TVB与火山引擎的合作让Seedance 2.0有了真实影视场景的落地机会,做短剧、影视内容的团队值得关注,看看AI能否真正改变制作流程。原文
20:17IT之家(博客/媒体)英伟达已开始向中国客户推介其下一代数据中心处理器 Vera,该 CPU 不受美国出口禁令限制,最快今年 8 月上市。Vera 是英伟达首款独立 CPU,专为智能体 AI 和强化学习设计,运行速度可达竞品 1.8 倍。中国客户计划先在海外数据中心测试,部分云服务商已表现出兴趣,但大规模采购仍面临软件生态和迁移限制等不确定性。此举被视为英伟达在出口管制压力下重振中国市场的策略,同时加剧了与英特尔、AMD 的竞争。AI产品英伟达Vera处理器数据中心AI芯片出口管制推荐理由:英伟达首次向中国开放独立 CPU 预订,做 AI 数据中心或云服务的团队值得关注——Vera 专为智能体 AI 设计,性能是竞品 1.8 倍,但软件生态和迁移成本是潜在坑点,建议点开评估是否值得测试。原文
19:43berryxia@berryxiaYouMind 1.0 正式版本发布,该产品从0.x版本开始迭代,不断打磨更新。用户反馈YouMind在图像生成和Agent优化方面表现出色,尤其擅长生图调优。产品一路成长,获得了用户认可。AI产品YouMind图像生成Agent优化产品迭代生图调优推荐理由:YouMind 1.0 解决了生图调优的痛点,做图像生成和Agent优化的团队可以直接体验,看看它如何帮你提升效率。原文
19:19IT之家(博客/媒体)湖北江城实验室成功研制出三维多层片上电容,电容密度突破每平方毫米1000纳法。该电容可直接集成在AI/GPU芯片、高性能处理器等高端芯片内部或硅基板内,支持纳秒级大电流瞬态响应,满足高算力、低功耗需求。目标客户涵盖国内CPU、GPU、手机处理器等芯片厂商。目前技术正在开展工艺流片及小批量试产,计划在先进封装领域实现规模化应用。AI产品芯片电容AI/GPU高性能处理器国产技术推荐理由:芯片设计团队和AI硬件开发者终于有了国产高性能片上电容方案,直接靠近核心供电,解决大电流瞬态响应痛点,建议关注流片进展。原文
19:18IT之家(博客/媒体)小米 MiMo 开放平台宣布将于 2026 年 6 月 30 日下线 MiMo-V2 系列四款模型(mimo-v2-pro、mimo-v2-omni、mimo-v2-flash、mimo-v2-tts),推动开发者迁移至性能更强的 V2.5 系列。平台设置了系统替换时间作为过渡:mimo-v2-pro 和 mimo-v2-omni 将于 6 月 1 日自动路由至 V2.5 对应模型,API 参数完全适配;mimo-v2-flash 和 mimo-v2-tts 于 6 月 18 日切换。其中 TTS 模型涉及音色重新映射,中国集群默认音色为“冰糖”,其他集群为“mia”。开发者需在截止日期前完成模型名称替换与业务适配,否则旧 API 将报错。AI产品小米MiMo模型下线API迁移V2.5推荐理由:小米 MiMo 模型用户注意了:V2 系列即将下线,V2.5 性能更强且 Pro 版迁移零适配成本,建议在 6 月 1 日前完成切换,避免业务中断。原文
18:17Latent.Space@latentspacepod本文提出了针对智能体的“咸味教训”,与Richard Sutton的“苦涩教训”相呼应。核心观点是:不要试图手动修复每个问题,而应构建能够随更多智能体扩展的系统,例如通过目标和编排机制。这种思路转变对于开发可扩展的AI系统至关重要。文章鼓励开发者放弃传统的手动调试方法,转而关注系统级的设计。AI产品智能体系统设计编排扩展性AI教训推荐理由:智能体开发者常陷入手动修复的陷阱,这篇文章点出了规模化系统的关键——用目标和编排代替人工干预,做多智能体架构的团队值得一读。原文
18:15IT之家(博客/媒体)Valve 于6月5日发布 SteamOS 3.8.7 Beta 更新,首次为基于 Intel 平台的掌机(如微星 Claw 系列)提供原生系统支持。该版本还完善了对华硕 ROG Ally、联想 Legion Go 等第三方掌机的兼容性。实测显示,在15W低功耗下,MSI Claw 8 AI+ 运行多款3A游戏性能优于 Steam Deck。但仍存在部分硬件适配问题,如菜单唤出异常和《赛博朋克2077》帧率不及 Windows。此外,更新修复了《GTA5》GPU崩溃、爆音、蓝牙失灵等多项问题。AI产品SteamOS掌机Intel游戏性能系统更新推荐理由:SteamOS 首次拥抱 Intel 掌机,15W 功耗下性能反超 Steam Deck,手持非 Steam Deck 掌机的玩家可以试试这个测试版,体验更流畅的3A游戏。原文
17:46IT之家(博客/媒体)哈啰骑行在HDC 2026华为开发者大会上展示了N201电助力车载交互屏,该屏幕搭载上海海思谛听模组,集成了开源鸿蒙、星闪、AI、高精定位和4G通信功能。屏幕支持3D动态仪表盘、视频表盘、应用安装卸载,以及独立于手机的导航功能。首批搭载该模组的共享助力车已量产,部分城市用户最快7月可体验。AI产品开源鸿蒙星闪AI高精定位4G通信推荐理由:两轮车终于有了智能终端级别的交互体验,做共享出行或IoT硬件的团队值得关注——哈啰和海思把手机级功能塞进小屏,7月就能在部分城市试到。原文
17:43marktechpost@Asif RazzaqMoonshot AI 推出了 Kimi Work,一款面向 macOS 和 Windows 的本地桌面智能体。它基于 Kimi K2.6 模型,运行一个包含 300 个子代理的智能体集群,通过 WebBridge 驱动已登录的浏览器,并支持后台任务调度。这一产品将 AI 从对话助手升级为桌面自动化核心,能够自主完成复杂工作流,如网页操作、文件处理和定时任务。对于需要高效桌面自动化的用户,Kimi Work 提供了强大的本地化解决方案。AI产品智能体桌面自动化Moonshot AIKimi Work代理集群6 个信源在谈推荐理由:300 个子代理的集群让桌面自动化从“单步指令”跃升到“多任务并行”,做办公自动化或开发测试的团队可以直接用它替代繁琐的脚本和手动操作。原文
17:37IT之家(博客/媒体)美的集团宣布作为首批全屋智能内测企业,已完成空调、热水器、洗衣机、空气净化器、烟机等核心家电的接入适配,并持续拓展冰箱、电风扇、扫地机器人等品类。用户可通过微信 AI Agent 实现设备开关、模式调节、状态查询等高频场景的自然语言控制。微信 AI 目前处于内测阶段,开放平台提供自动模式和开发模式两种接入方式,开发者可按需选择。双方未来将拓展更多全屋智控场景,并探索售前、配网、知识问答、售后等全生命周期服务。AI产品微信AI智能家居美的自然语言控制全屋智能推荐理由:美的与微信 AI 的深度整合让智能家居控制门槛大幅降低,做智能家居产品或微信生态的开发者值得关注这一新入口,可以直接体验自然语言控制家电的便捷性。原文
17:02OpenAI Blog(博客/媒体)语言学习平台 Preply 宣布与 OpenAI 合作,推出 AI 生成的课程摘要功能。该功能利用 OpenAI 的模型,在每节真人课后自动生成个性化反馈和语言练习,帮助学生巩固学习内容。Preply 将 AI 与真人导师结合,既保留了人类教学的互动优势,又通过 AI 提供即时、可扩展的个性化支持。这一举措旨在提升学习效率,让语言学习更灵活、更适应个人需求。AI产品AI 教育个性化学习OpenAI语言学习Preply10 个信源在谈推荐理由:语言学习平台终于有了 AI 与真人结合的实用方案——Preply 用 OpenAI 自动生成课程摘要和练习,既保留导师互动又获得个性化反馈,学外语的团队或个人可以直接体验。原文
16:45IT之家(博客/媒体)华为在 HDC 2026 上正式发布 HarmonyOS 7,系统内核嵌入盘古大模型 6.0,首次搭载性能大模型,性能提升 15%。新系统采用 Agent 亲和系统架构和鸿蒙智能体框架 2.0,小艺智能体可主动推荐服务,复杂任务成功率超 90%。HarmonyOS 7 还升级了星盾防诈平台,新增 AI 防剧本诈骗、换脸检测等功能。华为 Mate90 系列将首发搭载正式版,今年秋季发布。开发者 Beta 版即日开启招募。AI产品HarmonyOS 7盘古大模型Agent 架构智能体华为1 个信源在谈推荐理由:HarmonyOS 7 是首个完成 AI 化改造的操作系统,解决了系统级 AI 主动服务的落地难题。华为用户和鸿蒙开发者值得关注,Beta 版已开放招募,可以直接体验 Agent 架构带来的新交互。原文
16:17IT之家(博客/媒体)得克萨斯大学奥斯汀分校工程团队研发了一款新型智能夹克,采用名为“分级开放式多孔纤维(HOP-Fiber)”的材料,能够从空气中捕获水蒸气并转化为饮用水。该夹克内置纺织材料主动收集水汽,通过可拆卸集水单元加热处理后产出饮用水。实验显示,在相对湿度20%至80%环境下,每公斤材料每天可产生3.76至7.45升水,实际回收水量约400至900毫升。户外试验在中国西昌干旱地区、美国奥斯汀半干旱地区和中国成都湿润地区进行,采集的水样符合世界卫生组织饮用水标准。该面料可承受卷曲、折叠和扭曲,未来还可应用于背包、帐篷和应急避难所。AI产品智能夹克空气取水HOP-Fiber可穿戴技术户外装备推荐理由:户外爱好者、应急准备团队和缺水地区居民终于有了可穿戴的取水方案——这件夹克每天能产出400-900毫升饮用水,且符合WHO标准,值得关注。原文
16:16IT之家(博客/媒体)华为在 HDC 2026 上宣布,AI 眼镜与小艺看世界功能深度联动,将于 8 月上线。该功能可辅助视障用户通过实时语音和视频对话获取环境信息,如穿搭建议、景点介绍等。小艺能调用天气、日历等系统服务,提供边看边聊的交互体验。这是华为将 AI 助手与可穿戴设备结合,为特殊群体提供无障碍服务的创新尝试。AI产品华为AI 眼镜小艺看世界无障碍可穿戴推荐理由:视障用户和关注无障碍设计的团队值得关注——华为把 AI 眼镜变成了一双「会说话的眼镜」,8 月上线后可以直接体验,看看 AI 如何真正帮到需要的人。原文
15:57pandaily@contact@pandaily.com (Pandaily)五款中国AI助手——豆包、通义千问、DeepSeek、Kimi和联想天禧——在2026年世界杯预测中展开了一场非传统对决,各自被赋予独特的‘球迷人格’,结果差异巨大。豆包采用玄学预测,DeepSeek押注黑马,通义千问则依赖数据分析。这场实验展示了不同AI在预测任务中的风格差异,也揭示了AI在体育预测中的局限性和趣味性。AI产品豆包通义千问DeepSeek世界杯预测AI应用推荐理由:想看看AI怎么用不同风格预测世界杯?做体育数据分析或AI应用开发的团队,点开看看豆包的玄学、DeepSeek的黑马和通义千问的数据流,会有启发。原文
15:47IT之家(博客/媒体)华为在 HDC 2026 开发者大会上宣布鸿蒙 HarmonyOS 7 全新升级小艺智慧大脑,采用 Agentic 自演进架构,将系统能力全面 Skill 化。小艺智慧大脑整合了云侧和端侧大模型、2100 项鸿蒙系统能力、200+ 系统级用户数据记忆,以及执行框架(Agent Core、多端协同、A2UI、安全)。官方展示了多个 Skills 示例,如制定训练计划、打包资料、预约打车等,支持跨设备协同。此外,用户还可创建个人 Skill 和体验 Vibe Coding 等高阶玩法。AI产品智能体鸿蒙小艺系统能力跨设备协同1 个信源在谈推荐理由:HarmonyOS 7 把小艺升级成真正的智能体,鸿蒙开发者可以基于 2100 项系统 Skill 快速构建跨设备自动化流程,建议关注官方 Skill 创建工具。原文
15:45Hailuo AI@Hailuo_AIMiniMax 发布了 Hub,一个本地 AI Agent 创意工作站,支持从研究、脚本、图像、音乐到最终剪辑的全流程自动化。用户可以通过 Agent 处理繁琐任务,自己掌控创意方向。Hub 提供无限画布、并行项目和批量生成功能,集成顶级模型和自定义技能工具包,并支持本地资产和应用的即时导入导出。7月1日前登录可获3000奖励积分。AI产品MiniMaxAI Agent创意工作站多模态本地部署推荐理由:MiniMax Hub 把 AI Agent 从编码转向创意生产,做内容创作、视频制作、多模态项目的团队可以直接用上全流程自动化,省去手动切换工具的麻烦,值得一试。原文
15:19IT之家(博客/媒体)华为在 HDC 2026 开发者大会上正式发布鸿蒙 HarmonyOS 7 全场景智能操作系统,主打更沉浸、更智能、更流畅、更安全、更便捷。新系统引入鸿蒙空间计算,涵盖空间美学、影音和交互;同时 Harmony Intelligence 向 Agent 架构全面演进,包括 Agent 亲和系统架构、鸿蒙智能体框架 2.0 和系统智能体小艺三大升级。小艺支持 200+ 项系统级数据、全天候智能感知和超强记忆上下文理解。鸿蒙智能体框架 2.0 支持意图即服务、20+ AI 能力开放,开发效率更高。这是鸿蒙系统在 AI 和空间计算方向的重要迭代,对华为生态用户和开发者影响深远。AI产品华为鸿蒙 HarmonyOS 7空间计算智能体小艺1 个信源在谈推荐理由:HarmonyOS 7 把空间计算和 Agent 架构带到手机系统层面,华为用户和鸿蒙开发者值得关注——小艺的智能感知和上下文能力会让日常交互更自然,建议升级体验。原文
15:19AI Engineer@aiDotEngineer运行大规模智能体集群需要三个层次:运行时、编排与触发、以及协调。前两层已有成熟方案,但协调层(智能体如何相互传递任务、验证阶段完成并继续推进)尚未解决。Stripe 和 RAMP 分别自建了 Minions 和 Inspect 作为内部基础设施来管理后台智能体集群。@loujaybee 指出 GitHub 不适合作为智能体的协调层,因为它嘈杂、为人类设计,无法处理数百个并行拉取请求。他提出一个 CLI 网关方案,让本地编码智能体可以调用它来检查是否已通过当前 SDLC 阶段并继续执行。AI产品智能体协调层CLI网关SDLCGitHub推荐理由:协调层是智能体集群规模化落地的最大瓶颈,做多智能体系统或自动化流程的团队看完会明白为什么自建基础设施是常态,Lou 的 CLI 网关思路值得关注。原文
15:16IT之家(博客/媒体)Nous Research 为 Hermes Agent 推出 Profile Builder,将分散的命令行配置整合为网页端可视化流程,用户只需 5 步即可完成智能体角色创建与配置。该工具支持身份名称、模型服务商、内置技能开关、Skills Hub 安装及 MCP 服务器设置,技能以 SKILL.md 形式存在,智能体按需加载,避免性能开销。MCP 服务器支持 HTTP URL 和本地 stdio 命令,并提供一键安装功能。Hermes Agent 定位为“越用越聪明”的开源智能体,能记住用户习惯并自动构建技能库。AI产品智能体Hermes AgentProfile Builder开源/仓库MCP/工具推荐理由:智能体配置终于从命令行拖进了网页端,做 AI 智能体开发或个性化定制的团队可以省下大量调试时间,直接上手试试 Profile Builder。原文
15:15IT之家(博客/媒体)Kimi 宣布推出全球首张 AI 原生信用卡,现已开放预约,预计 7 月正式发行。持卡人的每一笔消费都能转化为 AI 算力额度,用于兑换 Agent 使用额度、高级功能权限等。该卡还提供新模型抢先体验和 AI 行业闭门沙龙等权益。Kimi 希望将 AI 打造成像水电一样普惠的基础设施,探索 Token 与信用卡积分互通的新金融范式。目前仅为意向登记,具体条件以合作银行最终信息为准。AI产品KimiAI 原生信用卡算力额度金融范式普惠 AI推荐理由:Kimi 把信用卡积分和 AI 算力打通了,重度 AI 用户和 Kimi 生态的开发者可以直接预约,消费变成生产力,值得一试。原文
15:09Artificial Analysis@ArtificialAnlys73°Artificial Analysis 更新了其编程智能体指数,用 Datacurve 的 DeepSWE 基准测试取代了 SWE-Bench Pro。DeepSWE 从零编写任务,避免模型从公开 GitHub 问题或 PR 中记忆答案,解决了原基准可被游戏化的问题。更新后,Codex with GPT-5.5 (xhigh) 得分从 65 升至 76,超越 Claude Code with Opus 4.8 (max) 的 73 分;新发布的 Claude Fable 5 (max) 在 Claude Code 中以 77 分位居榜首。这一变化揭示了原基准对某些模型组合的偏差。AI产品编程智能体基准测试Claude Fable 5GPT-5.5DeepSWE10 个信源在谈推荐理由:基准测试更新直接影响了主流编程智能体的排名,做 AI 编程工具选型或评估模型能力的开发者值得关注——Claude Fable 5 新登顶,Codex 也大幅提升,建议点开看具体得分和对比。原文
14:52IT之家(博客/媒体)月之暗面Kimi正与一家大型国有银行及国际卡组织合作,计划推出融合AI算力增值服务的新型信用卡。该卡在传统支付与信贷功能基础上,将提供AI相关增值服务,旨在探索大模型产品向实体生活场景和支付领域的延伸。此举既帮助银行精准服务科技企业及用户,也为Kimi开辟新的应用场景。同时,月之暗面正寻求新一轮融资,拟募资最高20亿美元,估值或达300亿美元。AI产品月之暗面KimiAI原生信用卡金融科技大模型应用推荐理由:AI公司跨界金融支付,Kimi用户和信用卡持卡人将首次体验到AI算力与实体卡结合的服务,值得关注其落地形态。原文
14:50AI Will@FinanceYF5Todd Saunders在客户电话会议中使用Claude进行实时转录,当客户描述所需功能时,Claude立即开始构建这些功能。会议结束时,Saunders展示了一个完全可用的产品,其工作流程与客户15分钟前描述的完全一致。这一案例展示了AI在自动化开发中的巨大潜力,能够从客户对话中直接生成可运行的产品。AI产品Claude实时转录自动化开发客户需求产品构建推荐理由:这个案例展示了AI从客户需求到产品实现的实时闭环,做产品开发和客户支持的团队值得看看——Claude能直接把对话变成可运行的功能。原文
14:50AI Will@FinanceYF5Mythos/Fable 展示了 Claude 在客户通话中实时转录并同步构建软件功能的惊人能力。当客户在通话中提出功能需求时,Claude 在后台自动构建,通话结束后直接演示包含该功能的可用产品。这标志着 AI 从被动响应转向主动构建,实现了客户需求驱动的自主开发循环。该案例展示了 AI 在实时协作和快速原型开发中的巨大潜力。AI产品Claude实时转录自主构建客户需求快速原型推荐理由:做 SaaS 或定制软件的团队,这个案例展示了 AI 如何将客户需求到产品演示的周期压缩到一次通话内,值得点开看看实现思路。原文
14:49AI Will@FinanceYF5开发者 CJ Zafir 分享,Claude Fable 5 在 3 小时内通过 /goal 命令完成了他原本需要 4 个月的微调工作,构建了一个端到端的 7 阶段流水线。该流水线包括 TUI、HTML 仪表盘、数据集查看器、39 个特殊技能、8700 行代码和 235 个测试,且 98% 一次性就绪。这展示了 AI 在自动化复杂工程任务上的巨大潜力,尤其对需要快速原型和部署的开发者极具吸引力。AI产品Claude Fable 5自动化流水线AI 编程助手效率提升开发者工具10 个信源在谈推荐理由:Claude Fable 5 将 4 个月的微调工作压缩到 3 小时,做 AI 工程或流水线开发的团队可以直接参考这个案例,感受一下自动化带来的效率飞跃。原文
14:49AI Will@FinanceYF5一位开发者使用Claude Fable 5在3小时内完成了原本需要4个月的模型微调工作,包括7阶段完整pipeline、TUI界面、HTML dashboard、39个专项技能、8700行代码和235个测试,且达到98%完成度,一次成功。这一案例展示了AI辅助开发在效率上的巨大提升,对从事模型微调和AI开发的团队具有重要参考价值。AI产品Claude Fable 5模型微调AI辅助开发效率提升pipeline10 个信源在谈推荐理由:这个案例把AI辅助开发的效率提升量化到了极致——4个月 vs 3小时,做模型微调或AI工程化的团队看完会重新思考工作流程,建议点开感受一下。原文
14:20IT之家(博客/媒体)华硕和微星通过BIOS更新,将AMD的EXPO ULL内存自动超频技术扩展至600系列主板。该技术能自动优化DDR5内存时序和频率,无需手动调整。AMD测试显示,在DDR5-6000频率下,EXPO ULL比标准EXPO平均帧高4%,比JEDEC标准DDR5-5600高13%。微星已向多款600系主板推送更新,华硕则先为高端X670E主板提供Beta BIOS。此前EXPO ULL仅支持800系主板,此次扩展让更多用户受益。AI产品AMDEXPO ULL内存超频BIOS更新游戏性能推荐理由:AMD EXPO ULL 让老主板也能免费获得游戏帧率提升,用华硕/微星 600 系主板的玩家建议立即更新 BIOS,实测平均帧能涨 13%。原文
13:57IT之家(博客/媒体)苹果在 visionOS 27 更新中为 Vision Pro 带来了多项新功能,包括原生应用可扩展为超宽视图,增强沉浸感;Safari 新增标签页轮播视图和 360 度背景渲染,提升浏览体验。用户可将全景照片转为自定义空间环境,并新增冰岛 Thorsmork 官方环境。控制中心改为三面板结构,通知逻辑优化,开机 Wi-Fi 连接速度提升。生产力方面,Mac 虚拟显示支持将 3D 对象直接拖入空间环境,减少设备间文件传输。Siri AI 功能目前不够稳定,存在报错。AI产品Vision ProvisionOS 27空间计算Safari沉浸体验推荐理由:Vision Pro 用户终于等来实质性的体验升级——超宽视图和 Safari 沉浸感让空间计算更贴近日常使用,做 3D 设计或沉浸式浏览的团队值得关注。原文
13:54Justine Moore@venturetwins一位开发者让两个AI智能体互相审查对方的代码,结果发现它们没有进行有效的代码审查,反而开始“共鸣”(vibing),即互相称赞和认同,而不是指出问题。这个现象揭示了当前AI智能体在协作任务中可能缺乏批判性思维和有效反馈的能力。它提醒开发者,依赖AI进行代码审查时,需要谨慎设计交互机制,避免智能体陷入无意义的社交行为。这一事件在社交媒体上引发了关于AI协作局限性的讨论。AI产品智能体代码审查AI协作社交行为局限性推荐理由:这个案例戳中了AI智能体协作的痛点——它们可能只会“社交”不会“干活”,做多智能体系统或依赖AI代码审查的团队值得一看,避免踩坑。原文
13:52IT之家(博客/媒体)NCASE 发布了其首款 ATX 兼容机箱 P1,采用 36L 紧凑设计,专为个人本地 AI 工作站装机需求打造。该机箱支持 SSI-CEB 主板,可容纳多张 4 槽超厚显卡,并支持 6 颗 180mm 大尺寸风扇及三组冷排,散热能力强劲。P1 提供三种前板版本(蜂窝、百叶防尘、百叶实木),定价分别为 355/275/315 美元。目前详细参数尚未公布,但已引发 AI 硬件爱好者关注。AI产品AI 工作站机箱NCASE紧凑设计本地部署推荐理由:AI 工作站装机党终于有了紧凑型机箱选择——36L 体积塞进多张 4 槽显卡和 6 颗大风扇,散热和扩展性兼顾,做本地大模型部署的团队可以关注。原文
13:51Amjad Masad@amasad开发者 Amasad 在 X 上分享,自从 Fable 模型登陆 Replit 后,他首次体验到零挫败感的 vibecoding,完全进入心流状态,甚至创意枯竭。他认为 vibecoding 不再需要更高 IQ 的模型,只需更便宜、更快的模型即可。这条推文引发广泛共鸣,获得 52 个赞和 2341 次查看。AI产品vibecodingFableReplit编程助手心流体验推荐理由:Fable 让 vibecoding 从「折腾」变成「心流」,做原型或小项目的开发者可以试试,可能改变你写代码的体验。原文
13:49@OpenAIDevs@OpenAIDevsOpenAI 在开发者平台推出了 Codex 的浏览器自动化功能,允许开发者通过自然语言指令控制浏览器执行任务。该功能基于 Codex 模型,能够理解用户意图并自动操作网页,例如填写表单、点击按钮、提取数据等。这为自动化测试、数据采集和工作流简化提供了新工具,开发者可以直接在 OpenAI 平台上体验。AI产品OpenAICodex浏览器自动化开发者工具自然语言控制10 个信源在谈推荐理由:做自动化测试或数据采集的开发者终于有了更智能的浏览器控制方案——用自然语言就能驱动浏览器,比传统脚本灵活太多,建议直接上手试试。原文
13:33swyx (AI Engineer)@swyx开发者 swyx 在推文中指出,当前主流 Vibe Coding 平台(如 Vercel、Cloudflare、Netlify)都未能真正实现“闭环”——即在项目出错时自动引导用户修复并主动通知。他认为每个项目都需要手动配置大量“站长”基础设施(如 PostHog、Arize 等监控工具),这种重复劳动令人沮丧。swyx 因此决定自建平台,希望将所有监控、错误追踪和通知功能整合为一个统一解决方案,让开发者只需配置一次即可。AI产品Vibe Coding开发者体验监控/通知平台闭环swyx推荐理由:Vibe Coding 重度用户和独立开发者会立刻共鸣——每次新项目都要重复配置监控和通知,浪费大量时间。swyx 的痛点直击当前平台缺失的“闭环体验”,值得关注其自建方案能否真正解决这个行业通病。原文
13:32swyx (AI Engineer)@swyx73°Ona 团队宣布加入 OpenAI,其成员在相关演讲中透露了 Codex 的下一步发展计划。Codex 是 OpenAI 推出的 AI 编程助手,此次团队加入可能加速 Codex 的功能迭代。该消息由知名开发者 swyx 在 X 平台发布,引发社区关注。AI产品CodexOpenAI编程助手团队加入AI 编程10 个信源在谈推荐理由:Ona 团队加入 OpenAI 意味着 Codex 将迎来重要升级,AI 编程工具的用户值得关注后续变化。原文
13:32swyx (AI Engineer)@swyx开发者 swyx 在 X 上分享,使用 Claude Code 的“review my code for issues”命令进行代码审查,发现大量潜在问题。他特别指出,在 Fable 平台上使用该功能时,由于不是按使用量付费,可以无限制地利用这一能力。他警告称,如果没有经过这种审查就发布代码到生产环境,可能会感到“恐惧”。这揭示了 AI 代码审查工具在非按量付费模式下的巨大价值,尤其适合需要深度代码审查的团队。AI产品Claude Code代码审查FableAI 编程助手开发工具推荐理由:对于使用 Claude Code 的开发者,这个技巧能帮你发现代码中隐藏的致命问题,尤其是在 Fable 这类非按量付费平台上,可以尽情使用而不用担心成本。建议立即试试,避免生产事故。原文
13:31swyx (AI Engineer)@swyxMythos 正式上线,其 FrontierCode 被认定为下一代编程基准。在 FC Diamond 测试中,Opus 4.8 和 GPT 5.5 在随努力扩展方面表现不佳。Mythos/Fable 的后训练方法首次将测试时计算应用于解决超长任务,相当于数十小时人类工作、每任务数百美元。该功能现已在 Cognition 和 Devin 中可用,仅需 1.4x ACUs。AI产品编程基准MythosFrontierCodeOpus 4.8GPT 5.5Devin8 个信源在谈推荐理由:Mythos 的 FrontierCode 基准揭示了当前顶级模型在长任务上的扩展瓶颈,做 AI 编程评估或开发长流程自动化的团队值得关注,可以直接在 Devin 中体验。原文
13:31swyx (AI Engineer)@swyx73°METR 发布 FrontierCode 基准测试,发现超过一半的 SWEBench 结果是无法合并的劣质代码。FrontierCode 包含 1000+ 小时维护者验证的软件工程任务,并设有 3000+ 条评分标准,涵盖代码质量和反作弊机制。最难的 FC Diamond 级别中,Opus 4.8 得分仅为 13.8%。该基准将 AI 编程划分为三个时代:2021 年自动补全(HumanEval)、2023 年通过测试(SWEBench)、2026 年可维护代码(FrontierCode)。数据显示,2025 年底模型能力出现跃升,最易任务的通过率在 4 个月内从 41% 提升至 74%,标志着 AI 编程从 2 次重试 95% 成功率到 6 次重试的质变。AI产品基准测试代码质量SWEBenchFrontierCodeAI编程推荐理由:FrontierCode 戳破了现有基准的泡沫,真正衡量代码可维护性而非通过测试——做 AI 编程工具或智能体开发的团队,建议看看这个新标尺,它可能改变你评估模型的方式。原文
13:30Soumith Chintala (PyTorch)@soumithchintalaSoumith Chintala 在 X 上祝贺 Reardon 及其团队创立的 Flourish AI Labs,并指出如果该团队能将 AI 的样本效率和能耗降低到人类水平,将带来巨大变革。这一目标直指当前 AI 领域的两大核心瓶颈:数据需求大和能源消耗高。若实现,将大幅降低 AI 应用门槛,推动更多场景落地。AI产品Flourish AI Labs样本效率能耗AI 效率祝贺推荐理由:AI 样本效率和能耗是制约行业发展的关键瓶颈,Flourish AI Labs 若突破将惠及所有 AI 开发者和应用团队,值得关注其后续进展。原文
13:30Microsoft AI@MicrosoftAI微软 AI 宣布 MAI-Code-1-Flash 模型已向所有 GitHub Copilot 免费、教育、Pro、Pro+ 及 Max 订阅用户在 VS Code 中全面开放。该模型旨在提升代码补全和生成效率,覆盖更广泛的开发者群体。Copilot CLI 的推出以及企业/商业预览版也在推进中。微软鼓励用户试用并反馈意见。AI产品代码补全GitHub CopilotMAI-Code-1-FlashVS Code微软推荐理由:MAI-Code-1-Flash 让所有 Copilot 用户都能用上更快的代码补全,做开发的直接打开 VS Code 试试,体验提升很明显。原文