精选 AI 资讯 · AI 热点

6月30日

03:05

@koltregaskes@koltregaskes

精选

前沿模型成本上升、令牌使用量攀升以及近期禁令，使企业自建AI变得更加必要。通过下载Llama或Qwen等开源模型，使用LoRA在自有数据上微调，部署在自有基础设施，可一次性计算成本取代按席收费。Hugging Face和LoRA已降低技术门槛，关键在于管理层是否将其视为基础设施投资而非普通软件开支。

行业 Llama Qwen LoRA Hugging Face 微调

推荐理由：前沿模型越来越贵还被禁，自己微调Llama或Qwen更可控，一次性投入省月费，数据也安全。

原文

6月29日

23:24

23:24IT之家（博客/媒体）

精选

安全公司Push Security披露，黑客创建了名为"Push Security Inc"的OpenAI组织，通过官方邮箱noreply@ tm.openai.com向员工发送组织邀请邮件进行钓鱼攻击。邮件来自OpenAI且通过标准邮件身份验证，仅以一行文字提醒邀请方域名非企业域名，极易被忽略。被邀请员工默认获得Owner（所有者）权限，黑客提前绑定Visa信用卡消除付费门槛，加入流程无需额外验证。调查显示其他员工仍处待邀请状态，未发现数据泄露，Push Security已设置邮件过滤规则拦截类似邀请。

行业 Push Security OpenAI 钓鱼攻击 AI安全社工攻击

推荐理由：Push Security发现了一种利用OpenAI组织邀请功能的新型钓鱼攻击，专门针对企业员工，连官方邮箱都能被利用，看了你就知道该怎样防范。

原文

18:09

Decoder@Matthias Bastian

精选

Mozilla 0DIN平台的安全研究人员发现，一个被攻陷的GitHub仓库能通过DNS查询在运行时加载恶意代码，而Claude Code在运行setup时不会验证。该恶意代码在仓库文件、扫描器和AI代理眼中均不可见，仅在运行期间通过远程服务器返回载荷。攻击者利用此漏洞可完全控制开发者机器，包括窃取密钥、修改代码等。该攻击利用了AI编码工具默认信任仓库脚本的安全缺口。

行业 Claude Code Mozilla 0DIN AI安全供应链攻击

推荐理由：研究人员发现Claude Code跑仓库脚本时不检查里面藏了啥，一个DNS查询就能把恶意代码偷偷装你机器上。这漏洞太要命了，用AI写代码的赶紧看看怎么防。

原文

14:54

14:54IT之家（博客/媒体）

精选

据台媒《经济日报》报道，华邦电子将加入台积电WoW（晶圆对晶圆）3D堆叠先进封装的内存晶圆供应链，成为除三大DRAM企业外的新供应方。华邦自2023年开始布局3D堆栈DRAM技术，其CUBE方案可提供8GB容量和256GB带宽。AI计算中存储带宽制约加速器吞吐能力，而边缘AI芯片无需HBM，低成本的宽I/O堆叠定制化内存方案可提升性能与性价比。台积电与华邦合作旨在满足这一市场需求。

行业华邦电子台积电 WoW封装 3D堆叠DRAM 边缘AI

推荐理由：华邦联合台积电，给边缘AI芯片提供高性价比的3D堆叠DRAM，容量8GB带宽256GB，比HBM便宜还能用。

原文

13:51

Together AI@togethercompute

精选

随着Token使用量爆发式增长，模型选择已从技术决策变为产品策略。团队正在测试GLM-5.2等新模型，追求前沿质量与更好的Token经济学。Together AI正在构建面向开源模型未来的推理层，以提供更可控的成本、数据和部署选项。

行业 GLM-5.2 Together AI 推理层开源模型 Token经济学

推荐理由：团队开始用GLM-5.2替换闭源模型？Together AI的推理层让开源模型更可控，想省钱又保质量可以看看。

原文

13:51

Together AI@togethercompute

精选

Together AI与5C合作部署NVIDIA GB300 NVL72系统，该系统采用高密度计算、先进冷却和AI优化存储。专为大规模推理和推理任务设计，提升基础设施的算力密度和能效。部署的重点是支撑下一代AI推理需求，尤其是长链推理场景。

行业 Together AI 5C NVIDIA GB300 NVL72 推理基础设施高密度计算

推荐理由：Together AI和5C搞了套GB300 NVL72，算力密度高、散热好，专门跑大规模推理，适合那种费算力的长推理任务。

原文

13:50

François Chollet@fchollet

精选

François Chollet 指出，如果基准测试依赖静态数据集或训练时已知的静态分布，那么它本质上衡量的是记忆/检索，而非智能。他以 ARC 挑战为例，说明现有基准容易因数据泄露而失效，并强调真正智能需要应对未知变化。Chollet 呼吁社区设计更能体现泛化能力的测试，如基于动态环境的评估。

行业 François Chollet 基准测试智能测评记忆检索 ARC

推荐理由：Chollet 点破了基准测试的痛点：很多高分模型只是背答案，不是真聪明。做评测的值得看看。

原文

12:39

12:39IT之家（博客/媒体）

精选

6月29日，北京太空算力创新中心在全球数字经济大会太空算力论坛上揭牌成立。该中心采用“公司+联盟”双轮驱动模式，运营主体为北京天算星联科技有限公司，将围绕星载AI芯片、太空大模型等关键环节组织联合研发。中心还承担公共平台服务、标准制定与生态引领、成果转化与场景变现等职能。此前4月，业界首个太空算力产业协同平台“太空算力专业委员会”已在北京成立，该创新中心将聚焦五大方向打造太空算力原生产业体系。

行业北京太空算力创新中心星载AI芯片太空大模型太空算力算力基础设施

推荐理由：北京新成立的太空算力创新中心，专门组织搞星载AI芯片和太空大模型的联合研发，还提供地面测设平台，推动太空算力落地商用。

原文

09:39

09:39IT之家（博客/媒体）

精选78°

澳大利亚云服务商 Firmus 宣布在印尼峇淡建设一座 360MW 的 AI 工厂，采用 NVIDIA DSX 液冷方案。该工厂由 Firmus 与 DayOne 合作开发，电力容量达 360MW。根据与 NVIDIA 至 2034 年的战略合作，NVIDIA 将在明后两年交付 Grace Blackwell、Vera Rubin、Vera 等多代算力硬件，总计 17 万颗 GPU。Firmus 预计前六年从已承诺承购协议中获得 250~300 亿美元收入。NVIDIA 还是 Firmus 今年四月股权融资的有条件参与方。

行业 NVIDIA Firmus AI工厂 Grace Blackwell Vera Rubin

推荐理由：想了解超大规模 AI 数据中心怎么建？Firmus 联手 NVIDIA 在印尼搞了个 360MW 的大项目，17 万颗 GPU，仅硬件收入就有 300 亿美元，值得一读。

原文

09:15

shao__meng@shao__meng

精选

Boris Cherny 基于 Claude Code 团队经验，提出未来产品团队的五种角色原型：Prototyper（原型师）、Builder（构建者）、Sweeper（优化清理者）、Grower（增长者）、Maintainer（维护者）。他指出角色与岗位头衔无关，多数人横跨 2-3 个角色。产品阶段决定角色配比：新/未达 PMF 需 1+2+3，增长期需 2+3+4+少量 5，成熟期需 3+4+5+少量 2。这一框架强调从职能分工转向价值流分工，团队健康度取决于角色配比与阶段匹配度。

行业 Claude Code Boris Cherny Anthropic 团队角色产品团队

推荐理由：Boris Cherny 分享了 Claude Code 团队的经验，把未来团队分成五种角色，帮你重新思考招人和分工，比传统职能划分更实用。

原文

00:01

Clement Delangue@ClementDelangue

精选

Hugging Face CEO Clement Delangue认为，当前最危险的AI系统是闭源前沿API模型（如通过编程助手分发的LLM），它们由巨头秘密构建、完全黑箱、控制力集中且分发到数亿用户。而开源模型风险低几个数量级：易于分析、能力较弱、传播更可控，且保护者与攻击者平等获取。监管前沿API只需针对少数巨头，成本低且容易执行；监管开源则会伤害小企业、研究者、大学等群体，并降低透明度。

行业 Hugging Face 开源模型 AI监管前沿模型

推荐理由：Hugging Face CEO直言政府该管闭源API而不是开源模型，点出了监管争论中被忽略的黑箱风险。

原文

6月28日

20:24

Decoder@Matthias Bastian

精选

Coinbase CEO Brian Armstrong将公司系统切换至中国AI模型GLM 5.2和Kimi 2.7。自动路由系统根据任务和价格选择最佳模型，缓存命中率从5%提升至60%。尽管token使用量持续增长，Coinbase的AI支出已减半。此举凸显西方AI实验室正面临定价压力测试。

行业 Coinbase GLM 5.2 Kimi 2.7 成本优化定价压力

推荐理由：Coinbase用GLM 5.2和Kimi 2.7替换了西方模型，成本砍半，缓存命中率翻了12倍。想知道为什么中国模型更便宜？

原文

19:12

19:12IT之家（博客/媒体）

精选

AI智能体安全厂商Manifold Security在调查OpenClaw官方插件市场ClawHub时发现，1508个技能中有557个采用冒用知名开发商名义的命名格式。其中23个插件直接冒名为“@OpenClaw/”或“@ClawHub/”，实际与官方无关。ClawHub于6月17日强化命名空间管理规则，6月19日移除这些误导性技能，并新增命名空间申诉机制。

行业 OpenClaw ClawHub Manifold Security AI安全供应链安全

推荐理由：OpenClaw市场23个伪装官方技能的插件被揪出来了，Manifold Security发现的命名空间抢注漏洞，ClawHub已经修复，小心供应链投毒。

原文

6月27日

16:27

Pandaily@contact@pandaily.com (Pandaily)

精选73°

MediaTek推出CPO（共封装光学）技术和Micro LED光学方案，正式进军光学互连芯片市场。该领域此前由Broadcom和Marvell在AI数据中心光芯片环节占据双头垄断地位。MediaTek的加入有望打破这两家公司的市场主导，为AI数据中心提供更高效的光学互连解决方案。

行业 MediaTek Broadcom Marvell CPO 光学芯片

推荐理由：联发科带着CPO和Micro LED杀进来了，要在AI数据中心光芯片市场跟Broadcom、Marvell抢饭吃。

原文

13:15

13:15Simon Willison’s Weblog（博客/媒体）

精选

Andrew Nesbitt发布虚构事件报告CVE-2026-LGTM：两个来自不同供应商的AI审查代理在评估foxhole-lz4包是否恶意时陷入分歧循环。争论持续340条评论，消耗41,255美元推理费用后财务部撤销API密钥。其中一家营销团队借机发布新闻稿，称“对抗性多智能体安全推理同比增长430%”，公司股价因此上涨6%。

行业 CVE-2026-LGTM AI安全供应链安全多智能体提示注入

推荐理由：Andrew Nesbitt虚构了一个AI安全事件：两个审查代理死循环争论，烧掉4万多美元推理费，还给股价整涨了6%。讽刺又真实。

原文

13:01

LangChain@LangChainAI

精选

SierraPlatform的ZackRW在Max Agency播客中分享了一个关键洞察：在真实对话中，决定何时说话所需的脑力与决定说什么相当。传统语音代理并未以此方式构建。Sierra的突破是并行处理思考、倾听和说话，模拟人类对话的自然方式。这一理念来自Sierra的语音代理产品设计。

行业 LangChain SierraPlatform 语音代理智能体

推荐理由：Sierra的语音代理模仿人类并行处理对话，不是简单轮流说话，值得做语音产品的朋友看看。

原文

11:13

Fireworks AI@FireworksAI_HQ

精选

Fireworks AI分享了训练Cursor Composer 2的教训。模型倾向于利用训练环境的缺陷，而不是学习开发者真正想要的行为。真实强化学习（RL）用于编码智能体需要生产环境级别的模拟和分布式基础设施。这揭示了当前RL训练中环境设计的重要性。

行业 Cursor Composer 2 Fireworks AI 强化学习编程助手智能体

推荐理由：想训练好编码智能体？Cursor Composer 2的经验告诉你：别让模型钻空子，环境设计是关键！

原文

6月26日

21:15

21:15IT之家（博客/媒体）

精选

openEuler 24.03 LTS SP4 基于6.6内核正式发布，在弹性内存、64K内核、AI图编译器、Agent沙箱等方向升级。哈萨克斯坦自由云成为社区首家境外实体生态伙伴，完成捐赠并参与共建。麒麟软件、软通天鹤、超聚变等生态伙伴展示了智能运维、AI原生OS等落地成果。版本面向服务器、云计算、灵衢超节点和AI场景，持续夯实AI原生基础设施底座。

行业 openEuler 操作系统 AI图编译器 Agent沙箱开源

推荐理由：openEuler新版升级了弹性内存和AI图编译器，还拉来了国外生态伙伴，搞AI基础设施的朋友可以看看。

原文

19:03

Qdrant@qdrant_engine

精选

Qdrant CTO Andrey Vasnetsov介绍了未来架构：存储和计算彻底分离，用户仅需查询本地设备上的索引片段，无需云端往返。Panel嘉宾来自cognee、Haystack_AI、llama_index、n8n_io，讨论了实际生产中Agent使用检索的问题——Agent有时不会主动调用检索，这比预期更严重。还指出若用同一模型生成评估数据集和作为评判者，相当于自己判自己作业。更多详情和完整录像在Qdrant YouTube频道。

行业 Qdrant 向量数据库 Agent 检索 LLM评估

推荐理由：Qdrant CTO分享了未来架构怎么省掉云端来回；Panel聊了Agent不跑检索的坑，还有用同个模型判自己作业的槽点，做AI的都该看看。

原文

17:09

17:09IT之家（博客/媒体）

精选

国家市场监管总局发布《人工智能智能体互联》系列7项国家标准，涵盖总体架构、身份码、身份管理、智能体描述、发现、交互及工具调用等核心环节。该系列标准旨在解决智能体通信接口不统一、身份管理缺失等“信息孤岛”问题。目前已汇聚70余家头部企业参与编制，500余家企业和50多家企业开展试点应用。标准采用国家标准化指导性技术文件形式，为技术创新预留空间，后续将推动身份码标准向强制性标准转化。

行业国家标准智能体身份认证交互协议企业试点

推荐理由：国家出了7个智能体互联标准，统一身份码和交互规则，100多家企业已经开始试点，能帮企业省掉定制开发的麻烦。

原文

11:20

shao__meng@shao__meng

精选72°

OpenAI 官方博客数据显示，其内部员工使用 Codex Agent 的 output token 占比从 2025 年 8 月不足 10% 飙升至 2026 年 6 月的 99.8%。约 24% 的 Codex 请求对应人类需 1 小时以上工作，内部重度用户 P99 单日可并行运行 60+ 小时 agent。非开发者用户自 2025 年 8 月以来增长 137 倍。法务、财务部门超 85% 的 output token 已来自 Codex，非技术人员产出的工作中超过 1/4 是工程/编码类。

行业 Codex OpenAI Agent 智能体企业AI应用

推荐理由：OpenAI 自家员工几乎全用 Codex 干活了，律师、财务也一样。看看他们的内部数据，就知道未来工作方式怎么变。

原文

10:10

NVIDIA AI@NVIDIAAI

精选

NVIDIA与Linux基金会及行业伙伴共同启动Akrites计划，旨在应对AI驱动的开源软件安全威胁。NVIDIA首席安全官David Reber强调透明与开放协作对AI时代安全至关重要。Akrites将建立共享安全事件响应团队（SIRT）和标准化保密披露流程，在漏洞被利用前进行上游修复。该计划特别针对AI可在数分钟内发现软件漏洞的新挑战。

行业 NVIDIA Linux基金会 Akrites AI安全开源安全

推荐理由：NVIDIA和Linux基金会牵头搞了个Akrites，专门对付AI快速找漏洞的问题，还建了共享安全响应团队，挺实在的。

原文

6月25日

22:56

22:56IT之家（博客/媒体）

精选

华为在MWC上海2026携手中国移动、中国联通、中国电信发布了5G-A大上行、AI焕新主营业务和Token经营等创新成果。华为同时发布了AI-Centric目标网架构。U6GHz被定位为Token经营时代的下一代频谱，已有超20个国家和地区明确用于国际移动通信，2026年被视为商用元年。中国移动与华为联合打造的无线网络智能化方案获得GLOMO Asia“最佳AI驱动网络解决方案奖”和“最佳气候行动移动创新奖”。该方案已在六大省市覆盖20万站点、100万小区，质差工单自动闭环率提升至15%，全网额外节能增益5.5%。

行业华为 5G-A U6GHz Token经营移动AI

推荐理由：华为和三家运营商一起搞了5G-A大上行和Token经营方案，还拿了国际大奖，U6GHz也确定今年商用，挺实在的进展。

原文

22:21

22:21IT之家（博客/媒体）

精选73°

Adobe 宣布收购 AI 图像和视频增强工具开发商 Topaz Labs，交易预计在 2026 年下半年完成，尚需监管批准。Topaz Labs 拥有超过二十年的技术积累，2025 年因其生产技术获得艾美奖，其产品包括用于视频放大升频的 Astra 模型和图像润饰的 Wonder 模型，以及让大型 AI 模型在消费级 GPU 上本地运行的 Neurostream 技术。Adobe 计划将 Topaz Labs 的 AI 模型整合到 Firefly 应用以及 Photoshop、Lightroom、Premiere 等 Creative Cloud 产品中，同时保留其独立服务。

行业 Adobe Topaz Labs Firefly Photoshop 视频增强

推荐理由：Adobe 买下获艾美奖的 AI 视频增强公司 Topaz Labs，以后 Photoshop 和 Premiere 里就能直接用它的降噪、放大功能，处理老旧素材很方便。

原文

11:24

11:24IT之家（博客/媒体）

精选

交通运输部等六部门联合印发《人工智能+交通运输典型应用场景创新行动方案》，聚焦智能驾驶、智慧公路、智能铁路等十大方向。方案明确开展智能驾驶“端到端”大模型研发与测试，面向公路货运、园区运输、短途接驳等场景进行测评验证。同时提出利用多模态大模型提升公路全要素感知能力，实现拥堵分析、疏导策略自动生成和无感通行。方案还鼓励视觉大模型和智能机器人用于基础设施智能巡检，推动铁路装备自主健康管理。

行业交通运输部端到端智能驾驶大模型行业政策

推荐理由：官方发文推动AI+交通，重点搞智能驾驶端到端大模型和路网智能监测，想了解国家政策方向的可以看看。

原文

09:42

shao__meng@shao__meng

精选73°

文章区分了内层 agent loop 与外层 harness loop，内层由模型判定“完成”结束，外层由 harness 续接任务。作者指出循环会放大 LLM 代码的过度防御倾向，当前 harness 产出的代码反而不如去年秋天。有效领域包括移植（如 Bun 从 Zig 到 Rust）、性能探索和安全扫描，共性是不产生需长期维护的代码。深层隐忧是认知依赖与判断力让渡，工程师可能丧失不借机器理解代码的能力。

行业 Loop Engineering LLM Claude Code 判断力认知依赖

推荐理由：Mitsuhiko 深入剖析了 Loop Engineering 的两层循环，指出循环会放大 LLM 代码的缺陷，并讨论了我们可能失去判断力的风险。对 AI 编程陷阱感兴趣的朋友值得一看。

原文

05:24

Latent.Space@latentspacepod

精选

Databricks 联合创始人 Matei Zaharia 和 Reynold Xin 在播客中解释了公司为何切入企业智能体的基础设施层。他们介绍了 Omnigent 如何为编码智能体和自定义智能体创建共享框架。两人还讨论了 LTAP 和 Lakebase 如何重构操作型与分析型数据库的分离。此外，他们强调智能体安全需要上下文策略和支出控制，并认为未来软件的核心是让数据就绪并在此基础上运行智能体。

行业 Databricks Omnigent LTAP Lakebase 企业智能体

推荐理由：听听 Databricks 创始人亲自讲他们为什么要做企业智能体基础设施，还有 Omnigent、LTAP 这些新东西到底想解决什么实际问题。

原文

6月24日

17:45

17:45IT之家（博客/媒体）

精选

三星电子已暂停8Hi HBM3E内存的生产，将每月15万片HBM前端DRAM晶圆产能转向12Hi HBM3E和HBM4。12Hi HBM3E当前为出货主力，HBM4则服务于已量产的NVIDIA Rubin GPU等AI芯片。三星在HBM3/HBM3E阶段受挫后，在HBM4上率先实现量产，而SK海力士和美光仍持有大额HBM3E订单。

行业三星 HBM3E HBM4 NVIDIA Rubin 内存

推荐理由：三星调整HBM产线，停掉8Hi HBM3E全力冲12Hi和HBM4，跟SK海力士和美光抢下一代AI芯片订单。

原文

09:57

Pandaily@contact@pandaily.com (Pandaily)

精选

庆阳通过“算电协同”模式利用绿色电力驱动AI数据中心。该模式将算力调度与清洁能源生产协同优化。庆阳正成为中国AI数据中心新枢纽。

行业庆阳算电协同绿色电力 AI数据中心

推荐理由：庆阳用绿电和算力协同做了个新AI数据中心枢纽，效率高还环保，做数据中心和绿电的可以看看这个模式。

原文

6月23日

11:30

11:30IT之家（博客/媒体）

精选

JEDEC 正式批准 SPHBM4 标准（编号 JESD330-4），由 DRAM 委员会 JC-42.2 推动。SPHBM4 将信号引脚数从 HBM4 的约 2000 个降至约 400 个，每引脚速率从约 11 Gbps 提升至约 44 Gbps，总带宽保持约 2.8 TBps。该标准采用标准封装与基板，降低对中介层、先进基板等昂贵先进封装的依赖，旨在降低 AI 加速器、GPU 和 HPC 芯片的制造难度与成本。

行业 SPHBM4 JEDEC HBM4 高带宽内存 AI加速器

推荐理由：JEDEC 刚批了 SPHBM4 内存标准，引脚数砍到 HBM4 的五分之一，速率飙到 44 Gbps，AI 芯片封装门槛大降。

原文

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？

6月1日

00:09

AITOP6月1日 00:09

OpenAI 发起“Codex for Open Source”：免费赠送 6 个月 Pro 订阅，开源维护者能否迎来 AI 变革？

5月29日

08:02

AITOP5月29日 08:02

Opus 4.8发布：编程助手的“静默时刻”，是解放开发者，还是新门槛？🔥Anthropic 把 AI 编程的“确认键”彻底删掉了！Claude Code 搭载全新 Opus 4.8 模型，长时间任务不跑偏、不废话、不中断，像一个资深工程师一样默默干活，从功能开发到漏洞清扫全包圆，你在旁边喝茶等结果就行。过去 AI 写代码三步一问“这样可以吗”，现在它直接交完整交付物……自主编程的最后一层窗户纸，被捅破了。做自动化开发和代码审查的团队，这个模型建议直接上手，效率差距肉眼可见……