全部 AI 动态 · AI 热点

6月29日

15:42

@koltregaskes@koltregaskes

精选

Nature Medicine论文对GPT-5、Gemini 2.5 Pro等前沿模型进行了医学视觉推理压力测试，通过移除图像、替换图像、调整问题格式来检验模型是否真正理解。结果显示，在标准基准上表现优异的模型在条件变化时出现推理不稳、幻觉视觉细节等问题。作者将测试框架开源，随后有人用GPT-5.5 Pro重新运行，得分从之前最好的67-70%提升至79%，约10个百分点的进步。这解决了论文发表时模型已过时的问题，使评估能随模型更新而保持时效性。

推荐理由：Nature Medicine那篇论文把模型考倒了，但作者直接把考卷开源了。后来GPT-5.5 Pro重新考，分数涨了10%！

原文

15:41

@koltregaskes@koltregaskes

商汤推出了U1 Pro图像思考模型，该模型在图像生成能力上与GPT Image 2持平甚至更优。U1 Pro支持高达8K分辨率输出，专为设计场景优化。内部测试将于7月启动，之后计划公开发布。

AI模型 U1 Pro SenseTime GPT Image 2 图像生成推理模型

推荐理由：商汤新模型U1 Pro据说能和GPT Image 2比一比，还支持8K图，设计师7月就能内测了。

原文

15:38

@koltregaskes@koltregaskes

91°

OpenAI 开放了 GPT-5.6 模型家族的有限预览，包括旗舰版 Sol、性价比版 Terra 和快速版 Luna。Sol 引入最大推理努力和超模式，使用子代理加速复杂任务，在 Terminal-Bench 2.1 上领先，并在网络安全基准上匹配 Mythos Preview 性能，仅用三分之一输出令牌。系统卡将网络和生物能力评为高，但低于自主全链利用的关键阈值。更广泛可用性计划在未来几周内推出。

AI模型 OpenAI GPT-5.6 Sol 推理模型智能体

推荐理由：OpenAI 终于放出 GPT-5.6 预览，Sol 在编程和网络安全测试上效率高，Terra 半价达 GPT-5.5 水平，想尝鲜可以关注。

原文

15:19

Geek@geekbb

推文作者分享了使用 Qwen3-8B 模型与 DSpark 工具进行本地部署的体验。该推文获得 737 次查看，反映了用户对消费级显卡运行大模型的渴望。当前消费级显卡显存普遍不足，难以直接运行 8B 参数模型。

AI模型 Qwen3-8B DSpark 本地部署消费级显卡

推荐理由：有人实测了 Qwen3-8B 配合 DSpark 本地跑，说能流畅运行但显存不够，感觉消费级显卡该升级了。

原文

14:57

阿里云 Alibaba Cloud@alibaba_cloud

阿里云国际宣布与AI公司NovaxAI建立战略合作。通过整合阿里云的全球云基础设施和AI能力，以及NovaxAI的独特技术，双方将助力AI企业实现更快、更稳定、更高效的全球扩张。合作未透露具体技术细节或金额。

行业阿里云 NovaxAI 合作 AI基础设施

推荐理由：阿里云联手NovaxAI，帮AI公司出海更稳更快，云服务加AI能力的新组合。

原文

14:55

宝玉@dotey

有用户发现，在 Codex 应用中将模型选为 GPT-5.5 并设置推理为 xhigh 后，运行 Juice 测试 Prompt 若返回 128 则实际使用的是 GPT 5.6 Sol，否则返回 768 就是 GPT 5.5。该 Prompt 要求模型输出 Juice 数除以2乘10再除以5的结果。目前测试仍返回 768，说明多数用户尚未灰度到 GPT 5.6 Sol。

技巧 GPT 5.6 Sol GPT 5.5 提示词工程推理模型

推荐理由：想提前知道自己的 GPT 5.5 是不是偷偷升级了？用这个 Juice 测试 Prompt 一试便知，很简单。

原文

14:54

14:54IT之家（博客/媒体）

精选

据台媒《经济日报》报道，华邦电子将加入台积电WoW（晶圆对晶圆）3D堆叠先进封装的内存晶圆供应链，成为除三大DRAM企业外的新供应方。华邦自2023年开始布局3D堆栈DRAM技术，其CUBE方案可提供8GB容量和256GB带宽。AI计算中存储带宽制约加速器吞吐能力，而边缘AI芯片无需HBM，低成本的宽I/O堆叠定制化内存方案可提升性能与性价比。台积电与华邦合作旨在满足这一市场需求。

行业华邦电子台积电 WoW封装 3D堆叠DRAM 边缘AI

推荐理由：华邦联合台积电，给边缘AI芯片提供高性价比的3D堆叠DRAM，容量8GB带宽256GB，比HBM便宜还能用。

原文

14:53

14:53IT之家（博客/媒体）

韩国产业通商部长金正官与总统李在明宣布启动涵盖半导体、物理 AI 和 AI 数据中心的“三大超级项目”。政府将联合企业五年内把首都圈半导体生产能力扩大两倍，晶圆厂建设从原定2040年代中后期提前至2030年代中期，最多提前12年。政府计划15年内投入30万亿韩元（约1321.2亿元人民币）支持芯片研发与生产，预计五年内DRAM生产能力翻倍。

行业韩国 DRAM 半导体 AI数据中心产业政策

推荐理由：韩国政府砸30万亿韩元，五年内DRAM产能翻倍，晶圆厂提前12年开工，半导体玩家该紧张了。

原文

14:49

14:49IT之家（博客/媒体）

韩国气候环境部长官金成焕宣布将推出分地区差异化电价制度，并新设AI数据中心专属电价方案。政府计划保障半导体工厂和AI数据中心稳定获取低成本电力，降低忠清、岭南等区域大型AI数据中心的用电成本。西南圈半导体产业集群将配套630万千瓦供电和每日65万吨供水，龙仁产业集群需1500万千瓦电力和150万吨水。AI数据中心配套至2029年前供应超800万千瓦电力。

行业韩国电价政策 AI数据中心半导体产业基础设施

推荐理由：韩国政府要给AI数据中心搞专属电价，降低用电成本，吸引企业去地方投资，对半导体和AI基建是大利好。

原文

14:47

14:47IT之家（博客/媒体）

SK集团会长崔泰源宣布，到2035年建成15吉瓦（GW）AI数据中心容量，总投资规模达1000万亿韩元（约4.4万亿元人民币）。项目将作为韩国国家级基础设施和“实体AI时代”核心底座，未来10年平均每年国内投资超100万亿韩元。SK海力士也将向韩国西南部投资400万亿韩元，该项目总投资额达1100万亿韩元（约4.84万亿元人民币）。

行业 SK集团 AI数据中心韩国 SK海力士投资

推荐理由：SK集团砸1000万亿韩元建15GW AI数据中心，相当于4.4万亿元人民币，未来10年每年投4404亿元，顺便还要建半导体超级项目。这规模真猛

原文

14:38

14:38IT之家（博客/媒体）

72°

三星电子会长李在镕6月29日表示，当前AI芯片需求爆发，公司产能已无法满足市场需求，计划在韩国光州新建先进半导体封装工厂。三星还计划在龟尾推进机器人投资、仁川布局生物医药、蔚山投资电池、釜山投资半导体基板。三星正扩大HBM市场投入，挑战SK海力士，客户包括英伟达、AMD和谷歌。今年5月三星已向客户提供12层HBM4E内存样品，加速下一代AI内存竞争。

行业三星电子李在镕 AI芯片 HBM SK海力士

推荐理由：三星要新建半导体封装厂，扩大AI芯片产能，跟SK海力士抢HBM市场，客户有英伟达、AMD，你可以了解下他们的最新动作。

原文

14:21

Richard Socher@RichardSocher

Richard Socher指出，随着越来越多的人使用AI，对幻灯片、电子表格、文档等工作成果的可接受标准将上升。目前多数管理者尚未精通AI，因此低质量结果尚未普遍受到惩罚。未来，达不到AI辅助水平的工作者可能难以保住职位，顶级人才借助AI会变得更加出色。

行业 Richard Socher AI工作质量行业趋势

推荐理由：Richard Socher的观点很直接：以后用AI做不好工作的人会很难混，顶尖的人会更强。

原文

14:14

14:14IT之家（博客/媒体）

三星电机正与美国云服务提供商洽谈供应AI服务器用MLCC，合同规模约5000亿韩元（约22.02亿元）。CSP预期MLCC同比涨价50-60%，高容产品或更高，三次电源产品涨价40%以上。三星电机与住友化学计划成立玻璃基板合资公司，各投资5000亿韩元，三星电机持股过半，目标2028年初投产。预计2026年全球MLCC市场规模约1341亿元，同比增长16.5%，2030年达2129亿元。村田和三星电机预计分摊AI服务器高规格MLCC市场，份额分别约45%和40%。

行业三星电机 MLCC AI服务器玻璃基板住友化学

推荐理由：三星电机可能要拿下美国大客户5000亿韩元的MLCC大单，MLCC涨价猛，还和住友化学合伙搞玻璃基板，2028年投产。

原文

13:59

Ate-a-Pi@svpino

中国AI公司纷纷发布自己的SOTA（State-of-the-Art）模型，但所有公司都选择将其开源。与美国的封闭模式不同，中国企业在激烈竞争的同时，将模型权重和代码公开分享给全球社区。这种独特的生态让外界看到中国AI发展的另一条路径。

行业中国开源模型 SOTA AI生态

推荐理由：中国AI公司都在卷开源，跟美国完全不一样，看看他们怎么一边竞争一边分享的。

原文

13:58

Ate-a-Pi@svpino

这个开源项目允许你录制浏览器操作，系统会自动清理录制内容，移除重试、死路和页面特定细节。然后它只保留任务逻辑而非具体点击，将其转化为可复用的技能。最后这些技能被组织成技能图谱，智能体可检索用于相关新任务。整个过程完全开源。

技巧开源浏览器自动化智能体技能图谱工作流

推荐理由：有个开源项目能录制你在浏览器里做的事，自动变成可复用的技能，还能让智能体直接调用，省去重复劳动。

原文

13:54

berryxia@berryxia

精选

Supervision是Roboflow出品的计算机视觉开源工具包，已获45K GitHub Stars，近三周增长5K。它提供模型无关的推理、标注、数据集加载、跟踪和区域统计等可复用组件。用户使用YOLO或RF-DETR等检测模型后，只需几行代码即可完成标注和可视化。该工具包大幅降低重复造轮子的成本，以前需要数百行的检测+跟踪+统计Pipeline现可快速搭建。

AI产品 Supervision Roboflow YOLO 计算机视觉开源工具包

推荐理由：Roboflow把CV工作流做成了搭积木：几行代码搞定检测、跟踪、统计，模型随便换。GitHub涨星飞快，省去重复造轮子。

原文

13:52

EleutherAI@AiEleuther

EleutherAI在ICML 2024会议上发布了参会指南。指南包含了他们在会议期间的展位和演讲安排。参会者可通过链接获取详细位置信息。

技巧 EleutherAI ICML 开源模型活动指南

推荐理由：EleutherAI发了他们在ICML的定位指南，想去现场找他们的可以看看，免得错过。

原文

13:52

EleutherAI@AiEleuther

EleutherAI 在 X 平台发布 ACL 2025 会议参会指南。该指南包含其在会场的位置及活动信息，方便与会者在会议期间找到他们。指南提供了具体的展台编号和活动时间表。

行业 EleutherAI ACL 会议指南

推荐理由：如果你去 ACL 会议，看看 EleutherAI 在哪，别错过和他们的交流。

原文

13:52

AutoGPT@Auto_GPT

AutoGPT团队在微软Build大会（MSBuild）上展示了其新平台。现场观众对新平台表现出极大热情，团队表示感谢。错过昨天演示的用户今天仍可观看现场演示。该平台旨在进一步提升自主人工智能代理的能力。

AI产品 AutoGPT MSBuild 自主智能体

推荐理由：AutoGPT在MSBuild上秀新平台了，看看他们又搞了什么新花样。

原文

13:52

Together AI@togethercompute

Together Compute的Zain Hasan将在开源推理工作坊中解释单次模型调用与大规模智能体服务的本质区别。研讨会于美国太平洋时间周一上午9点举行。活动主办方为aiDotEngineer。

行业 Together Compute 智能体推理工作坊大规模部署

推荐理由：如果你在搭智能体应用，想从demo走向生产，来听听Zain怎么拆解关键差异。

原文

13:52

Together AI@togethercompute

开放模型推动AI栈走向模块化，模型、API、工具和推理各自独立进步。Together AI认为开放模型的价值远超定价优势，正在构建模块化推理层。这种架构让不同组件可以独立优化，降低整体AI应用成本。

行业开放模型 Together AI 推理层模块化 AI栈

推荐理由：Together AI聊开放模型不是拼价格，而是拼模块化。他们正在做AI推理层，让模型、工具自由组合。

原文

13:51

Vercel AI@vercel

精选

Vercel 推出 AI SDK 7，专注于生产环境中 AI Agent 的开发与部署。新版本引入审批机制，允许控制 Agent 操作的执行流程；增加持久化功能，支持长期任务的恢复与状态保存；内置遥测系统，帮助开发者监控与调试 AI 工作流。该 SDK 7 还改进了可观测性和稳定性，为构建可靠 AI 平台提供基础设施。

AI产品 AI SDK 7 Vercel Agent 智能体 AI平台

推荐理由：Vercel 的 AI SDK 7 直接帮你搞定 Agent 的持久化、审批和监控，做生产级 AI 应用省心很多。

原文

13:51

Together AI@togethercompute

在 aiDotEngineer World's Fair 上，James Zou 将展示 EinsteinArena 和 DSGym 两项工作。EinsteinArena 用于多智能体数学发现，DSGym 则为数据科学智能体提供更好的评估。这两项基准旨在推动 AI 在科学协作中的能力。

AI模型 EinsteinArena DSGym Together AI 多智能体数据科学智能体

推荐理由：想知道多智能体怎么一起搞科研、怎么评估数据科学智能体？James Zou 分享了两个新基准，很实用。

原文

13:51

Together AI@togethercompute

精选

随着Token使用量爆发式增长，模型选择已从技术决策变为产品策略。团队正在测试GLM-5.2等新模型，追求前沿质量与更好的Token经济学。Together AI正在构建面向开源模型未来的推理层，以提供更可控的成本、数据和部署选项。

行业 GLM-5.2 Together AI 推理层开源模型 Token经济学

推荐理由：团队开始用GLM-5.2替换闭源模型？Together AI的推理层让开源模型更可控，想省钱又保质量可以看看。

原文

13:51

Together AI@togethercompute

精选

Together Compute推出ParallelKernelBench开放基准测试，专门评估LLM编写多GPU内核的难度。该基准基于50个真实CUDA通信问题，性能取决于通过NVLink高效移动数据。测试结果将于6月30日在aiDotEngineer World's Fair上由Simran Arora分享。

AI模型 ParallelKernelBench Together Compute CUDA NVLink 基准测试

推荐理由：Together Compute搞了个ParallelKernelBench，专门测LLM能不能写好复杂的多GPU内核，比单GPU难多了，感兴趣的话可以去现场听分享。

原文

13:51

Together AI@togethercompute

Together AI 构建了基于 Parakeet 的语音转文本堆栈，每秒可处理约 302 秒音频，这是 Artificial Analysis 报告中最高速度因子。该堆栈在 Together 平台上运行，通过系统级优化实现低延迟转录。文章由 @FeelTheBeurn 详细拆解了背后的工程工作。

AI模型 Parakeet Together AI 语音识别推理优化速度基准

推荐理由：Together AI 把 Parakeet 优化到每秒转写 302 秒音频，比别的服务快一大截，想搞语音识别的可以看看这篇系统调优拆解。

原文

13:51

Together AI@togethercompute

GLM-5.2模型在Together AI平台上运行，生成精美Web应用的成本仅需几美分。开发者可以以极低开销探索多个方向、比较不同版本，并保留最佳结果。这显著改变了传统的构建迭代循环，降低了实验门槛。

AI模型 GLM-5.2 Together AI 编程助手

推荐理由：GLM-5.2在Together AI上几美分就能生成网页应用，开发者可以随便试不同版本，挑最好的，省钱又高效。

原文

13:51

Together AI@togethercompute

Together AI 工程师将在 AI Engineer World’s Fair 举办 hands-on workshop，讨论 Agentic Coding 如何改变推理引擎需求。workshop 将讲解推理引擎的工作原理及服务生产级 agentic workloads 的要点。活动时间为6月29日上午9-11点，地点在 Room 2020。

技巧 Together AI AI Engineer World’s Fair agentic coding 推理引擎智能体

推荐理由：想了解 agentic coding 对推理引擎的新要求？Together AI 的这个实操 workshop 直接带你上手，时间是6月29日上午。

原文

13:51

Together AI@togethercompute

Together AI 宣布其处理 token 量已达 400 万亿，认为这标志着开放模型在真实生产中进入规模采用阶段。团队将实际工作负载迁移到开放模型，是为了获得前沿质量、更好的 tokenomics 和更强的推理控制力。Together AI 提供基础设施支持这一转型。

行业 Together AI 开放模型 tokenomics 推理生产部署

推荐理由：400万亿 token 的量级，说明开放模型在真实生产里站稳了，看 Together AI 怎么搭台子。

原文

13:51

Together AI@togethercompute

精选

Together AI与5C合作部署NVIDIA GB300 NVL72系统，该系统采用高密度计算、先进冷却和AI优化存储。专为大规模推理和推理任务设计，提升基础设施的算力密度和能效。部署的重点是支撑下一代AI推理需求，尤其是长链推理场景。

行业 Together AI 5C NVIDIA GB300 NVL72 推理基础设施高密度计算

推荐理由：Together AI和5C搞了套GB300 NVL72，算力密度高、散热好，专门跑大规模推理，适合那种费算力的长推理任务。

原文

13:51

Together AI@togethercompute

精选

ParallelKernelBench评估了LLMs编写多GPU内核的能力，包含87个来自Megatron-LM、DeepSpeed、DeepEP、TensorRT-LLM、NeMo-RL等真实代码库的问题。测试结果显示LLMs在单GPU内核上表现良好，但在多GPU场景下完全失败。该研究由Willy Chan等人完成，揭示了当前LLM在多GPU编程中的核心缺陷。

AI模型 ParallelKernelBench Megatron-LM DeepSpeed 多GPU 基准测试

推荐理由：新基准ParallelKernelBench发现，LLM写单GPU代码还行，但多个GPU一起就瞎了。想看看AI编程到底卡在哪？

原文

13:51

Together AI@togethercompute

GLM-5.2 现已上线，用户可通过 Together Chat 免费体验。无需 API 设置，直接选择模型即可开始使用。Together AI 在安全的北美基础设施上提供服务，方便开发者快速测试。该模型免费试用的入口已公开，降低了体验门槛。

AI模型 GLM-5.2 Together AI Together Chat 免费试用

推荐理由：想试试GLM-5.2？现在Together Chat上就能免费用，不用搭API，选模型直接开聊。

原文

13:51

Together AI@togethercompute

精选

智谱AI的GLM-5.2模型在Together AI平台展示了端到端代码修复能力，可读取issue、推理场景并自动生成补丁。一年前这类任务还被认为是闭源模型（如GPT-4）的专属领域，如今开源模型已能胜任。该模型未公布具体基准分数，但实际演示表明其编程推理能力接近闭源水平。

AI模型 GLM-5.2 Together AI 推理模型编程助手开源模型

推荐理由：开源模型GLM-5.2能自己读代码问题、推理并修复，以前只有闭源模型才能做到，现在用Together AI就能跑。

原文

13:51

Together AI@togethercompute

精选

Together AI 在 X 上演示语音智能体利用屏幕交互的功能。该方案整合了语音转文本（STT）、语音合成和推理，具体使用 Parakeet 进行 STT，MiniMax Speech 2.8 处理语音，MiniMax M3 进行推理。实时系统要求堆叠每一层保持低延迟。演示展示了完整循环在 Together AI 平台上运行。

AI产品 Together AI Parakeet MiniMax Speech 2.8 MiniMax M3 语音智能体

推荐理由：Together AI 搞了个语音智能体 demo，能边看屏幕边说话，用了 Parakeet、MiniMax Speech 2.8 和 M3，实时性很强。

原文

13:51

Jasper AI@heyjasperai

Jasper宣布与Anthropic的Claude AI深度集成，推出Jasper IQ功能。该功能将品牌上下文、治理规则和机构知识直接注入Claude对话，使营销团队能在Claude中无缝调用品牌资产。Claude提供推理能力，Jasper IQ提供品牌智能，解决AI工具缺乏上下文感知的痛点。

AI产品 Jasper Claude Anthropic 营销AI 品牌上下文

推荐理由：Jasper把品牌知识塞进Claude对话里了，营销团队用Claude写东西时不用再重复交代品牌背景，直接就能用上自家规则和素材。

原文

13:51

Jasper AI@heyjasperai

Jasper 发布了 GEO Agent 和 GEO Hub，旨在帮助品牌优化在 AI 搜索中的可见性。据 Jasper 称，自然流量正在下降，而近 100% 的买家使用 AI 做购买决策。该工具将在下周的戛纳国际创意节上展示。Jasper 强调品牌需要新的策略来适应 AI 搜索的变化。

AI产品 Jasper GEO Agent GEO Hub AI搜索营销工具

推荐理由：Jasper 出了个新工具，专门帮品牌在 AI 搜索结果里露脸。自然流量掉得厉害，这个 GEO 套件值得做营销的人看看。

原文

13:51

Jasper AI@heyjasperai

Jasper发布了GEO Agent和GEO Hub，这是一套端到端的AI搜索优化系统。AI在评估品牌时，有60%的概率会误代表品牌。该工具帮助品牌通过监控、优化和持续改进，自主管理在AI搜索渠道中的形象。产品现已可用。

AI产品 Jasper GEO Agent GEO Hub AI搜索品牌优化

推荐理由：Jasper刚发布了GEO Agent，能自动监控和优化你的品牌在AI搜索结果中的表现，解决60%的误判问题。

原文

13:51

François Chollet@fchollet

François Chollet提出自主性不是无需人类监督的行动能力。他认为自主性是学习能力而不依赖人类瓶颈。系统完全依赖人类训练数据和RL环境只是人类知识的印迹。这定义了真正的自主性。

行业 François Chollet 自主性人类训练数据强化学习

推荐理由：他说自主性不是单干，而是自己学，不用人类一步步教。对比常见误解，这个定义很清晰。

原文

13:51

Jasper AI@heyjasperai

Jasper将Hugging Face基础设施用于其MONET系统的数据创建和存储。该方法针对随时间更新的大型训练数据集进行了优化。Jasper团队通过HF实现了更高效的数据管道管理。这一案例展示了HF在训练数据工作流中的实际应用。

技巧 Jasper Hugging Face MONET 数据管道模型训练

推荐理由：看看Jasper怎么用Hugging Face当MONET的数据后台，对做大模型训练数据管道的团队很有启发。

原文

13:51

百度 AI Baidu@Baidu_Inc

百度举办的 Build with MeDo 黑客马拉松吸引了全球超8000名开发者参与，创作从工具到AI体验的各类项目。获胜者 @Bioba_daniel 与 @_garvgupta 将于6月30日上午9点（UTC+8）直播分享他们的作品。该活动由百度联合 @Medo_CodeFree 推出，旨在推动AI应用的创意开发。

行业 Baidu 黑客马拉松 MeDo AI应用构建

推荐理由：百度黑客松8000人参与，看看获胜者用MeDo做了什么，6月30日直播揭晓。

原文

仅展示最近 2000 条内容。更早的内容请查阅 AI 日报存档（侧边栏 → AI 日报 → 顶部「往期日报」）。