14:57阿里云 Alibaba Cloud@alibaba_cloud阿里云国际宣布与AI公司NovaxAI建立战略合作。通过整合阿里云的全球云基础设施和AI能力,以及NovaxAI的独特技术,双方将助力AI企业实现更快、更稳定、更高效的全球扩张。合作未透露具体技术细节或金额。行业阿里云NovaxAI合作AI基础设施推荐理由:阿里云联手NovaxAI,帮AI公司出海更稳更快,云服务加AI能力的新组合。原文
14:55宝玉@dotey有用户发现,在 Codex 应用中将模型选为 GPT-5.5 并设置推理为 xhigh 后,运行 Juice 测试 Prompt 若返回 128 则实际使用的是 GPT 5.6 Sol,否则返回 768 就是 GPT 5.5。该 Prompt 要求模型输出 Juice 数除以2乘10再除以5的结果。目前测试仍返回 768,说明多数用户尚未灰度到 GPT 5.6 Sol。技巧GPT 5.6 SolGPT 5.5提示词工程推理模型推荐理由:想提前知道自己的 GPT 5.5 是不是偷偷升级了?用这个 Juice 测试 Prompt 一试便知,很简单。原文
14:54IT之家(博客/媒体)精选据台媒《经济日报》报道,华邦电子将加入台积电WoW(晶圆对晶圆)3D堆叠先进封装的内存晶圆供应链,成为除三大DRAM企业外的新供应方。华邦自2023年开始布局3D堆栈DRAM技术,其CUBE方案可提供8GB容量和256GB带宽。AI计算中存储带宽制约加速器吞吐能力,而边缘AI芯片无需HBM,低成本的宽I/O堆叠定制化内存方案可提升性能与性价比。台积电与华邦合作旨在满足这一市场需求。行业华邦电子台积电WoW封装3D堆叠DRAM边缘AI推荐理由:华邦联合台积电,给边缘AI芯片提供高性价比的3D堆叠DRAM,容量8GB带宽256GB,比HBM便宜还能用。原文
14:53IT之家(博客/媒体)韩国产业通商部长金正官与总统李在明宣布启动涵盖半导体、物理 AI 和 AI 数据中心的“三大超级项目”。政府将联合企业五年内把首都圈半导体生产能力扩大两倍,晶圆厂建设从原定2040年代中后期提前至2030年代中期,最多提前12年。政府计划15年内投入30万亿韩元(约1321.2亿元人民币)支持芯片研发与生产,预计五年内DRAM生产能力翻倍。行业韩国DRAM半导体AI数据中心产业政策推荐理由:韩国政府砸30万亿韩元,五年内DRAM产能翻倍,晶圆厂提前12年开工,半导体玩家该紧张了。原文
14:49IT之家(博客/媒体)韩国气候环境部长官金成焕宣布将推出分地区差异化电价制度,并新设AI数据中心专属电价方案。政府计划保障半导体工厂和AI数据中心稳定获取低成本电力,降低忠清、岭南等区域大型AI数据中心的用电成本。西南圈半导体产业集群将配套630万千瓦供电和每日65万吨供水,龙仁产业集群需1500万千瓦电力和150万吨水。AI数据中心配套至2029年前供应超800万千瓦电力。行业韩国电价政策AI数据中心半导体产业基础设施推荐理由:韩国政府要给AI数据中心搞专属电价,降低用电成本,吸引企业去地方投资,对半导体和AI基建是大利好。原文
14:47IT之家(博客/媒体)SK集团会长崔泰源宣布,到2035年建成15吉瓦(GW)AI数据中心容量,总投资规模达1000万亿韩元(约4.4万亿元人民币)。项目将作为韩国国家级基础设施和“实体AI时代”核心底座,未来10年平均每年国内投资超100万亿韩元。SK海力士也将向韩国西南部投资400万亿韩元,该项目总投资额达1100万亿韩元(约4.84万亿元人民币)。行业SK集团AI数据中心韩国SK海力士投资推荐理由:SK集团砸1000万亿韩元建15GW AI数据中心,相当于4.4万亿元人民币,未来10年每年投4404亿元,顺便还要建半导体超级项目。这规模真猛原文
14:38IT之家(博客/媒体)72°三星电子会长李在镕6月29日表示,当前AI芯片需求爆发,公司产能已无法满足市场需求,计划在韩国光州新建先进半导体封装工厂。三星还计划在龟尾推进机器人投资、仁川布局生物医药、蔚山投资电池、釜山投资半导体基板。三星正扩大HBM市场投入,挑战SK海力士,客户包括英伟达、AMD和谷歌。今年5月三星已向客户提供12层HBM4E内存样品,加速下一代AI内存竞争。行业三星电子李在镕AI芯片HBMSK海力士推荐理由:三星要新建半导体封装厂,扩大AI芯片产能,跟SK海力士抢HBM市场,客户有英伟达、AMD,你可以了解下他们的最新动作。原文
14:21Richard Socher@RichardSocherRichard Socher指出,随着越来越多的人使用AI,对幻灯片、电子表格、文档等工作成果的可接受标准将上升。目前多数管理者尚未精通AI,因此低质量结果尚未普遍受到惩罚。未来,达不到AI辅助水平的工作者可能难以保住职位,顶级人才借助AI会变得更加出色。行业Richard SocherAI工作质量行业趋势推荐理由:Richard Socher的观点很直接:以后用AI做不好工作的人会很难混,顶尖的人会更强。原文
14:14IT之家(博客/媒体)三星电机正与美国云服务提供商洽谈供应AI服务器用MLCC,合同规模约5000亿韩元(约22.02亿元)。CSP预期MLCC同比涨价50-60%,高容产品或更高,三次电源产品涨价40%以上。三星电机与住友化学计划成立玻璃基板合资公司,各投资5000亿韩元,三星电机持股过半,目标2028年初投产。预计2026年全球MLCC市场规模约1341亿元,同比增长16.5%,2030年达2129亿元。村田和三星电机预计分摊AI服务器高规格MLCC市场,份额分别约45%和40%。行业三星电机MLCCAI服务器玻璃基板住友化学推荐理由:三星电机可能要拿下美国大客户5000亿韩元的MLCC大单,MLCC涨价猛,还和住友化学合伙搞玻璃基板,2028年投产。原文
13:59Ate-a-Pi@svpino中国AI公司纷纷发布自己的SOTA(State-of-the-Art)模型,但所有公司都选择将其开源。与美国的封闭模式不同,中国企业在激烈竞争的同时,将模型权重和代码公开分享给全球社区。这种独特的生态让外界看到中国AI发展的另一条路径。行业中国开源模型SOTAAI生态推荐理由:中国AI公司都在卷开源,跟美国完全不一样,看看他们怎么一边竞争一边分享的。原文
13:58Ate-a-Pi@svpino这个开源项目允许你录制浏览器操作,系统会自动清理录制内容,移除重试、死路和页面特定细节。然后它只保留任务逻辑而非具体点击,将其转化为可复用的技能。最后这些技能被组织成技能图谱,智能体可检索用于相关新任务。整个过程完全开源。技巧开源浏览器自动化智能体技能图谱工作流推荐理由:有个开源项目能录制你在浏览器里做的事,自动变成可复用的技能,还能让智能体直接调用,省去重复劳动。原文
13:54berryxia@berryxia精选Supervision是Roboflow出品的计算机视觉开源工具包,已获45K GitHub Stars,近三周增长5K。它提供模型无关的推理、标注、数据集加载、跟踪和区域统计等可复用组件。用户使用YOLO或RF-DETR等检测模型后,只需几行代码即可完成标注和可视化。该工具包大幅降低重复造轮子的成本,以前需要数百行的检测+跟踪+统计Pipeline现可快速搭建。AI产品SupervisionRoboflowYOLO计算机视觉开源工具包推荐理由:Roboflow把CV工作流做成了搭积木:几行代码搞定检测、跟踪、统计,模型随便换。GitHub涨星飞快,省去重复造轮子。原文
13:52EleutherAI@AiEleutherEleutherAI在ICML 2024会议上发布了参会指南。指南包含了他们在会议期间的展位和演讲安排。参会者可通过链接获取详细位置信息。技巧EleutherAIICML开源模型活动指南推荐理由:EleutherAI发了他们在ICML的定位指南,想去现场找他们的可以看看,免得错过。原文
13:52EleutherAI@AiEleutherEleutherAI 在 X 平台发布 ACL 2025 会议参会指南。该指南包含其在会场的位置及活动信息,方便与会者在会议期间找到他们。指南提供了具体的展台编号和活动时间表。行业EleutherAIACL会议指南推荐理由:如果你去 ACL 会议,看看 EleutherAI 在哪,别错过和他们的交流。原文
13:52AutoGPT@Auto_GPTAutoGPT团队在微软Build大会(MSBuild)上展示了其新平台。现场观众对新平台表现出极大热情,团队表示感谢。错过昨天演示的用户今天仍可观看现场演示。该平台旨在进一步提升自主人工智能代理的能力。AI产品AutoGPTMSBuild自主智能体推荐理由:AutoGPT在MSBuild上秀新平台了,看看他们又搞了什么新花样。原文
13:52Together AI@togethercomputeTogether Compute的Zain Hasan将在开源推理工作坊中解释单次模型调用与大规模智能体服务的本质区别。研讨会于美国太平洋时间周一上午9点举行。活动主办方为aiDotEngineer。行业Together Compute智能体推理工作坊大规模部署推荐理由:如果你在搭智能体应用,想从demo走向生产,来听听Zain怎么拆解关键差异。原文
13:52Together AI@togethercompute开放模型推动AI栈走向模块化,模型、API、工具和推理各自独立进步。Together AI认为开放模型的价值远超定价优势,正在构建模块化推理层。这种架构让不同组件可以独立优化,降低整体AI应用成本。行业开放模型Together AI推理层模块化AI栈推荐理由:Together AI聊开放模型不是拼价格,而是拼模块化。他们正在做AI推理层,让模型、工具自由组合。原文
13:51Vercel AI@vercel精选Vercel 推出 AI SDK 7,专注于生产环境中 AI Agent 的开发与部署。新版本引入审批机制,允许控制 Agent 操作的执行流程;增加持久化功能,支持长期任务的恢复与状态保存;内置遥测系统,帮助开发者监控与调试 AI 工作流。该 SDK 7 还改进了可观测性和稳定性,为构建可靠 AI 平台提供基础设施。AI产品AI SDK 7VercelAgent智能体AI平台推荐理由:Vercel 的 AI SDK 7 直接帮你搞定 Agent 的持久化、审批和监控,做生产级 AI 应用省心很多。原文
13:51Together AI@togethercompute在 aiDotEngineer World's Fair 上,James Zou 将展示 EinsteinArena 和 DSGym 两项工作。EinsteinArena 用于多智能体数学发现,DSGym 则为数据科学智能体提供更好的评估。这两项基准旨在推动 AI 在科学协作中的能力。AI模型EinsteinArenaDSGymTogether AI多智能体数据科学智能体推荐理由:想知道多智能体怎么一起搞科研、怎么评估数据科学智能体?James Zou 分享了两个新基准,很实用。原文
13:51Together AI@togethercompute精选随着Token使用量爆发式增长,模型选择已从技术决策变为产品策略。团队正在测试GLM-5.2等新模型,追求前沿质量与更好的Token经济学。Together AI正在构建面向开源模型未来的推理层,以提供更可控的成本、数据和部署选项。行业GLM-5.2Together AI推理层开源模型Token经济学推荐理由:团队开始用GLM-5.2替换闭源模型?Together AI的推理层让开源模型更可控,想省钱又保质量可以看看。原文
13:51Together AI@togethercompute精选Together Compute推出ParallelKernelBench开放基准测试,专门评估LLM编写多GPU内核的难度。该基准基于50个真实CUDA通信问题,性能取决于通过NVLink高效移动数据。测试结果将于6月30日在aiDotEngineer World's Fair上由Simran Arora分享。AI模型ParallelKernelBenchTogether ComputeCUDANVLink基准测试推荐理由:Together Compute搞了个ParallelKernelBench,专门测LLM能不能写好复杂的多GPU内核,比单GPU难多了,感兴趣的话可以去现场听分享。原文
13:51Together AI@togethercomputeTogether AI 构建了基于 Parakeet 的语音转文本堆栈,每秒可处理约 302 秒音频,这是 Artificial Analysis 报告中最高速度因子。该堆栈在 Together 平台上运行,通过系统级优化实现低延迟转录。文章由 @FeelTheBeurn 详细拆解了背后的工程工作。AI模型ParakeetTogether AI语音识别推理优化速度基准推荐理由:Together AI 把 Parakeet 优化到每秒转写 302 秒音频,比别的服务快一大截,想搞语音识别的可以看看这篇系统调优拆解。原文
13:51Together AI@togethercomputeGLM-5.2模型在Together AI平台上运行,生成精美Web应用的成本仅需几美分。开发者可以以极低开销探索多个方向、比较不同版本,并保留最佳结果。这显著改变了传统的构建迭代循环,降低了实验门槛。AI模型GLM-5.2Together AI编程助手推荐理由:GLM-5.2在Together AI上几美分就能生成网页应用,开发者可以随便试不同版本,挑最好的,省钱又高效。原文
13:51Together AI@togethercomputeTogether AI 工程师将在 AI Engineer World’s Fair 举办 hands-on workshop,讨论 Agentic Coding 如何改变推理引擎需求。workshop 将讲解推理引擎的工作原理及服务生产级 agentic workloads 的要点。活动时间为6月29日上午9-11点,地点在 Room 2020。技巧Together AIAI Engineer World’s Fairagentic coding推理引擎智能体推荐理由:想了解 agentic coding 对推理引擎的新要求?Together AI 的这个实操 workshop 直接带你上手,时间是6月29日上午。原文
13:51Together AI@togethercomputeTogether AI 宣布其处理 token 量已达 400 万亿,认为这标志着开放模型在真实生产中进入规模采用阶段。团队将实际工作负载迁移到开放模型,是为了获得前沿质量、更好的 tokenomics 和更强的推理控制力。Together AI 提供基础设施支持这一转型。行业Together AI开放模型tokenomics推理生产部署推荐理由:400万亿 token 的量级,说明开放模型在真实生产里站稳了,看 Together AI 怎么搭台子。原文
13:51Together AI@togethercompute精选Together AI与5C合作部署NVIDIA GB300 NVL72系统,该系统采用高密度计算、先进冷却和AI优化存储。专为大规模推理和推理任务设计,提升基础设施的算力密度和能效。部署的重点是支撑下一代AI推理需求,尤其是长链推理场景。行业Together AI5CNVIDIA GB300 NVL72推理基础设施高密度计算4 个信源在谈推荐理由:Together AI和5C搞了套GB300 NVL72,算力密度高、散热好,专门跑大规模推理,适合那种费算力的长推理任务。原文
13:51Together AI@togethercompute精选ParallelKernelBench评估了LLMs编写多GPU内核的能力,包含87个来自Megatron-LM、DeepSpeed、DeepEP、TensorRT-LLM、NeMo-RL等真实代码库的问题。测试结果显示LLMs在单GPU内核上表现良好,但在多GPU场景下完全失败。该研究由Willy Chan等人完成,揭示了当前LLM在多GPU编程中的核心缺陷。AI模型ParallelKernelBenchMegatron-LMDeepSpeed多GPU基准测试推荐理由:新基准ParallelKernelBench发现,LLM写单GPU代码还行,但多个GPU一起就瞎了。想看看AI编程到底卡在哪?原文
13:51Together AI@togethercomputeGLM-5.2 现已上线,用户可通过 Together Chat 免费体验。无需 API 设置,直接选择模型即可开始使用。Together AI 在安全的北美基础设施上提供服务,方便开发者快速测试。该模型免费试用的入口已公开,降低了体验门槛。AI模型GLM-5.2Together AITogether Chat免费试用推荐理由:想试试GLM-5.2?现在Together Chat上就能免费用,不用搭API,选模型直接开聊。原文
13:51Together AI@togethercompute精选智谱AI的GLM-5.2模型在Together AI平台展示了端到端代码修复能力,可读取issue、推理场景并自动生成补丁。一年前这类任务还被认为是闭源模型(如GPT-4)的专属领域,如今开源模型已能胜任。该模型未公布具体基准分数,但实际演示表明其编程推理能力接近闭源水平。AI模型GLM-5.2Together AI推理模型编程助手开源模型推荐理由:开源模型GLM-5.2能自己读代码问题、推理并修复,以前只有闭源模型才能做到,现在用Together AI就能跑。原文
13:51Together AI@togethercompute精选Together AI 在 X 上演示语音智能体利用屏幕交互的功能。该方案整合了语音转文本(STT)、语音合成和推理,具体使用 Parakeet 进行 STT,MiniMax Speech 2.8 处理语音,MiniMax M3 进行推理。实时系统要求堆叠每一层保持低延迟。演示展示了完整循环在 Together AI 平台上运行。AI产品Together AIParakeetMiniMax Speech 2.8MiniMax M3语音智能体3 个信源在谈推荐理由:Together AI 搞了个语音智能体 demo,能边看屏幕边说话,用了 Parakeet、MiniMax Speech 2.8 和 M3,实时性很强。原文
13:51Jasper AI@heyjasperaiJasper宣布与Anthropic的Claude AI深度集成,推出Jasper IQ功能。该功能将品牌上下文、治理规则和机构知识直接注入Claude对话,使营销团队能在Claude中无缝调用品牌资产。Claude提供推理能力,Jasper IQ提供品牌智能,解决AI工具缺乏上下文感知的痛点。AI产品JasperClaudeAnthropic营销AI品牌上下文8 个信源在谈推荐理由:Jasper把品牌知识塞进Claude对话里了,营销团队用Claude写东西时不用再重复交代品牌背景,直接就能用上自家规则和素材。原文
13:51Jasper AI@heyjasperaiJasper 发布了 GEO Agent 和 GEO Hub,旨在帮助品牌优化在 AI 搜索中的可见性。据 Jasper 称,自然流量正在下降,而近 100% 的买家使用 AI 做购买决策。该工具将在下周的戛纳国际创意节上展示。Jasper 强调品牌需要新的策略来适应 AI 搜索的变化。AI产品JasperGEO AgentGEO HubAI搜索营销工具推荐理由:Jasper 出了个新工具,专门帮品牌在 AI 搜索结果里露脸。自然流量掉得厉害,这个 GEO 套件值得做营销的人看看。原文
13:51Jasper AI@heyjasperaiJasper发布了GEO Agent和GEO Hub,这是一套端到端的AI搜索优化系统。AI在评估品牌时,有60%的概率会误代表品牌。该工具帮助品牌通过监控、优化和持续改进,自主管理在AI搜索渠道中的形象。产品现已可用。AI产品JasperGEO AgentGEO HubAI搜索品牌优化推荐理由:Jasper刚发布了GEO Agent,能自动监控和优化你的品牌在AI搜索结果中的表现,解决60%的误判问题。原文
13:51François Chollet@fcholletFrançois Chollet提出自主性不是无需人类监督的行动能力。他认为自主性是学习能力而不依赖人类瓶颈。系统完全依赖人类训练数据和RL环境只是人类知识的印迹。这定义了真正的自主性。行业François Chollet自主性人类训练数据强化学习推荐理由:他说自主性不是单干,而是自己学,不用人类一步步教。对比常见误解,这个定义很清晰。原文
13:51Jasper AI@heyjasperaiJasper将Hugging Face基础设施用于其MONET系统的数据创建和存储。该方法针对随时间更新的大型训练数据集进行了优化。Jasper团队通过HF实现了更高效的数据管道管理。这一案例展示了HF在训练数据工作流中的实际应用。技巧JasperHugging FaceMONET数据管道模型训练推荐理由:看看Jasper怎么用Hugging Face当MONET的数据后台,对做大模型训练数据管道的团队很有启发。原文
13:51百度 AI Baidu@Baidu_Inc百度举办的 Build with MeDo 黑客马拉松吸引了全球超8000名开发者参与,创作从工具到AI体验的各类项目。获胜者 @Bioba_daniel 与 @_garvgupta 将于6月30日上午9点(UTC+8)直播分享他们的作品。该活动由百度联合 @Medo_CodeFree 推出,旨在推动AI应用的创意开发。行业Baidu黑客马拉松MeDoAI应用构建推荐理由:百度黑客松8000人参与,看看获胜者用MeDo做了什么,6月30日直播揭晓。原文
13:50宝玉@dotey福特过去三年召回350名资深工程师(gray beard),因AI质检系统表现不佳。他们负责带新人和调教AI工具,效果显著:福特16年后重夺JD Power新车质量榜主流品牌第一,预计节省约10亿美元成本。公司同时新增约10万项AI测试模拟更多路况。行业福特AI质检JD Power老师傅召回工程师1 个信源在谈推荐理由:福特干了件反直觉的事:AI搞不定的质检,请350位退休老师傅回来搞定。效果立竿见影,直接拿下了JD Power质量榜第一。原文
13:50François Chollet@fchollet精选François Chollet 指出,如果基准测试依赖静态数据集或训练时已知的静态分布,那么它本质上衡量的是记忆/检索,而非智能。他以 ARC 挑战为例,说明现有基准容易因数据泄露而失效,并强调真正智能需要应对未知变化。Chollet 呼吁社区设计更能体现泛化能力的测试,如基于动态环境的评估。行业François Chollet基准测试智能测评记忆检索ARC推荐理由:Chollet 点破了基准测试的痛点:很多高分模型只是背答案,不是真聪明。做评测的值得看看。原文
13:50François Chollet@fcholletFrançois Chollet(Keras创建者)在推文中指出编程不是关于代码,而是通过抽象层管理复杂性的艺术。他认为编程的核心在于构建函数、类等抽象层来降低认知负荷。AI在这一框架下仅是一种新的抽象工具,不应被过度神化。这一观点提醒程序员更关注架构设计而非语法细节。技巧François CholletKeras抽象层编程思想推荐理由:Chollet一句话点醒你:编程不是写代码,是搭抽象层。别把AI太当回事。原文
13:50François Chollet@fchollet精选François Chollet 指出,智能体编程(Agentic coding)迫使开发者设计清晰的 API 接口并编写完整的文档字符串。AI 代理无法阅读团队内部的隐式心理模型,只能依赖显式的 API 合约和 docstring。这要求接口规范必须精确、无歧义,文档覆盖所有输入/输出场景。对工程团队而言,这意味着需要投入更多时间在接口形式化设计上。技巧Agentic codingAPI设计文档字符串智能体编程助手推荐理由:François Chollet 说得很实在:想用AI代笔写代码,接口就得干净、文档得详细,别指望它懂你没写出来的默契。原文