13:51Together AI@togethercompute精选随着Token使用量爆发式增长,模型选择已从技术决策变为产品策略。团队正在测试GLM-5.2等新模型,追求前沿质量与更好的Token经济学。Together AI正在构建面向开源模型未来的推理层,以提供更可控的成本、数据和部署选项。行业GLM-5.2Together AI推理层开源模型Token经济学推荐理由:团队开始用GLM-5.2替换闭源模型?Together AI的推理层让开源模型更可控,想省钱又保质量可以看看。原文
13:51Together AI@togethercomputeTogether AI 宣布其处理 token 量已达 400 万亿,认为这标志着开放模型在真实生产中进入规模采用阶段。团队将实际工作负载迁移到开放模型,是为了获得前沿质量、更好的 tokenomics 和更强的推理控制力。Together AI 提供基础设施支持这一转型。行业Together AI开放模型tokenomics推理生产部署推荐理由:400万亿 token 的量级,说明开放模型在真实生产里站稳了,看 Together AI 怎么搭台子。原文
13:51Together AI@togethercompute精选Together AI与5C合作部署NVIDIA GB300 NVL72系统,该系统采用高密度计算、先进冷却和AI优化存储。专为大规模推理和推理任务设计,提升基础设施的算力密度和能效。部署的重点是支撑下一代AI推理需求,尤其是长链推理场景。行业Together AI5CNVIDIA GB300 NVL72推理基础设施高密度计算5 个信源在谈推荐理由:Together AI和5C搞了套GB300 NVL72,算力密度高、散热好,专门跑大规模推理,适合那种费算力的长推理任务。原文
13:51François Chollet@fcholletFrançois Chollet提出自主性不是无需人类监督的行动能力。他认为自主性是学习能力而不依赖人类瓶颈。系统完全依赖人类训练数据和RL环境只是人类知识的印迹。这定义了真正的自主性。行业François Chollet自主性人类训练数据强化学习推荐理由:他说自主性不是单干,而是自己学,不用人类一步步教。对比常见误解,这个定义很清晰。原文
13:51百度 AI Baidu@Baidu_Inc百度举办的 Build with MeDo 黑客马拉松吸引了全球超8000名开发者参与,创作从工具到AI体验的各类项目。获胜者 @Bioba_daniel 与 @_garvgupta 将于6月30日上午9点(UTC+8)直播分享他们的作品。该活动由百度联合 @Medo_CodeFree 推出,旨在推动AI应用的创意开发。行业Baidu黑客马拉松MeDoAI应用构建推荐理由:百度黑客松8000人参与,看看获胜者用MeDo做了什么,6月30日直播揭晓。原文
13:50宝玉@dotey福特过去三年召回350名资深工程师(gray beard),因AI质检系统表现不佳。他们负责带新人和调教AI工具,效果显著:福特16年后重夺JD Power新车质量榜主流品牌第一,预计节省约10亿美元成本。公司同时新增约10万项AI测试模拟更多路况。行业福特AI质检JD Power老师傅召回工程师1 个信源在谈推荐理由:福特干了件反直觉的事:AI搞不定的质检,请350位退休老师傅回来搞定。效果立竿见影,直接拿下了JD Power质量榜第一。原文
13:50François Chollet@fchollet精选François Chollet 指出,如果基准测试依赖静态数据集或训练时已知的静态分布,那么它本质上衡量的是记忆/检索,而非智能。他以 ARC 挑战为例,说明现有基准容易因数据泄露而失效,并强调真正智能需要应对未知变化。Chollet 呼吁社区设计更能体现泛化能力的测试,如基于动态环境的评估。行业François Chollet基准测试智能测评记忆检索ARC推荐理由:Chollet 点破了基准测试的痛点:很多高分模型只是背答案,不是真聪明。做评测的值得看看。原文
13:50François Chollet@fcholletFrançois Chollet 指出当前 AI 技术栈存在 3-4 个数量级的数据效率低下和 4-5 个数量级的计算效率低下。他预测 2040 年的 AI 将更接近最优,而符号学习(symbolic learning)是实现这一目标的关键路径。Chollet 认为现有深度学习架构在数据和算力利用上远未达到理论极限。行业François Chollet符号学习深度学习效率AI趋势推荐理由:AI 大神 Chollet 直言现在的深度学习数据效率差 1000 倍、算力差 10000 倍,未来要靠符号学习翻盘。原文
13:50阿里云 Alibaba Cloud@alibaba_cloud在Flink Forward Asia Shenzhen 2026上,NVIDIA的Chuan Chen介绍了与阿里云的技术合作。双方通过CUDA库加速Apache Flink的多模态数据流处理。这一开源协作实现了端到端高性能多模态流式架构,适用于AI评论、实时图文流和交互式问答。行业NVIDIAAlibaba CloudApache FlinkCUDA多模态6 个信源在谈推荐理由:NVIDIA和阿里云用CUDA把Flink的多模态数据处理速度拉满了,想做实时AI评论或图文问答的可以看看这个架构。原文
13:50阿里云 Alibaba Cloud@alibaba_cloud在Flink Forward Asia Shenzhen 2026上,阿里云CTO李飞飞提出“数据重力”将成为AI代理时代的主导概念。他强调AI必须解决复杂企业工作流并创造实际业务价值,而非仅追求模型智能。该观点针对Apache Flink等实时数据处理生态中的AI集成场景,呼吁行业关注AI在企业级应用中的落地效率。行业Alibaba CloudApache FlinkData Gravity智能体企业工作流推荐理由:阿里云CTO李飞飞在Flink Forward大会上点名数据重力概念,说的是AI怎么真正帮企业干活,不是光比模型分数。原文
13:50阶跃星辰 Stepfun@Stepfun_AIStepFun(阶跃星辰)推出初创公司计划,为早期AI团队提供支持。入选团队可获得API额度、专属生态系统支持、联合营销机会、展示位置及合作伙伴引荐。该计划面向构建多模态应用和智能体系统的团队。申请现已开放。行业StepFun多模态智能体初创计划推荐理由:StepFun给早期AI团队送API额度、资源和曝光,做多模态或智能体项目的小伙伴可以试试,链接在推文里。原文
13:49Microsoft AI@MicrosoftAI微软AI在X上发布视频,展示团队成员如何解决机器学习中的难题。视频中研究人员探讨了改进LLM训练效率的新思路。团队还分享了在推理模型优化上的实践。行业Microsoft AI推理模型训练优化推荐理由:看看微软AI团队怎么解决实际技术难题,了解模型背后的人原文
13:49Google Labs@GoogleLabsGoogle Labs 的 Project Genie 在2025年戛纳创意节上获得AI Craft类别的全场大奖(Grand Prix)。该奖项表彰其在AI创意领域的卓越表现。这是Google Labs社区共同参与的结果。行业Project GenieGoogle Labs戛纳创意节AI创意推荐理由:Google Labs的Project Genie拿了戛纳大奖,AI Craft类别最高荣誉,看看他们怎么用AI做创意。原文
13:49Ethan Mollick@emollickOpenAI目前尚未推出GPT-6模型。有观点猜测该标签可能被保留给更先进的下一代模型。GPT-4o等现有模型已覆盖多种能力。OpenAI的模型命名策略尚未公开说明。行业GPT-6OpenAI模型迭代9 个信源在谈推荐理由:看看大家对OpenAI下一代模型命名的猜想,挺有意思的,虽然没干货但能勾起好奇心。原文
13:48岚叔@lufzzliz推文作者表达了对xAI下一代模型Grok 4.5的强烈期待。作者认为xAI可能拥有过多计算资源用于Grok 4.5的训练。希望Grok 4.5能训练得更出色并支持SpaceX。行业Grok 4.5xAISpaceX模型训练4 个信源在谈推荐理由:这位网友对Grok 4.5很有信心,还调侃xAI显卡太多不如自己用。看看民间对xAI新模型的态度。原文
13:48岚叔@lufzzlizK神定义LLM UI/UX第三次变革,将LLM视为独立可持续运行的系统,拥有全组织工具和上下文,与人协同。作者基于Pi实现组织内agent交互,支持不同群组不同的记忆、知识库、技能和模型。该系统可应用于客户群交互,实现高效丝滑协同。行业Pi智能体LLM协同推荐理由:K神提出了新的LLM交互思路,作者已经用Pi搭建了能按群组定制的智能体系统,对企业协作很有参考价值。原文
12:24Shashikant Kore@kshashi谷歌在AI竞赛中看似落后,但根源可能是内部资源分配问题。现有产品的算力需求与DeepMind对前沿模型(如Gemini系列)的研发需求产生竞争。这种内耗导致谷歌难以集中资源冲刺顶级模型,而非技术能力不足。行业GoogleDeepMindAI竞赛算力资源分配推荐理由:一句话解释谷歌为什么没跑赢AI竞赛——不是技术不行,是自家产品抢算力。内耗比对手更头疼。原文
11:20AI产品黄叔@PMbackttfuture这篇推文列出了关于 Agent(智能体)使用 QQ 邮箱的 10 条观察。核心观点包括:邮箱是 Agent 的数字身份证,与个人邮箱隔离;收邮件是杀手级场景;Agent 发邮件前需用户确认,这是信任训练;最终局是 A2A 通信。文章认为 QQ 邮箱此举抢的是通信层,真正的对手是 Cloudflare。行业QQ Mail智能体A2A通信数字身份推荐理由:看看这篇对 Agent 与 QQ 邮箱结合的犀利分析,10 条观察直击本质,尤其是把邮箱当作数字身份证和 A2A 通信的终局思考。原文
09:15shao__meng@shao__meng精选Boris Cherny 基于 Claude Code 团队经验,提出未来产品团队的五种角色原型:Prototyper(原型师)、Builder(构建者)、Sweeper(优化清理者)、Grower(增长者)、Maintainer(维护者)。他指出角色与岗位头衔无关,多数人横跨 2-3 个角色。产品阶段决定角色配比:新/未达 PMF 需 1+2+3,增长期需 2+3+4+少量 5,成熟期需 3+4+5+少量 2。这一框架强调从职能分工转向价值流分工,团队健康度取决于角色配比与阶段匹配度。行业Claude CodeBoris ChernyAnthropic团队角色产品团队10 个信源在谈推荐理由:Boris Cherny 分享了 Claude Code 团队的经验,把未来团队分成五种角色,帮你重新思考招人和分工,比传统职能划分更实用。原文
05:15Lenny Rachitsky@lennysanOpenAI的Codex桌面应用自2月以来使用量增长6倍,周活跃用户突破500万。几乎100%的OpenAI员工(不仅工程师)日常使用Codex。负责人Andrew Ambrosino认为AI在设计方面表现糟糕,产品品味才是核心竞争力。他指出如果Codex在11月而非2月发布,很可能失败——同一产品,仅模型不同。行业OpenAICodex产品设计AI应用10 个信源在谈推荐理由:OpenAI Codex用户量翻了6倍,500万人周活!负责人聊AI为什么做不好设计,以及他们怎么用品味做产品。原文
02:45Gary Marcus@GaryMarcus据FT报道,Google因计算资源短缺限制了Meta对Gemini的使用。报道指出Google在向Meta出售Gemini时无法像预期那样自由。计算能力仍是AI领域最稀缺的资源。行业GoogleMetaGemini计算资源推荐理由:Google资源不够,连Meta都用不上Gemini了,这背后是算力争夺战。原文
00:42Geoffrey Hinton@geoffreyhintonGeoffrey Hinton 在 X 上推荐了 Adam Brown 关于 AI 对未来物理学影响的讲座。该讲座在 YouTube 发布,已获 1880 次观看。Hinton 的推文获得 4 次转发和 12 次点赞。行业Geoffrey HintonAdam BrownAI物理学术讲座推荐理由:Hinton 都说好的讲座!Adam Brown 聊 AI 如何改变物理学,快去YouTube看看。原文
00:15AI Engineer@aiDotEngineer全球最大AI行业博览会2026 World's Fair门票已全部售罄,包括CTO/VP AI领导力track、研讨会及所有晚鸟票。主办方开放有限溢入场券,不保证座位,先到先得。旧金山各处仍有65场免费活动可参加。目前参会者已超6000人,预计达到7000人上限。行业World's FairAI展会旧金山售票推荐理由:全球最大AI博览会票卖光了,但还有65场免费活动可以蹭。想感受最前沿的AI氛围?趁溢入场券还没抢完赶紧行动。原文
00:01Clement Delangue@ClementDelangue精选Hugging Face CEO Clement Delangue认为,当前最危险的AI系统是闭源前沿API模型(如通过编程助手分发的LLM),它们由巨头秘密构建、完全黑箱、控制力集中且分发到数亿用户。而开源模型风险低几个数量级:易于分析、能力较弱、传播更可控,且保护者与攻击者平等获取。监管前沿API只需针对少数巨头,成本低且容易执行;监管开源则会伤害小企业、研究者、大学等群体,并降低透明度。行业Hugging Face开源模型AI监管前沿模型推荐理由:Hugging Face CEO直言政府该管闭源API而不是开源模型,点出了监管争论中被忽略的黑箱风险。原文
22:27NVIDIA AI@NVIDIAAINVIDIA、Stripe 与 Nous Research 联合举办 The Hermes Agent Accelerated Business Hackathon,要求开发者用 Hermes Agent 构建能赚钱、花钱、运营业务的智能体。比赛使用 NVIDIA NemoClaw 安全运行、Nemotron 3 Ultra 快速推理,以及 Stripe Skills 实现支付和资源采购。奖品包括第一名 $10,000 现金 + DGX Spark + $5,000 Stripe Credits,第二名 $5,000 现金 + DGX Spark + $3,000 Stripe Credits,第三名 $2,500 现金 + DGX Spark + $1,000 Stripe Credits。参赛者需在 6 月 30 日(周二)前提交 1-3 分钟 demo 视频和简短说明至 Discord 及表单。行业NVIDIAStripeNous ResearchHermes AgentDGX Spark智能体黑客松7 个信源在谈推荐理由:想赢一台 DGX Spark 吗?用 Hermes Agent 造个自动赚钱的 AI 公司,前三名都有现金加硬件,截止 6 月 30 日,快上车。原文
15:45Jerry Liu@jerryjliu0Jerry Liu(LlamaIndex创始人)在推特上讨论AI Agent与SaaS的关系。他认为Agent像人类一样有核心通信接口,如chat、voice、slack。SaaS软件则需要根据具体用途定制接口,例如ticket tracking、CRM。目前SaaS公司都在构建Agent以捕捉工作自动化价值,但两者接口会随时间解绑。行业Jerry LiuLlamaIndexAI AgentSaaS智能体3 个信源在谈推荐理由:Jerry Liu说Agent和SaaS会分家,不是SaaS死了而是接口不同。看看他的观点。原文
12:19AI Will@FinanceYF5a16z分析了56家使用Rillet(AI原生ERP)公司总计940万条总账数据,发现手工记账仅占0.14%。月底结账的冲刺行为大幅减少,传统月末加班现象基本消失。该研究显示AI自动化已深度渗透财务流程,结账效率显著提升。行业Rilleta16zERPAI财务自动化结账推荐理由:a16z拿56家公司940万条真实数据告诉你,AI ERP把手工记账干到只剩0.14%,月底再也不用通宵了。原文
12:19AI Will@FinanceYF5AGI Summit SF 2026 定于2026年7月18-19日在旧金山举行,预计吸引15000名参会者、200余位演讲嘉宾、500多家VC机构和来自30多个国家的代表。参与方包括OpenAI、Anthropic、Google DeepMind和BlackRock。Day 2恰逢世界杯决赛日。行业AGI Summit SF 2026OpenAIAnthropicAI会议行业活动10 个信源在谈推荐理由:硅谷最密集的AI会议来了,OpenAI、Anthropic、DeepMind全到,7月去旧金山看看。原文
12:19AI Will@FinanceYF5AGI Summit SF 2026 确认邀请微软、Coinbase、OpenAI、Google DeepMind、a16z 系代表出席。至少涉及五家顶尖AI与科技机构,阵容覆盖大模型、加密货币和风险投资领域。未公布具体议程和日期。行业微软OpenAIGoogle DeepMinda16zAGI峰会10 个信源在谈推荐理由:今年AGI峰会嘉宾巨强,微软OpenAI谷歌DeepMind都来了,想看业界大咖聊AGI得关注这波原文
10:58AI Will@FinanceYF583°微软CEO Satya Nadella讨论了如何构建支持2000万个AI Agent与人类员工协同工作的基础设施。该基础设施旨在使Agent能自动执行任务、访问企业数据并参与工作流。这一规模部署标志着微软在企业级Agent应用上的重大推进。Nadella强调了底层架构需具备弹性、安全性和可管理性。行业MicrosoftAgent智能体基础设施推荐理由:微软要为2000万个Agent搭基础设施,听听CEO怎么说,这是企业AI落地的实打实案例。原文
09:49AI Will@FinanceYF5Anuj在2026年4月从OpenAI跳槽至Meta,但仅几个月后便重返OpenAI。SemiAnalysis爆料称其可能被Meta调岗至数据标注团队,导致离职。此事引发对Meta人才流失和组织管理的质疑。行业OpenAIMetaAnuj人才流动行业动态10 个信源在谈推荐理由:OpenAI核心人员跳槽Meta后闪电回归,背后可能涉及Meta内部重组问题,值得吃瓜。原文
09:49AI Will@FinanceYF5OpenAI 的计算技术负责人在 2026 年 4 月加入 Meta,但仅几个月后便重返 OpenAI。有传闻称该负责人(Anuj)在 Meta 期间被重组至数据标注岗位,这可能成为其离开的原因。这一快速离职引发了外界对 Meta 内部管理变化的讨论。行业OpenAIMetaAnujAI人才流动10 个信源在谈推荐理由:OpenAI 一位技术高管去 Meta 只待了几个月就跑回来了,背后可能是岗位被调去做数据标注,看看行业内的人事暗流。原文
09:19Gary Marcus@GaryMarcus福特硬件工程副总裁承认,公司错误地认为AI和调整后的设计需求能产出高质量产品,导致2020年以来裁员超过5000人后,今年召回汽车数量居美国车企首位。为弥补损失,福特重新雇佣、新聘或晋升了350名经验丰富的工程师。JD Power质量排名中,福特近20年来首次登顶,但仅在召回人类工程师之后。CEO Jim Farley仍坚持AI将取代美国一半白领,尽管实际案例证明AI无法替代350名工程师而不导致产品崩溃。行业福特AI替代工程师召回质量排名Klarna效应2 个信源在谈推荐理由:福特用AI替代工程师,结果质量崩了,不得不请回350人。看看现实版AI翻车案例,老板还嘴硬说AI要取代一半白领。原文
05:20Aravind Srinivas@AravSrinivas推文预测未来每家企业都会构建自身的模型-测试-沙箱-评估飞轮,并优化每瓦特token价值。核心驱动力是企业对其领域、客户和工作流拥有独特的隐性知识。该观点获得630个赞和35339次浏览。行业Perplexity企业AI模型评估飞轮token效率隐性知识推荐理由:Perplexity CEO预测企业AI的未来是定制评估飞轮和能耗优化,看看这个趋势分析原文
04:49OpenRouter@OpenRouterAIOpenRouter 最新洞察文章指出,四个开源权重模型(未公开具体名称)已达到能驱动真实智能体管道的水平。文章分析了为何公司在6月选择这些模型,强调它们在自主任务执行中的表现。该观察基于 OpenRouter 平台的实际使用数据。行业OpenRouter智能体开源模型推荐理由:OpenRouter 发博说四个开源模型已经能跑真实 agent 流程了,搞智能体的朋友可以看看为什么公司选它们。原文
01:33berryxia@berryxia76°Anthropic在2026年4月发布Fable模型,因性能过强仅限合作伙伴使用,随后美国政府要求限制非美国公民访问,导致模型数天内下线。OpenAI原定发布的GPT-5.6为避免类似禁令,被美国政府要求错开时间,仅先向可信合作伙伴开放。硅谷投资人比尔·格利指出Anthropic通过游说而非诉讼获取竞争保护,导致初创公司和开源实验室无法获取前沿模型。OpenAI研究员Noam Brown称GPT-5.6编程能力极强,但公司在博客中优先强调安全和对齐测试,而非性能。行业AnthropicOpenAIGPT-5.6FableAI监管10 个信源在谈推荐理由:这篇分析揭露了Anthropic如何通过恐惧营销推动非正式监管,导致OpenAI GPT-5.6延迟发布、Fable模型被禁,还影响开源竞争,值得一看。原文
01:33berryxia@berryxia78°苹果Vision产品组副总裁Paul Meade下周离开苹果,加入OpenAI硬件部门,他负责包括计划2026年发布的无屏幕AI眼镜和增强现实眼镜在内的所有智能眼镜开发。OpenAI正组建硬件团队,据郭明錤分析甚至计划推出配备联发科天玑9600芯片的智能手机,由立讯精密代工。另一则消息:苹果首款触控OLED MacBook将使用现有M5 Pro和M5 Max芯片,最早2027年底发布M7版本。过去一年苹果多名高管流失,但Paul Meade去向OpenAI是首次。行业Paul MeadeOpenAIApple智能眼镜MacBook10 个信源在谈推荐理由:苹果做眼镜的副总裁跑去OpenAI搞硬件了,后者还想做手机对标iPhone。得看看AI硬件怎么卷。原文
01:25宝玉@dotey6 月 26 日,OpenAI 正式从 ChatGPT 中移除 GPT-4.5,这是 GPT-4 系列最后一个消费端模型。OpenAI 仅给了 30 天过渡期(5 月 28 日公告,6 月 26 日下线),已有对话自动切换到 GPT-5.5。API 端不受影响,开发者仍可调用 GPT-4.5。此前 GPT-4o 于今年 2 月退役,当时日活用户仅 0.1%(约 80 万人)仍在使用。下一个退役的是 o3,8 月 26 日下线,过渡期 90 天。行业GPT-4.5OpenAIChatGPT模型退役GPT-4系列10 个信源在谈推荐理由:GPT-4.5 下线了,想用它的好文风只能走 API。o3 也快走了,记得 8 月 26 日前备份。原文
15:24Marc Andreessen@pmarcaJoshua Achiam指出FLOP计算阈值作为AI监管标准一直存在根本缺陷,因为FLOP与模型能力(尤其是危险能力)并不直接相关,且前沿模型所需FLOP因算法进步而逐步降低。他批评欧盟AI法案(1047)等政策忽略了这些已知问题,导致政策制定混乱。Achiam认为AI安全社区将混乱归咎于Marc Andreessen等外部批评者是不公正的,社区自身存在战略失误。他强调更合理的政策应基于具体能力风险(如网络攻击)而非算力阈值。行业Joshua AchiamMarc AndreessenFLOP阈值AI安全政策1047法案推荐理由:Joshua Achiam用亲身经历解释为什么FLOP门槛管不住AI风险,政策争论背后的真实问题是什么原文