08:30vLLM@vllm_projectSemiAnalysis对强化学习训练系统进行深度分析,指出效率关键在于匹配训练器与生成器的吞吐量。研究基于vLLM+verl框架,@KaichaoYou和Ao Shen进行了沙箱扩展实验。该工作建立在@KaichaoYou早期在OpenRLHF、verl、slime等框架的RL集成工作之上。论文SemiAnalysisvLLMverlOpenRLHFRL训练推荐理由:这篇分析硬核拆解RL训练效率瓶颈,vLLM+verl的沙箱实验值得一看。原文
17:21Aadit Sheth@aaditshAnthropic 预计实现首个盈利季度,利润达 5.59 亿美元。SemiAnalysis 分析指出,Claude Max 订阅每月提供价值 8000 美元的计算资源,但仅收费 200 美元,ChatGPT Pro 则提供 14000 美元价值。这种定价模式类似健身房,多数用户未用满额度,实际使用量可能仅占上限的 10-15%。重度用户由轻度用户补贴,而非公司亏损承担。行业AnthropicClaude MaxChatGPT Pro订阅模式SemiAnalysis10 个信源在谈推荐理由:揭秘 Claude Max 和 ChatGPT Pro 的定价套路原文