13:07@atomic_chat_hq@atomic_chat_hq精选智谱GLM-5.2与月之暗面Kimi K2.7 Code在三个物理模拟HTML5编程任务中对比。GLM-5.2使用12,640 tokens完成全部任务,包括台球碰撞、弹簧上方方块弹跳和高尔顿板,粒子和动量表现正确。Kimi K2.7 Code仅用7,420 tokens,但三个场景均出现严重错误:方块穿透弹簧、台球碰撞不真实、高尔顿板珠子重叠。评测显示GLM-5.2在物理模拟细节和精度上显著优于Kimi K2.7 Code。AI模型GLM-5.2Kimi K2.7智谱代码生成物理模拟推荐理由:智谱的GLM-5.2写物理模拟代码完胜Kimi K2.7,三个场景全部精准,Kimi翻车在弹簧穿透和球乱撞上。原文
13:02@atomic_chat_hq@atomic_chat_hq精选Fable 5 模型在三个真实物理模拟任务(混沌双摆、高尔顿板、WCSPH 旋转桶中水)中生成的 HTML5 仿真效果优于 Opus 4.8。水模拟中,Fable 5 生成的水体更连续稳定,而 Opus 4.8 在器壁附近出现较大空隙、粒子散落且流体不稳定。Fable 5 的生成成本为 3.35 美元(68.7k tokens,耗时 14 分 47 秒),Opus 4.8 为 0.93 美元(38.9k tokens,耗时 8 分 10 秒)。AI模型Fable 5Opus 4.8物理模拟代码生成HTML510 个信源在谈推荐理由:Fable 5 写物理仿真比 Opus 4.8 更扎实,尤其水粒子效果更真实,虽然贵了点但值得一试。原文
20:29AlphaSignal@AlphaSignalAI精选MPMWorlds是一个包含95,000个2D仿真视频的基准,覆盖液体、雪、沙子和弹性体。模型观看2.5秒场景后预测后续运动。代码生成方法能保持长期物理稳定性,但无法从帧中读取位置,隐藏坐标后精度骤降。扩散模型可捕获短期几何,但物体随时间消失、运动不真实。混合两种方法的简单门控机制超越单一模型。论文MPMWorlds物理模拟代码生成扩散模型视频理解推荐理由:这篇论文用MPMWorlds测试了AI看视频写物理代码的能力,发现代码生成稳但缺位置感知,扩散模型短时准但长期漂移,混合模型效果最好。原文
10:34AI Will@FinanceYF5精选Claude Fable 5 基于物理第一性原理构建了太阳系模拟,而非仅制作轨道动画。它推导出行星运动规律,并成功预测了一次日食。该模型还展示了黑洞模拟,体现了其科学推理能力。AI模型Claude Fable 5物理模拟推理模型日食预测10 个信源在谈推荐理由:Claude Fable 5 用物理原理预测日食原文
11:54AI Will@FinanceYF5一条推文展示了 Fable 5 和 Opus 4.8 在相同 prompt 下生成的 5000 个天体太空模拟结果对比。两者在模拟的细节、真实感和物理准确性上存在显著差异,Fable 5 的表现明显优于 Opus 4.8。该对比直观反映了当前 AI 模型在复杂物理场景生成能力上的差距,对关注 AI 生成内容质量和模型选型的开发者有直接参考价值。AI模型Fable 5Opus 4.8太空模拟模型对比物理模拟10 个信源在谈推荐理由:做 AI 生成或物理模拟的开发者,这个对比能帮你快速判断哪个模型更适合复杂场景,值得点开看差距有多大。原文
11:04Google Gemini App@GeminiAppGoogle 的 Gemini Omni 模型展示了从屏幕视频输入到现实物理模拟的端到端能力。用户只需一个提示词,模型就能理解视频内容,应用物理规则并生成无缝的新运动。该功能将视频理解与物理仿真结合,为创意内容生成和交互式应用开辟了新可能。目前已在 X 平台开放试用,用户可分享自己的实验案例。AI产品Gemini Omni视频生成物理模拟Google创意工具推荐理由:视频创作者和 AI 应用开发者可以直接用 Gemini Omni 把屏幕内容变成物理模拟视频,省去传统 3D 建模和动画流程,值得一试。原文