14:21IT之家(博客/媒体)Sakana AI 推出多智能体编排系统 Sakana Fugu,它是一个语言模型,可根据任务智能调用包括自身在内的最适模型,并封装为单一 API。初始提供平衡型 Fugu 和面向复杂问题的 Fugu Ultra 两种版本。Sakana AI 宣称 Fugu Ultra 在部分工程、科学和推理基准测试中可提供与 Anthropic Fable 5 / Mythos Preview 相当甚至更优的性能。该系统帮助用户避免对单一供应商的依赖。AI模型Sakana FuguSakana AIAnthropicFable 5模型编排10 个信源在谈推荐理由:日本 Sakana AI 搞了个 Fugu 系统,能自动选最好的模型干活,Fugu Ultra 在某些测试上比 Anthropic Fable 5 还强,值得看看。原文
02:51marktechpost@Asif Razzaq精选73°Sakana AI 推出 Sakana Fugu,一种编排模型,可将用户任务动态路由至可替换的前沿 LLM 池。其增强版 Fugu Ultra 在多个编码、推理和智能体基准测试中取得领先成绩。该模型通过选择最适合的模型来提升任务效率,无需用户手动切换。AI模型Sakana AISakana Fugu编排模型智能体推理模型1 个信源在谈推荐理由:Sakana AI 搞了个 Fugu 编排模型,能自动在多个前沿 LLM 之间切换最优选择,在编码和推理基准上表现很突出。原文
16:33Decoder@Matthias BastianSakana AI推出了Fugu系统,该系统能动态协调多个大型语言模型(如GPT-4、Claude等),在Fable和Mythos基准测试上达到与Anthropic的Fable 5相当的性能。Fugu通过实时路由和模型组合,减少了对单一AI提供商的依赖。测试中,Fugu在Fable基准上得分超过Anthropic的Fable 5,并在Mythos基准上表现出色。AI模型Sakana AIFuguAnthropicFable多模型协作10 个信源在谈推荐理由:日本AI公司Sakana AI搞了个新系统叫Fugu,能让不同模型一起干活,不用只靠一家供应商。效果还跟Anthropic的Fable 5差不多,值得看看怎么做到的。原文
09:26marktechpost@Asif RazzaqSakana AI 发布了首个商业产品 Sakana Marlin,基于 AB-MCTS 和 AI Scientist 工作流。该智能体可自主运行最长 8 小时,一次任务生成多达 100 页的研究报告并附带幻灯片。它面向企业用户,旨在自动化深度调研与文档生成流程。AI产品Sakana AISakana MarlinAB-MCTS智能体研究报告自动生成推荐理由:Sakana AI 搞了个 Marlin,能自动跑最长 8 小时,输出上百页研究报告还带幻灯片,适合懒得写长报告的人。原文
22:09Decoder@Tomislav Bezmalinović精选日本 AI 初创公司 Sakana AI 宣布成立专门研究递归自改进(RSI)的实验室,目标是让 AI 能够迭代地自我提升。该公司由 Transformer 论文合著者 Llion Jones 联合创立,认为 RSI 是大型美国实验室之间算力军备竞赛的替代方案。Anthropic 则警告这种技术存在控制风险。Sakana AI 的实验室将专注于开发能够自主改进自身代码和架构的 AI 系统,从而减少对大规模计算资源的依赖。这一方向可能改变 AI 发展的范式,从“堆算力”转向“用智能提升智能”。AI产品递归自改进Sakana AI算力军备竞赛AI 实验室Transformer10 个信源在谈推荐理由:Sakana AI 的递归自改进路线为算力受限的团队提供了新思路——用算法效率替代硬件堆叠,做 AI 研究的开发者值得关注这个方向。原文
08:59marktechpost@Asif Razzaq精选Sakana AI 提出 DiffusionBlocks 框架,将残差网络中的每一层更新解释为逆向扩散去噪步骤,从而将网络分解为多个独立可训练的块。这种方法允许每个块单独训练,无需端到端反向传播,降低了训练复杂度和内存需求。实验表明,DiffusionBlocks 在图像生成任务上达到与标准残差网络相当的性能,同时训练效率更高。该工作为扩散模型与残差网络的结合提供了新思路,有望推动大规模模型的分布式训练。论文扩散模型残差网络块式训练Sakana AI图像生成推荐理由:Sakana AI 这个框架解决了残差网络训练中梯度回传的瓶颈,做大规模生成模型或分布式训练的团队值得关注——它让每个模块可以独立优化,直接降低显存和通信开销。原文