03:05@koltregaskes@koltregaskes精选前沿模型成本上升、令牌使用量攀升以及近期禁令,使企业自建AI变得更加必要。通过下载Llama或Qwen等开源模型,使用LoRA在自有数据上微调,部署在自有基础设施,可一次性计算成本取代按席收费。Hugging Face和LoRA已降低技术门槛,关键在于管理层是否将其视为基础设施投资而非普通软件开支。行业LlamaQwenLoRAHugging Face微调推荐理由:前沿模型越来越贵还被禁,自己微调Llama或Qwen更可控,一次性投入省月费,数据也安全。原文
08:51Sakana AI@SakanaAILabsSakana AI 研究科学家 Rujikorn (Tan) Charakorn 在 MLCollective 的 DLCT 期刊俱乐部上介绍了 Doc-to-LoRA 方法。该方法利用超网络生成 LoRA 权重,通过成本分摊降低计算开销。演讲还讨论了 Doc-to-LoRA 的未来方向,并引发了热烈讨论。论文Sakana AIDoc-to-LoRALoRA微调超网络推荐理由:Sakana AI 介绍了 Doc-to-LoRA,用超网络一键生成 LoRA 权重,微调更省钱。原文
03:55LangChain@LangChainAILangChain测试显示,Alibaba Qwen基础模型配合良好提示在感知错误分类任务上性能接近前沿模型。使用LoRA SFT微调后,模型性能接近或超过前沿模型。实验表明微调能使开源模型与顶级闭源模型竞争。AI模型QwenAlibabaLoRA微调开源模型推荐理由:LangChain实测:Qwen基础版+好提示就能追平顶级模型,微调后甚至超越。开源模型潜力很大!原文
05:40rohanpaul_ai@rohanpaul_ai精选一篇论文提出 SIA(自我改进 AI)框架,让 AI 通过观察任务代理的表现,自动调整外部设置(如提示、工具、重试规则)或更新模型权重(通过 LoRA 适配器)。在三个差异极大的任务(中文法律罪名分类、GPU 内核速度调优、单细胞 RNA 去噪)上,结合设置与权重更新的版本均优于仅改进设置的方法。这表明,除了优化提示和工具,让模型通过任务反馈学习模式能带来额外提升。论文自我改进LoRA任务代理自动化AI 研究推荐理由:这项研究解决了 AI 自我改进依赖人工调参的瓶颈,做自动化 Agent 或模型微调的团队值得关注——SIA 的 LoRA 更新思路能低成本让模型学会任务模式,比只改提示更有效。原文
02:07Ideogram@ideogram_aiIdeogram AI 在 X 上发文称,其社区在一周内构建了训练器、提示编译器、LoRA 和完整工作流。该平台邀请用户分享最佳生成作品,并将纳入下一期社区亮点帖。这展示了 Ideogram 生态的活跃度和用户创造力,也反映了 AI 图像生成领域社区驱动的快速迭代趋势。AI产品Ideogram社区生态训练器LoRA工作流推荐理由:Ideogram 社区一周内产出训练器、LoRA 等工具,说明其生态正快速成熟。做 AI 图像生成的创作者可以关注这些社区资源,直接提升工作流效率。原文
04:18Fireworks AI@FireworksAI_HQ精选Fireworks 训练平台持续扩展,现已支持美国领先的开源权重模型 Nemotron 3 Ultra 进行后训练。用户可以通过 LoRA 或全参数微调进行 SFT 和 DPO,且训练与推理使用同一基础设施。这意味着训练出的模型可以直接部署,无需额外迁移。该平台旨在简化从训练到上线的流程,适合需要定制化模型的团队。AI产品FireworksNemotron 3 Ultra模型微调LoRA训练平台9 个信源在谈推荐理由:Fireworks 把 Nemotron 3 Ultra 的后训练和推理放在同一基础设施上,做模型微调的团队可以直接训练并上线,省去模型迁移的麻烦,值得关注。原文
23:58AK@_akhaliq精选Code2LoRA 提出利用超网络为代码语言模型生成 LoRA 适配器,以应对软件演化中的代码变更。该方法在代码补全、代码搜索等任务中无需全量微调即可适配新版本代码。实验显示其适配速度比传统方法快 10 倍以上,且性能接近全量微调。相关工作已在多个代码基准上验证有效性。AI模型Code2LoRA代码语言模型LoRA超网络软件演化1 个信源在谈推荐理由:用超网络给代码模型打补丁原文
19:59berryxia@berryxia开源生图软件 Draw Things 用户发现,将 Z-Image-Fun-Lora-Distill(专为 Z-Image Base 训练的 2/4/8 步版本)与 Z Image Turbo 模型搭配使用,可将原本需要 8-9 步的生成过程缩短至 3-4 步,大幅提升本地生成速度,同时保持画质和细节稳定。这一意外组合打破了本地出图慢的瓶颈,对依赖 Draw Things 进行本地生成的用户是实用突破。详细配置和 LoRA 下载链接已在原帖评论区公开。AI产品Draw ThingsZ Image TurboLoRA本地生图开源软件推荐理由:这个组合直接把本地生图速度天花板顶高了一截,每天用 Draw Things 或 Z Image Turbo 的创作者可以立刻试试,3-4 步出图不再是梦。原文