全部 AI 动态 · AI 热点

6月30日

03:05

03:05

@koltregaskes@koltregaskes

精选

前沿模型成本上升、令牌使用量攀升以及近期禁令，使企业自建AI变得更加必要。通过下载Llama或Qwen等开源模型，使用LoRA在自有数据上微调，部署在自有基础设施，可一次性计算成本取代按席收费。Hugging Face和LoRA已降低技术门槛，关键在于管理层是否将其视为基础设施投资而非普通软件开支。

行业 Llama Qwen LoRA Hugging Face 微调

推荐理由：前沿模型越来越贵还被禁，自己微调Llama或Qwen更可控，一次性投入省月费，数据也安全。

6月20日

08:51

08:51

Sakana AI@SakanaAILabs

Sakana AI 研究科学家 Rujikorn (Tan) Charakorn 在 MLCollective 的 DLCT 期刊俱乐部上介绍了 Doc-to-LoRA 方法。该方法利用超网络生成 LoRA 权重，通过成本分摊降低计算开销。演讲还讨论了 Doc-to-LoRA 的未来方向，并引发了热烈讨论。

论文 Sakana AI Doc-to-LoRA LoRA 微调超网络

推荐理由：Sakana AI 介绍了 Doc-to-LoRA，用超网络一键生成 LoRA 权重，微调更省钱。

6月18日

03:55

03:55

LangChain@LangChainAI

LangChain测试显示，Alibaba Qwen基础模型配合良好提示在感知错误分类任务上性能接近前沿模型。使用LoRA SFT微调后，模型性能接近或超过前沿模型。实验表明微调能使开源模型与顶级闭源模型竞争。

AI模型 Qwen Alibaba LoRA 微调开源模型

推荐理由：LangChain实测：Qwen基础版+好提示就能追平顶级模型，微调后甚至超越。开源模型潜力很大！

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

6月12日

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

05:40

05:40

rohanpaul_ai@rohanpaul_ai

精选

一篇论文提出 SIA（自我改进 AI）框架，让 AI 通过观察任务代理的表现，自动调整外部设置（如提示、工具、重试规则）或更新模型权重（通过 LoRA 适配器）。在三个差异极大的任务（中文法律罪名分类、GPU 内核速度调优、单细胞 RNA 去噪）上，结合设置与权重更新的版本均优于仅改进设置的方法。这表明，除了优化提示和工具，让模型通过任务反馈学习模式能带来额外提升。

论文自我改进 LoRA 任务代理自动化 AI 研究

推荐理由：这项研究解决了 AI 自我改进依赖人工调参的瓶颈，做自动化 Agent 或模型微调的团队值得关注——SIA 的 LoRA 更新思路能低成本让模型学会任务模式，比只改提示更有效。

02:07

02:07

Ideogram@ideogram_ai

Ideogram AI 在 X 上发文称，其社区在一周内构建了训练器、提示编译器、LoRA 和完整工作流。该平台邀请用户分享最佳生成作品，并将纳入下一期社区亮点帖。这展示了 Ideogram 生态的活跃度和用户创造力，也反映了 AI 图像生成领域社区驱动的快速迭代趋势。

AI产品 Ideogram 社区生态训练器 LoRA 工作流

推荐理由：Ideogram 社区一周内产出训练器、LoRA 等工具，说明其生态正快速成熟。做 AI 图像生成的创作者可以关注这些社区资源，直接提升工作流效率。

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？

6月7日

04:18

04:18

Fireworks AI@FireworksAI_HQ

精选

Fireworks 训练平台持续扩展，现已支持美国领先的开源权重模型 Nemotron 3 Ultra 进行后训练。用户可以通过 LoRA 或全参数微调进行 SFT 和 DPO，且训练与推理使用同一基础设施。这意味着训练出的模型可以直接部署，无需额外迁移。该平台旨在简化从训练到上线的流程，适合需要定制化模型的团队。

AI产品 Fireworks Nemotron 3 Ultra 模型微调 LoRA 训练平台

推荐理由：Fireworks 把 Nemotron 3 Ultra 的后训练和推理放在同一基础设施上，做模型微调的团队可以直接训练并上线，省去模型迁移的麻烦，值得关注。

6月5日

23:58

23:58

AK@_akhaliq

精选

Code2LoRA 提出利用超网络为代码语言模型生成 LoRA 适配器，以应对软件演化中的代码变更。该方法在代码补全、代码搜索等任务中无需全量微调即可适配新版本代码。实验显示其适配速度比传统方法快 10 倍以上，且性能接近全量微调。相关工作已在多个代码基准上验证有效性。

AI模型 Code2LoRA 代码语言模型 LoRA 超网络软件演化

推荐理由：用超网络给代码模型打补丁

5月20日

19:59

19:59

berryxia@berryxia

开源生图软件 Draw Things 用户发现，将 Z-Image-Fun-Lora-Distill（专为 Z-Image Base 训练的 2/4/8 步版本）与 Z Image Turbo 模型搭配使用，可将原本需要 8-9 步的生成过程缩短至 3-4 步，大幅提升本地生成速度，同时保持画质和细节稳定。这一意外组合打破了本地出图慢的瓶颈，对依赖 Draw Things 进行本地生成的用户是实用突破。详细配置和 LoRA 下载链接已在原帖评论区公开。

AI产品 Draw Things Z Image Turbo LoRA 本地生图开源软件

推荐理由：这个组合直接把本地生图速度天花板顶高了一截，每天用 Draw Things 或 Z Image Turbo 的创作者可以立刻试试，3-4 步出图不再是梦。