AITP
精选全部 AI 动态AI 日报Agent 接入关于更新日志信源提报反馈
登录 / 注册
AITOP
精选
过去 24 小时,从 1009 条中筛出 58 条
全部模型产品行业论文技巧
标签:模型微调×
6月11日
15:28
AITOP6月11日 15:28
1107 vs 303:谷歌悄悄开源了一个“拆打字机”的模型,把大模型速度翻了4倍
15:23
AITOP6月11日 15:23
DiffusionGemma颠覆文本生成?自回归模型的“统治”要结束了
15:07
AITOP6月11日 15:07
每秒1107个token,Google开源的扩散模型为什么能改变本地推理格局?
6月7日
04:18
04:18Fireworks AI@FireworksAI_HQ
精选
Fireworks 训练平台持续扩展,现已支持美国领先的开源权重模型 Nemotron 3 Ultra 进行后训练。用户可以通过 LoRA 或全参数微调进行 SFT 和 DPO,且训练与推理使用同一基础设施。这意味着训练出的模型可以直接部署,无需额外迁移。该平台旨在简化从训练到上线的流程,适合需要定制化模型的团队。
AI产品FireworksNemotron 3 Ultra模型微调LoRA训练平台

推荐理由:Fireworks 把 Nemotron 3 Ultra 的后训练和推理放在同一基础设施上,做模型微调的团队可以直接训练并上线,省去模型迁移的麻烦,值得关注。
原文
6月1日
00:09
AITOP6月1日 00:09
OpenAI 发起“Codex for Open Source”:免费赠送 6 个月 Pro 订阅,开源维护者能否迎来 AI 变革?
5月29日
08:02
AITOP5月29日 08:02
Opus 4.8发布:编程助手的“静默时刻”,是解放开发者,还是新门槛?🔥Anthropic 把 AI 编程的“确认键”彻底删掉了!Claude Code 搭载全新 Opus 4.8 模型,长时间任务不跑偏、不废话、不中断,像一个资深工程师一样默默干活,从功能开发到漏洞清扫全包圆,你在旁边喝茶等结果就行。过去 AI 写代码三步一问“这样可以吗”,现在它直接交完整交付物……自主编程的最后一层窗户纸,被捅破了。做自动化开发和代码审查的团队,这个模型建议直接上手,效率差距肉眼可见……Opus 4.8发布:编程助手的“静默时刻”,是解放开发者,还是新门槛?
5月22日
11:40
11:40arXiv: OpenAI@Simon Dennis, Rivaan Patil, Kevin Shabahang, Hao Guo
精选76°
当前智能体编排框架(如LangGraph、CrewAI等)已超过29万GitHub星标,但都依赖外部编排器,每次交互都需注入指令和路由决策,消耗上下文窗口且依赖前沿模型。最新研究提出将工作流直接编译进小模型权重,创建“地下智能体”,在旅行预订、Zoom支持、保险理赔三个任务上,以不到前沿模型1%的成本达到接近前沿模型的质量。该方法解决了程序化任务中编排架构的三大痛点:上下文窗口消耗、必须使用前沿模型、专有流程暴露给第三方。研究团队通过实证表明,小模型微调后能完全内化复杂工作流,无需外部编排。
论文智能体工作流编译模型微调编排框架成本优化

推荐理由:做智能体编排的团队终于有了低成本替代方案——把工作流写进模型权重而非上下文,成本降两个数量级,质量不掉。做客服、保险、旅行预订自动化的开发者可以直接看论文里的14节点和55节点案例。
原文
5月19日
14:34
14:34arXiv cs.AI@Amritpal Singh, Andrey Barsky, Mohamed Ali Souibgui, Ernest Valveny, Dimosthenis Karatzas
精选
可解释AI(XAI)技术对深度学习模型的验证和负责任使用日益重要,但缺乏可靠的评估标准。研究者提出了一种基于连续输入扰动的量化指标,用于衡量XAI方法的质量,该指标从充分性和必要性两个维度评估归因信息对模型决策的影响。实验表明,该指标比现有方法更符合人类对解释质量的直觉。基于此指标,团队还提出了一种新的XAI方法,通过可微分的近似指标作为监督信号微调模型,在不降低模型性能的前提下生成因果解释。该方法在多个量化指标上优于现有XAI技术。
论文可解释AI量化评估因果解释模型微调深度学习

推荐理由:这项研究解决了XAI领域缺乏可靠评估标准的痛点,做模型可解释性研究的团队可以直接用这个指标来量化自己的方法,值得关注。
原文
精选全部日报登录