AITP
精选全部 AI 动态AI 日报Agent 接入关于更新日志信源提报反馈
登录 / 注册
AITOP
精选
过去 24 小时,从 841 条中筛出 52 条
全部模型产品行业论文技巧
标签:训练数据×
6月12日
12:14
12:14Allen AI (Ai2)@allen_ai
精选
艾伦人工智能研究所发布ModSleuth工具,用于追踪现代大语言模型训练中依赖的其他模型和数据集。研究发现,Olmo 3依赖89个模型和183个数据集,Nemotron 3则依赖273个模型和560个数据集。这表明LLM训练已从纯人类数据转向模型间相互生成、过滤和评估数据的模式。ModSleuth帮助开发者理解模型供应链的复杂性和潜在风险。
论文大语言模型训练数据模型依赖ModSleuth艾伦AI研究所

推荐理由:大模型训练越来越依赖其他模型生成数据,做模型开发或数据工程的团队需要理解这种依赖链——ModSleuth能帮你理清关系,建议点开看看。
原文
6月11日
15:28
AITOP6月11日 15:28
1107 vs 303:谷歌悄悄开源了一个“拆打字机”的模型,把大模型速度翻了4倍
15:23
AITOP6月11日 15:23
DiffusionGemma颠覆文本生成?自回归模型的“统治”要结束了
15:07
AITOP6月11日 15:07
每秒1107个token,Google开源的扩散模型为什么能改变本地推理格局?
6月8日
02:53
02:53rohanpaul_ai@rohanpaul_ai
精选
一篇关于推理模型训练后如何改进的入门论文指出,更好的推理模型更依赖于可检查的训练证据,而非原始数据规模。论文强调,推理数据不是简单的问答对,真正有价值的是反馈信号,它解释了答案、步骤、工具调用或完整尝试的好坏。作者将推理数据按检查方式分类,包括基于规则的精确检查(数学、代码)、环境检查(智能体工具使用)以及人工或模型判断。论文还揭示了常见误区:长推理链可能是虚假的,更难的数据对某些模型无用,更大的数据集可能仍缺乏关键覆盖。关键结论是,智能体数据应保留失败、重试、恢复等混乱信息,因为学习信号往往隐藏其中。
论文推理模型训练数据检查信号智能体论文

推荐理由:这篇论文戳破了推理模型训练中“数据越多越好”的迷思,做模型训练或智能体开发的团队值得一读——它告诉你该关注什么数据,而不是盲目堆量。
原文
6月7日
16:05
16:05Decoder@Jonathan Kemper
精选72°
一项新研究解释了为什么大型语言模型能掌握小型模型无法学会的罕见技能。研究发现,小型模型在处理罕见任务时,频繁出现的任务会不断覆盖它们已学到的知识。研究使用了从400万到40亿参数不等的模型,详细展示了这一机制,并提出了一个实用解决方案:与其扩大模型规模,不如增加目标任务在训练数据中的出现频率。这一发现为优化模型训练提供了新思路。
论文语言模型模型规模训练数据技能学习研究

推荐理由:这项研究为AI开发者揭示了模型规模与技能学习之间的关键机制,做模型训练或数据配比的团队可以直接参考其提出的数据频率优化方案,值得关注。
原文
6月6日
12:39
12:39IT之家(博客/媒体)
精选
科技媒体 The Decoder 报道,微软最新发布的 MAI 系列 AI 模型部分使用了 Common Crawl 等开放网络数据训练,与其此前宣称的“完全基于干净、商业授权数据”存在出入。微软技术论文显示,训练数据是“公开可得数据”与“授权人类生成数据”的混合,而非纯商业授权。微软称其爬虫遵守 robots.txt 协议,但媒体指出未屏蔽内容默认可抓取的逻辑存在争议。这一发现可能影响企业用户对微软 AI 模型数据合规性的信任。
行业微软MAI训练数据数据合规Common Crawl

推荐理由:微软 MAI 模型的数据来源争议直接关系到企业级 AI 部署的合规风险,做数据治理或采购 AI 服务的团队值得关注,建议点开了解具体细节。
原文
6月1日
00:09
AITOP6月1日 00:09
OpenAI 发起“Codex for Open Source”:免费赠送 6 个月 Pro 订阅,开源维护者能否迎来 AI 变革?
5月29日
08:02
AITOP5月29日 08:02
Opus 4.8发布:编程助手的“静默时刻”,是解放开发者,还是新门槛?🔥Anthropic 把 AI 编程的“确认键”彻底删掉了!Claude Code 搭载全新 Opus 4.8 模型,长时间任务不跑偏、不废话、不中断,像一个资深工程师一样默默干活,从功能开发到漏洞清扫全包圆,你在旁边喝茶等结果就行。过去 AI 写代码三步一问“这样可以吗”,现在它直接交完整交付物……自主编程的最后一层窗户纸,被捅破了。做自动化开发和代码审查的团队,这个模型建议直接上手,效率差距肉眼可见……Opus 4.8发布:编程助手的“静默时刻”,是解放开发者,还是新门槛?
精选全部日报登录