AITP
精选全部 AI 动态AI 日报Agent 接入关于更新日志信源提报反馈
登录 / 注册
AITOP
精选
过去 24 小时,从 842 条中筛出 51 条
全部模型产品行业论文技巧
标签:模型训练×
6月12日
01:36
01:36Clement Delangue@ClementDelangue
精选
Hugging Face 宣布其存储平台已成为私有和公开模型及数据集的最佳选择,支持中间和最终版本。以 @heyjasperai 为例,他们使用 HF 存储桶存储 Monet 数据集并直接在其上训练模型。这展示了 HF 在 AI 存储和训练工作流中的一体化能力。对于需要管理大型模型和数据集的团队,HF 提供了便捷的存储和训练集成方案。
AI产品Hugging Face存储平台数据集模型训练AI 基础设施

推荐理由:Hugging Face 将存储与训练无缝集成,管理模型和数据集的团队可以直接在平台上完成从存储到训练的全流程,省去多平台切换的麻烦。
原文
6月11日
15:28
AITOP6月11日 15:28
1107 vs 303:谷歌悄悄开源了一个“拆打字机”的模型,把大模型速度翻了4倍
15:23
AITOP6月11日 15:23
DiffusionGemma颠覆文本生成?自回归模型的“统治”要结束了
15:07
AITOP6月11日 15:07
每秒1107个token,Google开源的扩散模型为什么能改变本地推理格局?
6月5日
10:45
10:45IT之家(博客/媒体)
精选76°
深圳河套学院联合哈工大、华为等团队,依托华为昇腾910C国产AI算力集群,成功完成1.6万亿参数大模型DeepSeek-V4-Pro的全参数后训练。这是全球第三方机构首次在国产算力平台上完成如此规模的模型训练,模型算力利用率超过30%,关键训练算子效率提升14%,达到工业级运行标准。该成果证明国产AI芯片已能支撑世界级超大参数模型训练,为国产算力生态积累了重要经验。
AI模型华为昇腾910C国产算力万亿参数大模型DeepSeek-V4-Pro模型训练

推荐理由:国产芯片终于能跑万亿参数大模型了,做AI基础设施和模型训练的团队值得关注——这证明昇腾910C已具备工业级训练能力,后续国产替代路径更清晰。
原文
6月1日
00:09
AITOP6月1日 00:09
OpenAI 发起“Codex for Open Source”:免费赠送 6 个月 Pro 订阅,开源维护者能否迎来 AI 变革?
5月29日
08:02
AITOP5月29日 08:02
Opus 4.8发布:编程助手的“静默时刻”,是解放开发者,还是新门槛?🔥Anthropic 把 AI 编程的“确认键”彻底删掉了!Claude Code 搭载全新 Opus 4.8 模型,长时间任务不跑偏、不废话、不中断,像一个资深工程师一样默默干活,从功能开发到漏洞清扫全包圆,你在旁边喝茶等结果就行。过去 AI 写代码三步一问“这样可以吗”,现在它直接交完整交付物……自主编程的最后一层窗户纸,被捅破了。做自动化开发和代码审查的团队,这个模型建议直接上手,效率差距肉眼可见……Opus 4.8发布:编程助手的“静默时刻”,是解放开发者,还是新门槛?
精选全部日报登录