全部 AI 动态 · AI 热点

6月26日

07:54

07:54

elvis@omarsar0

精选71°

Meta 的研究提出了 AutoData 框架，将 AI agent 作为数据科学家自动构建训练和评估数据。其实现 Agentic Self-Instruct 扩展了经典 Self-Instruct，增加了 agent 规划和工具使用。在计算机科学、法律推理和数学对象推理等任务上，AutoData 超越了传统合成数据方法。通过元优化训练数据生成 agent，还能获得更大性能提升。

AI模型 Meta AutoData Agentic Self-Instruct 合成数据 AI agent

推荐理由：Meta 搞了个 AutoData，让 AI agent 当数据科学家自动造训练数据，比自己写死的流水线强不少，在多个推理任务上效果更好。

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

6月12日

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

03:08

03:08

NVIDIA AI@NVIDIAAI

NVIDIA 推出了 Brev Launchables 和 Agent Skills，用于生成物理 AI 的合成数据。这些工具旨在解决物理 AI 训练数据稀缺的问题，通过自动化生成高质量合成数据，加速机器人、自动驾驶等物理 AI 应用的开发。Brev Launchables 提供可复用的数据生成环境，Agent Skills 则赋予智能体自主执行数据采集任务的能力。这对从事物理 AI 研究的团队来说是一个重要的基础设施更新。

AI产品 NVIDIA 物理AI 合成数据 Brev Launchables Agent Skills

推荐理由：物理 AI 训练数据难获取是行业痛点，NVIDIA 这套工具直接降低了合成数据门槛，做机器人或自动驾驶的开发者值得关注，可以大幅减少手动标注成本。

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？

6月4日

21:28

21:28

Julien Chaumond@julien_c

Julien C 发布新项目 SynthTraces，这是一个最小化代码库，用于生成合成编程智能体会话轨迹。它让一个开放模型（通过 Hugging Face Inference Providers 服务）扮演编程智能体，另一个小模型（llama.cpp）扮演人类用户，在真实开源代码库（HuggingFace OSS 项目）上进行交互。最终生成了超过 2000 条 Pi 会话轨迹，可用于训练或微调 LLM，并针对 Pi 进行优化。所有数据已发布在 Hugging Face 上。

AI产品编程智能体合成数据 Pi Hugging Face 开源/仓库

推荐理由：做智能体训练或微调的开发者终于有了大规模合成轨迹数据源——SynthTraces 用双模型对话自动生成 2000+ 条真实代码库交互轨迹，比手动标注高效太多，做 LLM 对齐或 Pi 优化的团队可以直接用。