呼吁公开分享编程与智能体追踪数据以构建更好开源模型

We need more coding and agent traces public sharing to build datasets and better open source models!...

精选理由

如果你在训练或使用开源编程模型,公开分享追踪数据能直接提升数据集质量,Hugging Face 的号召值得响应。做 AI 编程工具的团队也能从中获得更丰富的训练素材。

AI 摘要

Hugging Face CEO Clement Delangue 在 X 上呼吁更多人公开分享编程和智能体追踪数据,以构建更好的数据集和开源模型。他指出已有不少人贡献,鼓励大家也分享自己的数据。同时,Simon Willison 抱怨 OpenAI 的 Codex Desktop 在更新中移除了“Copy as Markdown”功能,该功能曾是他最喜欢的导出完整聊天记录的方式。这一变化引发了对数据共享和工具可用性的讨论。公开分享追踪数据有助于推动开源模型进步,但工具功能的移除可能影响开发者体验。

AI 翻译 · 中文

Hugging Face CEO Clement Delangue 在 X 上呼吁更多人公开分享编程和智能体追踪数据,以构建更好的数据集和开源模型。他指出已有不少人贡献,鼓励大家也分享自己的数据。同时,Simon Willison 抱怨 OpenAI 的 Codex Desktop 在更新中移除了“Copy as Markdown”功能,该功能曾是他最喜欢的导出完整聊天记录的方式。这一变化引发了对数据共享和工具可用性的讨论。公开分享追踪数据有助于推动开源模型进步,但工具功能的移除可能影响开发者体验。

Clement DelangueWe need more coding and agent traces public sharing to build datasets and better open source models! Lots of people contributing already, you should share yours too! huggingface.co/datasets?searc… Simon Willison @simonw