04:13OpenAI@OpenAI精选OpenAI在Alignment博客中探讨了部署模拟的最佳实践,强调需要代表性生产数据,而外部评估者往往无法获取。他们分析了公共WildChat数据集,发现尽管其精度较低,但仍能提供部署行为的有效信号。该研究验证了WildChat在模拟中的实用性,为缺乏私域数据的研究者提供了替代方案。相关发现已发布在alignment.openai.com/validating-pub…。论文OpenAIWildChat部署模拟AI安全数据质量7 个信源在谈推荐理由:OpenAI用WildChat数据集做部署模拟测试,发现公开数据也能提供有效信号,适合没法拿到生产数据的研究者参考。原文