22:18Decoder@Maximilian Schreiner一项新基准测试评估了AI处理真实知识工作的能力。即使是最先进的AI模型,也仅能完全解决3%的任务。这一结果凸显了当前AI在处理复杂、多步骤的知识工作方面仍存在巨大短板。AI模型基准测试知识工作AI性能推荐理由:这个新基准狠狠打了AI的脸——最强模型也只完成3%的真实知识工作,别看平时吹得厉害。原文
17:15OpenAI Blog(博客/媒体)OpenAI 发布《知识工作的下一时代》报告,详细介绍了 Codex 如何通过 AI 驱动的研究、数据分析、工作流自动化和内容创作来提升生产力。Codex 能够自动执行重复性任务、生成报告、分析数据集,并整合多种工具,帮助知识工作者节省时间、提高效率。该报告强调了 Codex 在金融、法律、医疗等领域的实际应用案例,展示了其作为通用生产力工具的潜力。AI产品Codex知识工作生产力工具AI自动化数据分析10 个信源在谈推荐理由:知识工作者终于有了一个能真正自动化繁琐任务的 AI 工具——Codex 帮你做研究、分析数据、写报告,省下时间做更有价值的事。做咨询、金融、法律、内容创作的团队,值得看看实际案例。原文