13:10arXiv cs.AI@Campbell Lund, Thomas Euyang, Zanele Munyikwa, Marzieh Fadaee2023年Eloundou等人计算的GPTs暴露评分成为工作未来辩论的核心输入,该评分定义暴露为LLM能辅助的职业任务占比。论文指出其存在时间、地理和本体论局限,并调查了五类应对研究:动态和基准度量、集成方法、任务框架扩展、以工人为中心的指标、采纳和使用数据。研究-政策协调不足,政策分析仍引用静态评分而未采纳方法论更新。建议政策制定者拓宽证据基础,研究者采用参与式方法并构建数据基础设施。论文GPTExposure ScoresLLM工作自动化未来工作推荐理由:这篇论文拆解了被广泛引用的GPT暴露评分到底靠谱不,指出静态评分的坑,还给出了五类改进方向,搞AI政策或研究的人值得一看。原文
03:50lmarena.ai@lmarena_aiArena.ai 发布了一个新的智能体平台,旨在帮助用户通过智能体完成真实世界的工作任务。该平台不仅提供实用的工作辅助功能,还致力于衡量智能体 AI 的进步程度。用户可以通过 arena.ai/agent 访问并参与其中。这一举措标志着智能体 AI 从实验走向实际应用的重要一步,同时为评估 AI 能力提供了量化手段。AI产品智能体AI 平台工作自动化Arena.aiAI 评估推荐理由:想用 AI 智能体处理真实工作任务的团队,现在有了一个可以直接上手的平台,还能参与衡量 AI 进步,值得一试。原文
04:11OpenAI@OpenAI (@OpenAI)88°OpenAI 宣布扩展 Codex 的插件功能,使其不再局限于单个工具,而是能通过一次安装成为特定角色的专家。Codex 现已支持 62 款流行应用和 110 项技能,覆盖销售、数据分析、创意制作、产品设计和公开股权投资等领域。用户无需编码即可安装插件,让 Codex 自动适应工作场景。这一更新显著提升了 Codex 的实用性和灵活性,尤其适合需要跨工具协作的专业人士。AI产品Codex插件工作自动化销售数据分析10 个信源在谈推荐理由:做销售、数据分析或创意工作的团队,现在可以用 Codex 一键安装插件,让它成为你领域的专属助手,省去手动切换工具的麻烦,值得直接试试。原文
02:50Decoder@Matthias BastianOpenAI 正在为 Codex 添加针对数据分析、销售和投资银行等角色的专用插件,以将其打造为面向非开发者的通用工作应用。目前,Codex 每周有 500 万用户,其中五分之一是非开发者,且该群体增长速度是开发者的三倍。这表明 OpenAI 正将 Codex 定位为全功能工作助手,而非仅限编程工具。AI产品CodexOpenAI非开发者插件工作自动化10 个信源在谈推荐理由:非开发者群体增速是开发者的三倍,说明 Codex 正在突破编程边界——做数据分析、销售或投行的团队,可以直接用这些插件提升工作效率,值得关注。原文