全部 AI 动态 · AI 热点

6月23日

13:10

13:10

arXiv cs.AI@Campbell Lund, Thomas Euyang, Zanele Munyikwa, Marzieh Fadaee

2023年Eloundou等人计算的GPTs暴露评分成为工作未来辩论的核心输入，该评分定义暴露为LLM能辅助的职业任务占比。论文指出其存在时间、地理和本体论局限，并调查了五类应对研究：动态和基准度量、集成方法、任务框架扩展、以工人为中心的指标、采纳和使用数据。研究-政策协调不足，政策分析仍引用静态评分而未采纳方法论更新。建议政策制定者拓宽证据基础，研究者采用参与式方法并构建数据基础设施。

论文 GPT Exposure Scores LLM 工作自动化未来工作

推荐理由：这篇论文拆解了被广泛引用的GPT暴露评分到底靠谱不，指出静态评分的坑，还给出了五类改进方向，搞AI政策或研究的人值得一看。

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

6月12日

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？

6月6日

03:50

03:50

lmarena.ai@lmarena_ai

Arena.ai 发布了一个新的智能体平台，旨在帮助用户通过智能体完成真实世界的工作任务。该平台不仅提供实用的工作辅助功能，还致力于衡量智能体 AI 的进步程度。用户可以通过 arena.ai/agent 访问并参与其中。这一举措标志着智能体 AI 从实验走向实际应用的重要一步，同时为评估 AI 能力提供了量化手段。

AI产品智能体 AI 平台工作自动化 Arena.ai AI 评估

推荐理由：想用 AI 智能体处理真实工作任务的团队，现在有了一个可以直接上手的平台，还能参与衡量 AI 进步，值得一试。

6月3日

04:11

04:11

OpenAI@OpenAI (@OpenAI)

88°

OpenAI 宣布扩展 Codex 的插件功能，使其不再局限于单个工具，而是能通过一次安装成为特定角色的专家。Codex 现已支持 62 款流行应用和 110 项技能，覆盖销售、数据分析、创意制作、产品设计和公开股权投资等领域。用户无需编码即可安装插件，让 Codex 自动适应工作场景。这一更新显著提升了 Codex 的实用性和灵活性，尤其适合需要跨工具协作的专业人士。

AI产品 Codex 插件工作自动化销售数据分析

推荐理由：做销售、数据分析或创意工作的团队，现在可以用 Codex 一键安装插件，让它成为你领域的专属助手，省去手动切换工具的麻烦，值得直接试试。

02:50

02:50

Decoder@Matthias Bastian

OpenAI 正在为 Codex 添加针对数据分析、销售和投资银行等角色的专用插件，以将其打造为面向非开发者的通用工作应用。目前，Codex 每周有 500 万用户，其中五分之一是非开发者，且该群体增长速度是开发者的三倍。这表明 OpenAI 正将 Codex 定位为全功能工作助手，而非仅限编程工具。

AI产品 Codex OpenAI 非开发者插件工作自动化

推荐理由：非开发者群体增速是开发者的三倍，说明 Codex 正在突破编程边界——做数据分析、销售或投行的团队，可以直接用这些插件提升工作效率，值得关注。