全部 AI 动态 · AI 热点

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

6月12日

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？

6月10日

14:49

14:49IT之家（博客/媒体）

OpenAI CEO 萨姆·奥尔特曼在最新博文中明确表示，完全自动化一切并非公司追求的未来，转而强调人机协同发展模式。此前 OpenAI 曾计划在 2028 年 3 月前构建完全自主的 AI 研究系统，但现已放弃该目标，改为探索 AI 与人类研究人员协同完成研究工作。奥尔特曼指出，AI 能力越强，人类设定方向、权衡利弊和运用判断力的作用就越重要。他还提议成立国际组织来协调前沿 AI 工作，必要时放慢技术发展速度以确保安全。

行业 OpenAI 人机协作 AI 安全自动化行业趋势

推荐理由：奥尔特曼的转向给所有关注 AI 发展方向的从业者敲响警钟——完全自动化不是终点，人机协作才是务实路径。做 AI 产品、政策或战略规划的人，值得点开看看 OpenAI 为何放弃激进目标。

14:36

14:36IT之家（博客/媒体）

哈佛大学与Perplexity联合研究，基于10000组真实生产数据，对比了对话式搜索与AI智能体（Perplexity Computer）的效率。结果显示，智能体在自主性上提升48倍，任务时间缩短87%，总成本下降94%，且质量未降反升（不满率1.3% vs 2.9%）。智能体虽单次模型成本更高（4-10美元 vs 0.05美元），但大幅降低了人力边际成本（从2.05美元降至0.16美元）。研究建议，短小单步任务适合搜索，多步骤、需调用工具的工作应交给智能体。

行业 AI智能体效率提升成本优化 Perplexity 人机协作

推荐理由：这份研究用真实数据证明了AI智能体在复杂任务中的效率优势，做自动化流程或知识管理的团队可以直接参考成本收益模型，评估是否值得投入。

6月5日

05:27

05:27

OpenAI@OpenAI (@OpenAI)

OpenAI的研究人员Alex Wei、Hongxun Wu和Wujie Ma在OpenAI播客中分享了一个案例：他们训练的模型发现了一个存在80年的Erdős猜想的反例。这一发现展示了AI模型在数学研究中的潜力，能够协助数学家发现新规律或反例。该事件强调了人机协作在科学探索中的价值，尤其是模型可以处理大量数据并识别人类可能忽略的模式。播客中详细讲述了模型如何通过推理和搜索找到反例，以及数学家如何验证这一结果。

AI模型 OpenAI Erdős猜想数学发现人机协作推理模型

推荐理由：数学家和AI研究者会感兴趣——模型不仅验证了猜想，还主动发现了反例，展示了AI在数学发现中的实际应用。建议点开了解人机协作如何突破传统研究边界。

01:40

01:40

Decoder@Matthias Bastian

贝恩咨询对951家公司的调查显示，近40%的企业AI成本节省不到10%，而多数企业目标为11%-20%。原因之一是仅7%的企业真正运行完全自主的AI智能体，但商业案例却假设了这一点。人类干预和流程阻碍是导致AI节省目标落空的关键因素。该研究揭示了企业AI落地中“人机协作”的现实困境。

行业 AI落地企业效率成本节省贝恩咨询人机协作

推荐理由：做AI落地和数字化转型的团队值得一看——贝恩的数据戳破了企业AI节省的泡沫，提醒你：光有技术不够，组织流程和人类习惯才是真正的瓶颈。

5月30日

16:31

16:31IT之家（博客/媒体）

76°

Anthropic 在 Claude 中灰度测试了「AI Fluency」功能，能根据 11 项指标分析用户与 AI 的历史对话，并给出使用水平评分。该功能基于 Anthropic 联合学术界发布的《AI 流利度指数报告》，通过对近万段匿名对话的分析，提炼出描述、委托、辨别三大维度的行为指标。已有网友晒出 7.5 分的评价，并称 AI 的反馈一针见血，甚至能给出改进建议。这一功能标志着 AI 从被评估者转变为评估者，引发了对人机协作新标准的讨论。

AI产品 Claude AI 流利度人机协作评分系统 Anthropic

推荐理由：Anthropic 把 AI 使用水平量化成 11 项指标，让每个用户都能看到自己的短板——做提示词工程或日常用 AI 的团队，生成报告后会有被赛博导师点醒的感觉，建议亲自试试。

5月21日

07:54

07:54

OpenAI@OpenAI (@OpenAI)

OpenAI在一条推文中指出，AI系统正变得能够进行长而困难的推理链，连接不同领域的想法，并发现研究者可能未探索的路径。他们认为这些能力将很快加速生物学、物理学、工程学和医学领域的工作。同时强调，人类的判断力仍然至关重要，专业知识将变得更有价值，AI负责搜索、建议和验证，而人类选择重要问题、解释结果并决定下一步方向。

AI模型推理模型科研加速 OpenAI 人机协作 AI能力

推荐理由：科研人员和工程师将看到AI从工具变为协作伙伴——长链推理能力让AI能跨领域连接想法，做科研的团队值得关注这一趋势，思考如何将AI融入工作流。