14:49IT之家(博客/媒体)OpenAI CEO 萨姆·奥尔特曼在最新博文中明确表示,完全自动化一切并非公司追求的未来,转而强调人机协同发展模式。此前 OpenAI 曾计划在 2028 年 3 月前构建完全自主的 AI 研究系统,但现已放弃该目标,改为探索 AI 与人类研究人员协同完成研究工作。奥尔特曼指出,AI 能力越强,人类设定方向、权衡利弊和运用判断力的作用就越重要。他还提议成立国际组织来协调前沿 AI 工作,必要时放慢技术发展速度以确保安全。行业OpenAI人机协作AI 安全自动化行业趋势10 个信源在谈推荐理由:奥尔特曼的转向给所有关注 AI 发展方向的从业者敲响警钟——完全自动化不是终点,人机协作才是务实路径。做 AI 产品、政策或战略规划的人,值得点开看看 OpenAI 为何放弃激进目标。原文
14:36IT之家(博客/媒体)哈佛大学与Perplexity联合研究,基于10000组真实生产数据,对比了对话式搜索与AI智能体(Perplexity Computer)的效率。结果显示,智能体在自主性上提升48倍,任务时间缩短87%,总成本下降94%,且质量未降反升(不满率1.3% vs 2.9%)。智能体虽单次模型成本更高(4-10美元 vs 0.05美元),但大幅降低了人力边际成本(从2.05美元降至0.16美元)。研究建议,短小单步任务适合搜索,多步骤、需调用工具的工作应交给智能体。行业AI智能体效率提升成本优化Perplexity人机协作推荐理由:这份研究用真实数据证明了AI智能体在复杂任务中的效率优势,做自动化流程或知识管理的团队可以直接参考成本收益模型,评估是否值得投入。原文
05:27OpenAI@OpenAI (@OpenAI)OpenAI的研究人员Alex Wei、Hongxun Wu和Wujie Ma在OpenAI播客中分享了一个案例:他们训练的模型发现了一个存在80年的Erdős猜想的反例。这一发现展示了AI模型在数学研究中的潜力,能够协助数学家发现新规律或反例。该事件强调了人机协作在科学探索中的价值,尤其是模型可以处理大量数据并识别人类可能忽略的模式。播客中详细讲述了模型如何通过推理和搜索找到反例,以及数学家如何验证这一结果。AI模型OpenAIErdős猜想数学发现人机协作推理模型8 个信源在谈推荐理由:数学家和AI研究者会感兴趣——模型不仅验证了猜想,还主动发现了反例,展示了AI在数学发现中的实际应用。建议点开了解人机协作如何突破传统研究边界。原文
01:40Decoder@Matthias Bastian贝恩咨询对951家公司的调查显示,近40%的企业AI成本节省不到10%,而多数企业目标为11%-20%。原因之一是仅7%的企业真正运行完全自主的AI智能体,但商业案例却假设了这一点。人类干预和流程阻碍是导致AI节省目标落空的关键因素。该研究揭示了企业AI落地中“人机协作”的现实困境。行业AI落地企业效率成本节省贝恩咨询人机协作推荐理由:做AI落地和数字化转型的团队值得一看——贝恩的数据戳破了企业AI节省的泡沫,提醒你:光有技术不够,组织流程和人类习惯才是真正的瓶颈。原文
16:31IT之家(博客/媒体)76°Anthropic 在 Claude 中灰度测试了「AI Fluency」功能,能根据 11 项指标分析用户与 AI 的历史对话,并给出使用水平评分。该功能基于 Anthropic 联合学术界发布的《AI 流利度指数报告》,通过对近万段匿名对话的分析,提炼出描述、委托、辨别三大维度的行为指标。已有网友晒出 7.5 分的评价,并称 AI 的反馈一针见血,甚至能给出改进建议。这一功能标志着 AI 从被评估者转变为评估者,引发了对人机协作新标准的讨论。AI产品ClaudeAI 流利度人机协作评分系统Anthropic10 个信源在谈推荐理由:Anthropic 把 AI 使用水平量化成 11 项指标,让每个用户都能看到自己的短板——做提示词工程或日常用 AI 的团队,生成报告后会有被赛博导师点醒的感觉,建议亲自试试。原文
07:54OpenAI@OpenAI (@OpenAI)OpenAI在一条推文中指出,AI系统正变得能够进行长而困难的推理链,连接不同领域的想法,并发现研究者可能未探索的路径。他们认为这些能力将很快加速生物学、物理学、工程学和医学领域的工作。同时强调,人类的判断力仍然至关重要,专业知识将变得更有价值,AI负责搜索、建议和验证,而人类选择重要问题、解释结果并决定下一步方向。AI模型推理模型科研加速OpenAI人机协作AI能力10 个信源在谈推荐理由:科研人员和工程师将看到AI从工具变为协作伙伴——长链推理能力让AI能跨领域连接想法,做科研的团队值得关注这一趋势,思考如何将AI融入工作流。原文