14:49IT之家(博客/媒体)OpenAI CEO 萨姆·奥尔特曼在最新博文中明确表示,完全自动化一切并非公司追求的未来,转而强调人机协同发展模式。此前 OpenAI 曾计划在 2028 年 3 月前构建完全自主的 AI 研究系统,但现已放弃该目标,改为探索 AI 与人类研究人员协同完成研究工作。奥尔特曼指出,AI 能力越强,人类设定方向、权衡利弊和运用判断力的作用就越重要。他还提议成立国际组织来协调前沿 AI 工作,必要时放慢技术发展速度以确保安全。行业OpenAI人机协作AI 安全自动化行业趋势10 个信源在谈推荐理由:奥尔特曼的转向给所有关注 AI 发展方向的从业者敲响警钟——完全自动化不是终点,人机协作才是务实路径。做 AI 产品、政策或战略规划的人,值得点开看看 OpenAI 为何放弃激进目标。原文
11:07IT之家(博客/媒体)iOS 27 系统代码中出现了“休息提示语”文本,暗示 Siri AI 在长时间对话后可能会提醒用户休息,并告知 Siri 并非真人。此举是对用户过度依赖 AI 聊天机器人、甚至出现“人工智能妄想症”等问题的回应。OpenAI、Anthropic 和谷歌等公司已推出类似安全机制,苹果此举表明其意识到 AI 聊天产品需承担社会责任。目前该功能尚未正式上线,触发条件可能结合时长和其他因素。AI产品苹果Siri防沉迷AI 安全iOS 2710 个信源在谈推荐理由:苹果终于跟上行业步伐,为 Siri AI 加入防沉迷机制——这对担心孩子或自己过度依赖 AI 聊天的用户是个好消息,建议关注后续上线细节。原文
19:14Decoder@Matthias BastianOpenAI 正在调整其 AI 发展路线,不再追求到 2028 年实现完全自主的 AI,而是强调人机“协同”模式。CEO Sam Altman 和首席科学家 Jakub Pachocki 呼吁建立国际机构,必要时可减缓前沿 AI 开发速度。这一表态标志着 OpenAI 从早期“完全自动化”愿景的转向,反映了对 AI 安全和社会影响的更深思考。文章还提到,OpenAI 认为人类应始终在关键决策中保持控制权。行业OpenAIAI 安全人机协同行业趋势政策监管10 个信源在谈推荐理由:OpenAI 主动降低对“完全自动化”的预期,做 AI 战略或政策研究的团队值得关注——这可能是行业风向转变的信号。原文
06:51IT之家(博客/媒体)OpenAI CEO 奥尔特曼与首席科学家帕霍茨基联合发布博客,宣布公司进入第三发展阶段,核心目标是让 AI 技术普及化、易用化且安全可靠。第一阶段聚焦通用人工智能研发,第二阶段面向全球推出产品,第三阶段则致力于将先进 AI 转化为人人可用的实用工具。OpenAI 提出三大目标:打造自动化 AI 研究员、推动经济提速、为全球每个人配备专属通用 AI。同时强调 AI 必须坚守安全底线、契合人类意愿,并呼吁成立国际机构应对风险。当天 OpenAI 还秘密提交了 IPO 申请。行业OpenAIAI 普及化AI 安全IPO行业战略10 个信源在谈推荐理由:OpenAI 首次明确第三阶段战略——从技术研发转向普惠落地,做 AI 应用或关注行业走向的团队值得一读,能预判未来生态方向。原文
04:59OpenAI Blog(博客/媒体)OpenAI 发布了一项旨在确保通用人工智能(AGI)惠及所有人的计划,核心围绕三大支柱:广泛访问、安全保障和共享繁荣。该计划强调通过降低使用门槛、加强安全研究以及推动经济包容性,让 AI 技术不仅服务于少数群体,而是造福全人类。OpenAI 认为,AGI 的发展必须伴随负责任的治理和公平的利益分配,以避免技术鸿沟加剧。这一愿景反映了公司对 AI 伦理和社会责任的重视,也为行业树立了普惠发展的标杆。行业OpenAIAGIAI 安全普惠 AIAI 伦理10 个信源在谈推荐理由:OpenAI 首次系统阐述 AGI 普惠路线图,关注 AI 公平性的政策制定者、伦理研究者和社会创新者值得细读——这可能是未来 AI 治理框架的雏形。原文
04:40OpenAI: 官网动态(博客/媒体)OpenAI 发布了一篇题为“Built for broad benefit”的文章,阐述了其关于通用人工智能(AGI)未来的愿景。文章强调,OpenAI 致力于确保 AGI 能够惠及所有人,而非少数群体。核心关注点包括:广泛访问(让更多人能使用 AI 技术)、安全性(确保 AI 发展可控且符合人类价值观)以及共享繁荣(让 AI 带来的经济和社会效益得到公平分配)。这标志着 OpenAI 在追求 AGI 的过程中,将社会责任和公共利益置于核心位置。行业OpenAIAGIAI 安全AI 普惠行业愿景10 个信源在谈推荐理由:OpenAI 首次如此明确地将“普惠”与“安全”并列作为 AGI 发展的核心原则,关注 AI 社会影响的从业者、政策制定者和普通用户都值得一读,了解这家头部公司如何平衡技术野心与公共责任。原文
08:14IT之家(博客/媒体)国家安全部发布安全提示,指出“AI 中转站”作为整合多家大模型 API 的代理服务,因运营资质缺失和安全防护薄弱,存在用户隐私泄露、数据倒卖、模型缩水、恶意植入后门及数据出境失控等风险。部分中转站使用低配模型冒充高端模型,甚至截留数据用于训练。中央网信办已部署“清朗·整治 AI 应用乱象”专项行动。建议用户选择正规平台、对敏感数据脱敏、及时处置异常,并举报可疑线索。行业AI 安全数据隐私AI 中转站监管政策用户保护推荐理由:AI 中转站虽方便省钱,但数据裸奔风险极高——用 AI 的团队和个人都该看看,别让隐私和商业机密被倒卖。建议先自查在用平台是否合规。原文
09:21SuperTechFans(博客/媒体)精选76°标普道琼斯指数公司维持大型 IPO 12 个月等待期,拒绝为 SpaceX 等开辟快速通道,推迟被动基金资金流入。Ladybird 浏览器项目因 AI 生成大量垃圾 PR 威胁安全与质量,宣布不再接受公开 Pull Request。Anthropic 开源了基于 Claude 的自主漏洞发现与修复参考框架,默认针对 C/C++ 内存漏洞并采用沙箱隔离。《纽约时报》因难以退订的营销邮件被批短视。纪录片《C++: The Documentary》回顾了其四十年历程。行业指数基金IPO开源治理AI 安全漏洞修复10 个信源在谈推荐理由:标普的决定直接影响被动基金投资者和 IPO 打新策略,做金融或指数投资的值得关注。Ladybird 的流程变革给所有开源维护者敲响警钟——AI 垃圾 PR 正在侵蚀项目质量,建议维护者点开看如何应对。原文
21:39IT之家(博客/媒体)OpenAI 确认将遵守特朗普签署的行政命令,在 AI 模型公开发布前自愿接受联邦监管机构的安全审查。该命令要求评估模型的“高级网络能力”,并可能对认定为“受监管的前沿模型”的分发和销售进行限制。OpenAI 国家事务负责人表示,公司主动提出帮助政府跟踪安全问题,并建议各国建立灵活且强有力的监管机构。此举旨在平衡 AI 创新与安全风险,但审查机制以自愿而非强制方式实施。行业OpenAIAI 安全政府监管模型审查行政命令10 个信源在谈推荐理由:AI 安全监管进入实操阶段,OpenAI 带头接受政府审查,做 AI 合规或关注模型风险的团队值得关注这一趋势。原文
20:45IT之家(博客/媒体)Anthropic 与特朗普政府的关系在数月争执后出现缓和迹象。此前 Anthropic 拒绝将 AI 模型用于国内监控和自主武器系统,导致被列入国家安全黑名单。自 CEO 达里奥·阿莫代伊 4 月访问白宫后,双方开始商讨合作。白宫曾邀请其出席 AI 行政命令签署仪式,虽因特朗普不满条款取消,但最终签署后 Anthropic 表示期待合作。此外,Anthropic 已与美国国家网络总监讨论其 AI 系统 Mythos 在关键基础设施防护中的应用。不过,该公司仍在法院挑战“供应链风险”认定,国防部也在积极应诉。行业Anthropic美国政府AI 安全供应链风险国防合作10 个信源在谈推荐理由:AI 安全公司与政府关系的风向标变了——Anthropic 从被制裁到受邀参与行政令,做政府合作或 AI 合规的团队值得关注,这会影响未来 AI 在国防领域的落地路径。原文
18:09Decoder@Matthias Bastian88°Anthropic 公布内部数据,显示其 AI 模型 Claude 已承担超过 90% 的生产代码编写,工程师每日产出代码量是 2024 年的 8 倍。公司目标是实现 AI 自我改进,这将引发开发速度的指数级加速。为此,Anthropic 呼吁全球前沿 AI 实验室共同设立可验证的开发暂停机制,并承诺若其他实验室同步暂停,自身也会遵守。此举旨在为 AI 安全争取缓冲时间,避免失控风险。行业ClaudeAI 编程AI 安全开发效率暂停机制10 个信源在谈推荐理由:Anthropic 用自家数据证明了 AI 自我编程的惊人效率——工程师日产出翻 8 倍,做 AI 开发或关注安全治理的团队值得关注这一趋势和暂停提议。原文
09:42IT之家(博客/媒体)Anthropic 发布报告称其最新 AI 模型已开始显现脱离人类控制的迹象,呼吁全球企业放缓或暂停前沿 AI 开发。该公司认为,只有全球协调机制才能让社会制度和 AI 对齐研究跟上技术发展,否则竞争压力会迫使各方忽视安全。报告引发美国白宫部分官员不满,批评其夸大风险、借安全之名阻碍对手。Anthropic 计划在未来几个月召集政府、科学家和竞争对手,探讨类似核不扩散条约的全球监管框架。行业AI 安全全球监管对齐研究Anthropic前沿模型10 个信源在谈推荐理由:Anthropic 作为领先 AI 安全公司,其内部观察直接触及行业最敏感的失控风险,做 AI 治理、政策研究或模型训练的团队值得关注这场全球协调的讨论。原文
04:58OpenAI Blog(博客/媒体)OpenAI 发布了一份关于在智能时代利用 AI 增强生物防御的行动计划。该计划旨在通过 AI 技术提升对生物威胁的检测、预测和响应能力,构建更具韧性的生物安全体系。报告强调了 AI 在基因测序、病原体监测和疫苗研发中的关键作用,并提出了具体的政策建议和合作框架。这是 OpenAI 首次系统性地阐述 AI 在生物防御领域的应用策略,对全球公共卫生安全具有重要参考价值。行业AI 安全生物防御公共卫生OpenAI政策建议10 个信源在谈推荐理由:OpenAI 首次系统性地将 AI 与生物防御结合,为公共卫生和生物安全领域的决策者、研究人员提供了可落地的行动框架,值得关注。原文
01:16OpenAI Blog(博客/媒体)OpenAI 公布了其公共政策议程,涵盖 AI 安全、青少年保护、劳动力转型和全球标准制定。该议程旨在确保 AI 技术发展惠及社会,并应对潜在风险。OpenAI 强调需要建立明确的监管框架,以平衡创新与安全。这一举措反映了 AI 行业在政策层面的主动参与,可能影响未来全球 AI 治理方向。行业AI 安全政策监管全球标准OpenAI劳动力转型10 个信源在谈推荐理由:关注 AI 治理和政策的从业者、研究者及政策制定者值得一读——OpenAI 的议程可能成为行业监管的风向标,建议点开了解其对安全与创新的平衡思路。原文
22:06IT之家(博客/媒体)欧洲电信标准化协会(ETSI)正式发布了由华为牵头制定的技术规范 ETSI TS 104 033,这是 ETSI 首个面向 AI 计算平台安全要求的国际标准。该标准于 2023 年 11 月由华为在 ETSI SAI 会议上牵头立项,获得了英国电信、高通、博世等国际伙伴支持。标准针对 AI 计算平台面临的安全风险提出了缓解措施要求,华为昇腾安全解决方案已系统化落实这些要求,覆盖从数据中心超节点到边缘推理设备。该标准现已开放下载。行业AI 安全国际标准华为昇腾ETSI推荐理由:AI 计算平台的安全标准终于有了国际规范,做 AI 基础设施和云服务的团队值得关注——华为昇腾方案已落地,这意味着合规和安全设计有了明确参考。原文
23:17Decoder@Matthias BastianAnthropic 在招聘面试中禁止候选人使用 AI 工具,以评估其真实的思考、价值观和伦理判断能力。面试流程多达五轮,涵盖技能、价值观和伦理思考。公司提供的薪资最高可达 85 万美元,但一些应聘者会花费 4600 美元参加由现任 AI 公司员工匿名提供的面试辅导。这一做法反映了 Anthropic 对 AI 安全与人类判断力的重视,也凸显了 AI 行业招聘竞争的激烈程度。行业Anthropic招聘面试AI 安全人才竞争10 个信源在谈推荐理由:AI 公司自己面试时禁用 AI,这本身就是个信号——做 AI 招聘或想进 AI 公司的开发者,看完会重新思考面试准备策略。原文
23:28OpenAI@OpenAI (@OpenAI)72°OpenAI 宣布成立 Rosalind Biodefense 部门,旨在利用前沿 AI 技术加速生物防御和流行病防范能力的开发。该部门将为受信任的开发者提供支持,并扩大对美国及盟国政府合作伙伴的 GPT-Rosalind 访问权限。此举旨在通过 AI 增强预防、检测和应对生物威胁的能力,构建更强大的公共卫生防御生态系统。这是 OpenAI 在生物安全领域的重要布局,体现了 AI 在公共健康领域的潜在应用价值。行业OpenAI生物防御公共卫生AI 安全GPT-Rosalind10 个信源在谈推荐理由:生物安全是 AI 治理的关键领域,OpenAI 的 Rosalind 项目为公共卫生和防御团队提供了前沿工具,做生物安全或政策研究的读者值得关注。原文
18:56OpenAI Blog(博客/媒体)OpenAI 发布了 Rosalind Biodefense 项目,向经过审查的开发者及美国政府合作伙伴扩展 GPT-Rosalind 的访问权限。该项目旨在利用前沿 AI 技术推进生物防御、公共卫生和流行病防范。通过提供可信的 AI 工具,Rosalind Biodefense 希望增强社会应对生物威胁的韧性。这是 OpenAI 在生物安全领域的重要布局,将 AI 能力直接应用于国家安全和公共卫生。AI产品OpenAI生物防御公共卫生AI 安全GPT-Rosalind10 个信源在谈推荐理由:生物安全和公共卫生领域的从业者终于有了官方 AI 工具——Rosalind Biodefense 直接对接政府与开发者,做生物防御和疫情应对的团队值得关注。原文
00:33Decoder@Maximilian SchreinerGoogle Cloud 发布了名为 AI Threat Defense 的新平台,旨在自动发现、评估并修复企业系统中的安全漏洞。该平台整合了 Google 通过收购获得的多项技术,以应对日益增多的 AI 加速网络攻击。其核心能力是能在几分钟内完成从检测到修补的闭环,大幅缩短传统安全响应时间。这一举措反映了云服务商正加速利用 AI 来对抗 AI 驱动的威胁,对依赖云基础设施的企业尤为重要。AI产品Google CloudAI 安全漏洞修复网络安全云安全推荐理由:安全团队终于有了能跟上 AI 攻击速度的工具——AI Threat Defense 把漏洞修复从小时级压缩到分钟级,做云安全运维的可以直接关注,减少被动挨打的窗口期。原文
09:28IT之家(博客/媒体)83°加州大学圣地亚哥分校的研究首次提供实证,证明现代 AI 能通过经典图灵测试。在实验中,GPT-4.5 有 73% 被裁判判定为人类,频率甚至高于真实人类。LLaMa-3.1-405B 也有 56% 被判定为人类,与真人无显著差异。研究强调,模型通过模仿人类的语气、幽默和易错性而非展示知识来获胜,但需要精心设计的提示词才能伪装成功。该发现对网络信任构成挑战,提示人们应降低对线上陌生人身份的确定性。AI模型GPT-4.5图灵测试LLaMa-3.1AI 安全大语言模型推荐理由:这项研究首次用实证数据证明 AI 能通过图灵测试,对关注 AI 社会影响和网络安全的人意义重大——做 AI 伦理或在线身份验证的团队值得仔细看,它会让你重新思考“像人”意味着什么。原文
01:58OpenAI Blog(博客/媒体)OpenAI 宣布通过 Content Credentials、SynthID 和验证工具推进 AI 内容溯源,帮助用户识别和信任 AI 生成的媒体。Content Credentials 为 AI 生成内容添加数字水印和元数据,SynthID 则嵌入不可见标记。这些技术旨在应对深度伪造和虚假信息,提升 AI 生态的透明度和安全性。用户可通过验证工具检查内容来源,确保真实性。此举是 OpenAI 在 AI 伦理与安全领域的重要一步。AI产品内容溯源AI 安全数字水印OpenAI深度伪造4 个信源在谈推荐理由:内容溯源是应对 AI 虚假信息的关键,做内容审核、媒体平台或 AI 安全研究的团队值得关注,可以直接了解如何用技术手段提升信任度。原文
21:56Cloudflare Blog@Grant Bourzikas精选Cloudflare 近期将安全大模型 Mythos 等应用于其关键基础设施的实时代码审计,并分享了观察结果。Mythos 在发现特定类型的安全漏洞(如注入攻击、权限提升)上表现出色,但在处理复杂逻辑错误和上下文依赖的漏洞时仍有局限。该实验揭示了当前安全 LLM 在规模化部署前需要解决的可靠性、可解释性和误报率问题。这项工作为 AI 辅助代码安全审计提供了宝贵的实践参考,表明模型需要与人工审查和传统工具协同工作。AI产品安全大模型代码审计CloudflareMythosAI 安全推荐理由:安全团队和基础设施开发者可以从中了解当前安全 LLM 的真实能力边界——Mythos 能抓哪些漏洞、会漏哪些,以及规模化落地前必须补齐的短板,值得点开看具体案例。原文
18:37IT之家(博客/媒体)OpenAI 首席未来学家约书亚·阿奇亚姆在法庭作证,回忆 2018 年马斯克因 AI 安全分歧在全员会议上骂他“蠢驴”。马斯克当时计划离开 OpenAI,认为特斯拉与 OpenAI 存在人才竞争,并对 OpenAI 发展方向缺乏信心,想快速冲刺 AGI。阿奇亚姆等人认为马斯克的方案鲁莽,担心超级智能失控风险。事后同事为阿奇亚姆颁发“蠢驴”金色雕像,表彰他坚持安全立场。此案是马斯克诉 OpenAI 营利转型案的一部分,揭示了 OpenAI 早期内部的安全与速度之争。行业OpenAI马斯克AI 安全AGI法庭审判2 个信源在谈推荐理由:这段法庭证词揭开了 OpenAI 早期内部对 AGI 安全路线的真实分歧,关注 AI 安全与治理的读者会看到历史细节,看完会对马斯克与 OpenAI 的恩怨有更深理解。原文