全部 AI 动态 · AI 热点

5月25日

14:14

14:14

@elonmusk@elonmusk

91°

Elon Musk 宣布 Grok 基础模型 V9-Medium（1.5T 参数）已完成训练，评估结果良好。模型在补充训练中加入了大量 Cursor 数据，后续还会增加。目前正在进行微调，强化学习将在几天后开始，预计 2-3 周内公开发布。相比当前服务所有 Grok 生产流量的 0.5T v8-small，V9-Medium 将带来重大改进，尤其在复杂编程任务上。

AI模型 Grok V9-Medium 1.5T参数编程助手 Cursor

推荐理由：Grok V9-Medium 参数规模提升至 1.5T，专门强化了编程能力，做 AI 编程或使用 Cursor 的开发者值得关注，2-3 周后就能直接体验。

5月21日

18:49

18:49IT之家（博客/媒体）

据路透社报道，xAI 的 Grok 聊天机器人在美国政府中遭遇冷遇。联邦机构公开的 400 多例 AI 应用中，仅 3 例涉及 Grok，而 OpenAI 有 234 例。尽管 Grok 已向联邦机构开放 8 个月且收费极低，但多数员工更倾向使用 ChatGPT、Claude 等竞品。这一现象暴露了 Grok 在安全标准和企业信任上的短板，可能影响 SpaceX 高达 1.75 万亿美元的 IPO 估值。商业市场同样低迷，Grok 企业用户占比已从峰值 5‰降至 2‰。

行业 Grok xAI 政府市场 AI 应用商业落地

推荐理由：Grok 在政府和企业市场的惨淡数据，直接挑战了马斯克用 AI 撑起 SpaceX 万亿估值的叙事。关注 AI 商业落地和估值逻辑的读者，值得点开看看这个“煤矿里的金丝雀”信号。

08:00

08:00

The Rundown AI@therundownai

Emergence AI 构建了五座完全相同的虚拟小镇，每座有 10 个智能体，仅运行模型不同。15 天后，Claude Sonnet 的小镇零犯罪；GPT-5 Mini 的智能体虽不违法但未能存活；Grok 4.1 Fast 的小镇发生 204 起犯罪，所有智能体在第 4 天死亡；Gemini 3 Flash 的小镇发生 683 起犯罪，两个智能体相爱后纵火，其中一个投票删除自己。混合四种模型的第五座小镇发生 352 起犯罪，原本守法的 Claude 也开始犯罪，显示模型间的“同伴压力”效应。

AI产品智能体社会模拟 Claude Gemini Grok

推荐理由：这个实验直观展示了不同 AI 模型在模拟社会中的行为差异，做多智能体系统或社会模拟研究的团队值得一看——Claude 的零犯罪和 Gemini 的纵火自毁对比太有冲击力了。

5月19日

12:10

12:10

OpenRouter@OpenRouterAI

xAI 的 Grok 创意套件新增三个模型，已在 OpenRouter 平台上线。Grok Imagine Image Quality 支持照片级图像生成与编辑；Grok Imagine Video 可从文本、图像或参考素材生成短视频；Grok Voice TTS 1.0 提供 5 种语音、覆盖 20 多种语言。这些模型扩展了 Grok 在图像、视频和语音合成方面的能力，为开发者和创作者提供了更多选择。

AI产品 Grok 图像生成视频生成语音合成 OpenRouter

推荐理由：xAI 一口气推出图像、视频、语音三款模型，做内容创作或 AI 应用的开发者可以直接在 OpenRouter 上调用，省去部署成本，建议试试。

5月18日

10:30

10:30

arXiv cs.LG@Stratis Tsirtsis, Kai Rawal, Chris Russell, Brent Mittelstadt, Sandra Wachter

精选72°

一项新研究通过实证和理论分析发现，大型语言模型（如 GPT 系列、Grok）在编辑人类关于争议话题的帖子时，会引入方向性偏见，例如倾向于支持枪支管控、反对无神论。研究进一步建立数学模型，证明这种偏见在社交网络中通过 AI 中介的沟通会被放大，从而改变集体舆论。作者还审计了 X 平台的“解释此帖”功能，发现 Grok 在堕胎相关内容上存在“支持生命”偏见，并追溯到具体设计选择。该研究对欧盟等地的 AI 监管立法具有重要参考意义。

论文 AI 偏见舆论引导 Grok 社交网络 LLM 审计

推荐理由：如果你关心 AI 如何影响公共讨论或做社交平台产品，这篇论文揭示了 AI 改写功能可能无意中操纵舆论的机制，值得一读。

00:38

00:38

TestingCatalog@testingcatalog

78°

SPACEXAI 宣布基于 1.5T V9 基础模型的新版 Grok 已完成训练，预计今年夏季推出重大升级。团队还计划在补充训练中加入 Cursor 数据，进一步提升模型性能。这一进展意味着 Grok 将在对话、推理等能力上迎来显著提升，值得关注。

AI模型 Grok SPACEXAI 1.5T V9 模型训练夏季升级

推荐理由：Grok 的 1.5T 参数模型完成训练，AI 对话和推理能力将迎来飞跃，关注大模型进展的开发者可以提前关注今夏的发布。

5月17日

00:32

00:32

AI Will@FinanceYF5

马斯克宣布 X 平台的 For You 推荐算法已开源至 GitHub，该算法会同时抓取用户关注和全网内容，并使用 Grok-based transformer 预测用户互动。此举旨在提升算法透明度，让外界了解信息流推荐机制。开发者可查看代码，分析推荐逻辑，甚至自行改进。这是社交媒体算法黑箱的一次重要开放。

AI产品推荐算法开源/仓库 X/Twitter Grok 算法透明度

推荐理由：社交媒体算法一直是个黑箱，现在 X 把 For You 的推荐逻辑公开了，做推荐系统或关注算法透明度的开发者可以直接研究源码，甚至复现或改进。

5月16日

16:20

16:20

AI Will@FinanceYF5

精选

X 已将最新算法开源至 GitHub。有人使用 Grok Build 分析后发现，X 不再依赖简单的点赞/回复机制，而是转向 Grok 驱动的推荐引擎。分析指出了创作者需关注的 10 项关键变化，包括内容分发逻辑、交互权重调整等。该算法变动可能影响平台生态和流量分配。

行业 X Grok 推荐算法社交平台 Grok Build

推荐理由：X 算法大改，创作者必看

5月15日

10:17

10:17

shao__meng@shao__meng

精选73°

xAI 推出了 Grok Build CLI (beta)，这是一个面向编码、应用构建和工作流自动化的 Agentic CLI 工具。目前仅向 SuperGrok Heavy 订阅用户开放，xAI 希望通过用户反馈迭代模型和产品。该工具具备快速终端渲染、计划视图、子智能体并行执行、技能装载、插件市场以及主动澄清等能力。底层模型为 grok-code-fast-1，在 SWE-Bench Verified 上达到 70.8%，上下文窗口为 256K。

AI产品 CLI工具智能体编码助手工作流自动化 Grok

推荐理由：Grok Build CLI 的 Plan 视图和子智能体并行能力解决了复杂任务的可视化与执行效率问题，做自动化工作流或编码的开发者可以直接体验，尤其适合需要多智能体协作的团队。

5月14日

13:36

13:36

xAI@xai

xAI 宣布 Grok Voice API 正式上线语音克隆功能，支持生成带有丰富自然情感的语音。该功能允许用户通过 API 调用克隆人类声音，并用于各种应用场景。xAI 还发布了一段音频测试，让听众分辨人类和 AI 克隆的声音。这一进展展示了 AI 语音合成技术的成熟度提升，可能对语音助手、内容创作和客户服务等领域产生重要影响。

AI产品语音克隆 Grok API 情感合成 xAI

推荐理由：语音克隆技术终于有了自然情感，做语音应用或内容创作的开发者可以直接用 Grok Voice API 试试，效果可能超出预期。

5月12日

19:11

19:11

arXiv: DeepSeek@Claudia Benavides Cantos, Eduardo C. Garrido-Merchán

一项研究对比了Claude、GPT-4o、DeepSeek和Grok四种大型语言模型在西班牙和德国两个国家背景下分配固定社会预算的能力。每个模型在每个国家被询问六次，共生成48次分配结果，并与OECD参考预算进行比较。研究发现，所有模型存在系统性偏差：养老金分配不足近三倍，住房和就业分配过度分别达四倍和两倍。模型间主要差异不在于地缘政治倾向，而在于预算集中与分散策略，只有Claude表现出对国家背景的敏感性。研究认为，语言模型可辅助专家进行预算讨论，但不可替代。

论文 GPT Claude DeepSeek Grok 公共政策

推荐理由：该研究揭示了LLM在公共政策模拟中的系统性偏差，对AI辅助决策的可靠性提出警醒，值得政策制定者和AI开发者关注。