全部 AI 动态 · AI 热点

6月26日

00:27

00:27

Decoder@Matthias Bastian

《华盛顿邮报》的一项调查发现，多数主流AI聊天机器人在政治问题上存在左倾倾向。OpenAI的GPT-5.5在80%的情况下只提供左倾论点。马斯克旗下标榜'反觉醒'的Grok模型也更多偏向左倾。唯一的例外是谷歌Gemini 3.1 Pro，它在93%的测试中呈现了双方观点。

行业 GPT-5.5 Grok Gemini 3.1 Pro AI偏见政治倾向

推荐理由：想知道你用的AI聊天机器人有没有政治立场？《华盛顿邮报》测了GPT-5.5、Grok和Gemini 3.1 Pro，结果左倾现象普遍，连Grok都没逃过。来看看数据。

6月20日

16:21

16:21IT之家（博客/媒体）

上海交通大学等机构在arXiv发布研究，提出BabelTele压缩方法。该方法将文本压缩至原大小的27.9%，仍保持99.5%的语义准确性。人类阅读压缩文本后问答准确率显著下降，但Gemini 3.1 Pro准确率稳定。在MeetingBank和QuALITY基准上，同等压缩率下BabelTele优于LLMLingua-2。多智能体通信测试中，减少约40%通信Token，任务完成度超过96%。

AI模型 BabelTele Gemini 3.1 Pro 文本压缩多智能体语义保留

推荐理由：上海交大团队搞了个BabelTele，AI之间能说人类看不懂的语言，压缩四分之三文本还差不多全对，省token神器。

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

6月13日

20:46

20:46

Decoder@Matthias Bastian

Google Research 发布了 Gemini-SQL2，这是一个基于 Gemini 3.1 Pro 构建的模型，能将自然语言转换为可执行的 SQL 查询。在 BIRD 基准测试中，Gemini-SQL2 达到了 80.04% 的准确率，大幅领先于 OpenAI 和 Anthropic 的模型。Google 表示该技术有望改进其数据服务中的自然语言功能。

AI模型 Gemini-SQL2 Gemini 3.1 Pro Google Research BIRD基准文本到SQL

推荐理由：Google 的 SQL 模型准确率超 80%

09:43

09:43

marktechpost@Asif Razzaq

精选

Google Research 于 2026 年 6 月 12 日发布 Gemini-SQL2，基于 Gemini 3.1 Pro 模型。该模型在 BIRD 单模型排行榜上取得 80.04% 的执行准确率。文章解释了该分数含义、排行榜对比情况，以及 Google 未披露的细节。同时介绍了使用场景和基于 schema 的实现模式。

AI模型 Gemini-SQL2 Gemini 3.1 Pro BIRD Text-to-SQL 推理模型

推荐理由：Google 新模型 SQL 准确率破 80%

6月12日

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？

5月29日

05:36

05:36

Decoder@Matthias Bastian

88°

Anthropic 推出了 Claude Opus 4.8，该模型在大多数基准测试中超越了 GPT-5.5 和 Gemini 3.1 Pro。相比前代，它发现自身编码错误的频率提高了四倍。同时，Anthropic 还推出了动态工作流功能，可启动数百个并行子智能体来处理代码库迁移等任务。这标志着 Claude 在性能和自动化能力上的显著提升。

AI模型 Claude Opus 4.8 GPT-5.5 Gemini 3.1 Pro 编码错误检测动态工作流

推荐理由：Claude Opus 4.8 在编码错误检测和并行任务处理上大幅进化，做大型代码库迁移或复杂自动化的开发者可以直接体验动态工作流带来的效率提升。