00:27Decoder@Matthias Bastian《华盛顿邮报》的一项调查发现,多数主流AI聊天机器人在政治问题上存在左倾倾向。OpenAI的GPT-5.5在80%的情况下只提供左倾论点。马斯克旗下标榜'反觉醒'的Grok模型也更多偏向左倾。唯一的例外是谷歌Gemini 3.1 Pro,它在93%的测试中呈现了双方观点。行业GPT-5.5GrokGemini 3.1 ProAI偏见政治倾向10 个信源在谈推荐理由:想知道你用的AI聊天机器人有没有政治立场?《华盛顿邮报》测了GPT-5.5、Grok和Gemini 3.1 Pro,结果左倾现象普遍,连Grok都没逃过。来看看数据。原文
16:21IT之家(博客/媒体)上海交通大学等机构在arXiv发布研究,提出BabelTele压缩方法。该方法将文本压缩至原大小的27.9%,仍保持99.5%的语义准确性。人类阅读压缩文本后问答准确率显著下降,但Gemini 3.1 Pro准确率稳定。在MeetingBank和QuALITY基准上,同等压缩率下BabelTele优于LLMLingua-2。多智能体通信测试中,减少约40%通信Token,任务完成度超过96%。AI模型BabelTeleGemini 3.1 Pro文本压缩多智能体语义保留推荐理由:上海交大团队搞了个BabelTele,AI之间能说人类看不懂的语言,压缩四分之三文本还差不多全对,省token神器。原文
20:46Decoder@Matthias BastianGoogle Research 发布了 Gemini-SQL2,这是一个基于 Gemini 3.1 Pro 构建的模型,能将自然语言转换为可执行的 SQL 查询。在 BIRD 基准测试中,Gemini-SQL2 达到了 80.04% 的准确率,大幅领先于 OpenAI 和 Anthropic 的模型。Google 表示该技术有望改进其数据服务中的自然语言功能。AI模型Gemini-SQL2Gemini 3.1 ProGoogle ResearchBIRD基准文本到SQL10 个信源在谈推荐理由:Google 的 SQL 模型准确率超 80%原文
09:43marktechpost@Asif Razzaq精选Google Research 于 2026 年 6 月 12 日发布 Gemini-SQL2,基于 Gemini 3.1 Pro 模型。该模型在 BIRD 单模型排行榜上取得 80.04% 的执行准确率。文章解释了该分数含义、排行榜对比情况,以及 Google 未披露的细节。同时介绍了使用场景和基于 schema 的实现模式。AI模型Gemini-SQL2Gemini 3.1 ProBIRDText-to-SQL推理模型3 个信源在谈推荐理由:Google 新模型 SQL 准确率破 80%原文
05:36Decoder@Matthias Bastian88°Anthropic 推出了 Claude Opus 4.8,该模型在大多数基准测试中超越了 GPT-5.5 和 Gemini 3.1 Pro。相比前代,它发现自身编码错误的频率提高了四倍。同时,Anthropic 还推出了动态工作流功能,可启动数百个并行子智能体来处理代码库迁移等任务。这标志着 Claude 在性能和自动化能力上的显著提升。AI模型Claude Opus 4.8GPT-5.5Gemini 3.1 Pro编码错误检测动态工作流10 个信源在谈推荐理由:Claude Opus 4.8 在编码错误检测和并行任务处理上大幅进化,做大型代码库迁移或复杂自动化的开发者可以直接体验动态工作流带来的效率提升。原文