全部 AI 动态 · AI 热点

AITOP

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

6月12日

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？

03:23

xAI@xai

76°

xAI 发布了 Grok Voice，声称在语音交互中实现了人性化的时机、语气和温暖感，性能达到业界顶尖水平，但价格远低于竞争对手。同时，ServiceNow AI Research 的 EVA-Bench 评估显示，Grok Voice Think Fast 1.0 在准确率和用户体验的帕累托前沿上表现最优，没有其他系统能在不牺牲体验的情况下超越其准确性，反之亦然。这意味着 Grok Voice 在语音代理领域树立了新的性价比标杆，尤其适合需要高质量语音交互但预算有限的开发者和企业。

AI产品语音代理 Grok Voice xAI EVA-Bench 性价比

推荐理由：Grok Voice 以极低价格提供了顶尖的语音交互体验，做语音代理或客服系统的团队可以直接用，性价比远超竞品，值得立即尝试。

原文

6月8日

11:42

Yangyi@Yangyixxxx

据观察，自今年年初以来，美国AI初创公司对中国模型的调用量显著增加。这一趋势反映出中国AI模型在性价比上的竞争优势日益凸显。数据表明，越来越多的海外开发者开始选择中国模型作为底层技术支撑。这标志着中国AI模型在国际市场上的影响力正在快速提升。

行业中国模型性价比 AI初创调用量行业趋势

推荐理由：中国模型在性价比上的优势正在吸引美国AI初创公司转向，做模型选型或关注行业趋势的开发者值得关注这一变化。

原文

6月2日

08:14

岚叔@lufzzliz

AI模型 Qwen3.7-Plus 多模态 Agent 工具调用性价比

推荐理由：Qwen3.7-Plus 把多模态 Agent 的实用门槛又拉低了一截，做自动化工作流或 GUI 操作的开发者可以直接关注，性价比和功能覆盖都很能打。

原文

6月1日

09:37

elvis@omarsar0

精选

一位用户在 X 上分享使用 DeepSeek-v4-flash 的体验，称已花费数亿 token（约 10 美元），效果令人印象深刻。他将其用于自建编程智能体的自我改进，认为表现非常出色。该模型以极低的价格提供了高质量的性能，尤其适合需要大量 token 的开发者。更多细节将在后续分享。

AI模型 DeepSeek-v4-flash 编程助手智能体性价比开源/仓库

推荐理由：DeepSeek-v4-flash 以极低成本（百万 token 约 10 美元）实现高质量代码生成，做智能体或编程工具的开发者值得一试，性价比远超同类模型。

原文

5月29日

00:16

向阳乔木@vista8

Anthropic 发布了 Computer Use 的最佳实践指南，针对 API 调用中的常见问题给出优化建议。指南指出，高分辨率图片会被自动降采样导致坐标偏移，建议 Claude 4.6 系列使用 1280x720，Opus 4.7 使用 1080p。文本指令必须放在图片之前，以提升识别准确率。每张截图消耗约 1000-1800 token，200k 上下文易满。反常识发现：截图切块和坐标网格不提升精度；Low thinking 模式比不开更省 token；Max Thinking 性价比低，Medium 模式更优。

AI产品 Computer Use Anthropic API 优化最佳实践性价比

推荐理由：做 Computer Use 自动化或 GUI 操作开发的团队，这篇指南能帮你省下大量调试时间和 API 费用，建议直接收藏原文对照实践。

原文

5月23日

19:54

Milvus@milvusio

精选

Qwen3.7-Max 此次未开放权重，但凭借在 Terminal-Bench 2.0、SWE-Pro 等基准测试中的出色表现，以及远低于 Claude Sonnet 的定价，成为企业智能体领域最具性价比的模型之一。该模型支持长达 35 小时的自主编码运行和 1158 次工具调用，专为智能体工作流设计。然而，智能体的实际成本不仅取决于模型定价，更在于上下文管理——频繁回传历史记录会消耗大量 token。Milvus 向量数据库可为智能体提供记忆与检索层，避免每次提示都携带完整历史，从而降低 token 消耗、减少延迟，让 Qwen3.7-Max 的经济性在实战中真正落地。

AI产品 Qwen3.7-Max 企业智能体向量数据库 Milvus 性价比

推荐理由：Qwen3.7-Max 的定价和性能对做企业智能体开发的团队很有吸引力，但真正省钱的秘诀在于用 Milvus 管理上下文——做 RAG 或长任务自动化的开发者值得看看这个组合。

原文

5月22日

16:34

阿里云 Alibaba Cloud@alibaba_cloud

阿里云发布了在PAI-EAS平台上部署DeepSeek V4-Flash的成本效益分析，通过实际基准测试和定价数据比较了不同部署选项。该分析旨在帮助用户找到每美元性能最佳的方案，适合需要优化AI模型部署成本的开发者和企业。视频演示了具体对比结果，为选择最经济的部署方式提供参考。

AI产品 DeepSeek 阿里云 PAI-EAS 模型部署性价比

推荐理由：做AI模型部署的团队终于有了明确的性价比参考——阿里云用真实数据告诉你DeepSeek V4-Flash怎么部署最省钱，建议做成本优化的点开看看。

原文

5月21日

08:01

AI Breakfast@AiBreakfast

据 AI Breakfast 报道，Google 的 Gemini 3.5 Flash 模型在多个关键基准测试中超越了 Anthropic 的 Opus 4.7，包括终端基准、MCP Atlas、OSWorld 验证、金融代理、CharXiv 推理等。更重要的是，Gemini 3.5 Flash 的成本仅为 Opus 4.7 的一小部分。这一结果挑战了“贵即更好”的认知，表明轻量级模型在特定任务上可能更具性价比。对于预算有限但追求高性能的开发者或团队，这是一个值得关注的信号。

AI模型 Gemini 3.5 Flash Opus 4.7 基准测试性价比模型对比

推荐理由：轻量模型在多个实际任务上反超旗舰模型，做 AI 应用选型的团队可以直接参考这份基准对比来优化成本与效果。

原文

5月20日

03:53

lmarena.ai@lmarena_ai

83°

Google DeepMind 的 Gemini 3.5 Flash 模型在 Code Arena 前端评测中取得显著进步，总分 1507，比上一代 Flash 提升 70 分，甚至超越了之前的 Pro 版本。该模型在消费产品、内容创作工具、数据与分析等子类别中全面领先，输出速度达到 Pro 版本的 2 倍以上。目前 Gemini 3.5 Flash 在 Code Arena 前端排名第 9，在 Text Arena 也位列第 9，并在其价格区间内实现了最佳性价比。

AI模型 Gemini 3.5 Flash Google DeepMind 前端编码 Code Arena 性价比

推荐理由：前端开发者做自动化编码任务时，Gemini 3.5 Flash 以更快的速度和更低的成本超越了 Pro 版本，值得在项目中实测对比。

原文

02:20

lmarena.ai@lmarena_ai

76°

Gemini 3.5 Flash 在 Text and Code Arena: Frontend 中排名第9，得分1507，比上一代 Gemini-3 Flash 提升70分。该评测聚焦于真实用户构建应用和网站时的前端编码任务（HTML 和 React）。在子类别中，内容创作工具排名第7，游戏第8，消费产品第8，数据与分析第9，参考设计第10。此外，它在 Text Arena 中整体排名第9，并在其价格区间内实现了最佳 Arena 得分，重新定义了性价比边界。Google DeepMind 团队发布了这一新模型系列，强调其结合前沿智能与真实世界行动能力，特别适合智能体和编码场景。

AI模型 Gemini 3.5 Flash 前端编码智能体性价比 Google DeepMind

推荐理由：Gemini 3.5 Flash 在价格区间内实现了最高 Arena 得分，做前端开发或智能体应用的团队可以直接关注，性价比突出值得一试。

原文

5月16日

15:15

Ate-a-Pi@svpino

用户购买了 GEEKOM A9 Max AI 迷你电脑，搭载 AMD Ryzen AI 9 HX 370 处理器、32GB RAM 和 1TB SSD，并安装了 Omarchy Linux。该设备体积小、安静且性能强劲，整体配置不到 1000 美元。用户提醒 RAM 和 SSD 价格仍偏高，建议购买可升级的型号。

AI产品 GEEKOM A9 Max AI AMD Ryzen AI 9 HX 370 迷你电脑 Linux 性价比

推荐理由：想用不到 1000 美元组一台高性能迷你 AI 电脑的玩家可以看看——AMD Ryzen AI 9 HX 370 加持，32GB 内存，还支持 Linux，性价比不错。不过内存和硬盘价格不便宜，买前记得确认可升级性。

原文

5月14日

13:37

深度求索 DeepSeek@deepseek_ai

78°

DeepSeek 发布了 V4 Preview 版本，包含 Pro 和 Flash 两个模型，均支持 1M 上下文长度。Pro 版本总参数量 1.6T，激活参数 49B，性能对标全球顶级闭源模型；Flash 版本总参数量 284B，激活参数 13B，主打高效经济。模型权重和技术报告已开源，API 同步更新。这标志着开源大模型在长上下文和性价比上迈出重要一步。

AI模型 DeepSeek-V4 开源/仓库长上下文推理模型性价比

推荐理由：长上下文和低成本是当前 AI 应用的两大痛点，DeepSeek-V4 同时解决这两个问题，做 RAG、文档分析或长对话的开发者可以直接上手试试。

原文

5月13日

18:18

berryxia@berryxia

AIIQ.org 刚刚上线，用12个硬核基准数据将流行大模型分为抽象、数学、编程、学术四个维度，智能估算IQ和EQ分数，并制作了IQ vs 成本、IQ vs EQ、3D性价比对比图。EQ部分采用EQ-Bench和Arena Elo加权计算，对Anthropic模型做了200分惩罚。该网站不再简单比拼参数或基准分数，而是用人类智力标准衡量AI，帮助开发者更聪明地评估和选择模型。

AI产品大模型 IQ/EQ排名模型评估 AIIQ.org 性价比

推荐理由：当大家都在卷参数时，AIIQ.org 用IQ和EQ帮你快速判断哪个模型更聪明、更划算——做模型选型或成本优化的开发者，值得点开看看这个新工具。

原文