18:03IT之家(博客/媒体)视觉内容社交平台 Pinterest 宣布与亚马逊 AWS 大幅扩展合作,计划在 2031 年前投入 40 亿美元。Pinterest 将扩大对 AWS 定制芯片的使用,包括 Graviton CPU 和 Trainium AI ASIC,其中约三分之一的计算基础设施已运行在 Graviton 上。Trainium 芯片将用于托管和运行大语言模型和视觉语言模型,支持个性化视觉搜索和 AI 辅助发现。此举旨在为数亿用户提供更个性化的视觉体验,并提升广告主效果。行业PinterestAWSTrainiumAI芯片视觉搜索推荐理由:Pinterest 用 AWS Trainium 芯片加速 AI 视觉搜索,做个性化推荐和视觉内容处理的团队可以关注这种硬件选择如何提升效率。原文
10:01arXiv cs.LG@Liupeng Li, Haoqian Kang, Zhenyu Lu, Jinpeng Wang, Bin Chen, Ke Chen, Yaowei Wang精选高分辨率图像感知是当前多模态大模型(MLLMs)的关键瓶颈。现有视觉搜索方法在覆盖率和效率之间难以平衡:专家辅助搜索高效但易遗漏,扫描式搜索全覆盖但计算冗余。CVSearch 提出了一种无需训练的“评估-搜索”自适应框架,先尝试专家辅助搜索,失败时再触发语义感知扫描,通过语义引导的自适应分块避免物体碎片化,并利用视觉复杂度驱动的动态自底向上搜索实现局部细节的高效迭代探索。实验表明,CVSearch 在高分辨率基准上达到最先进精度,同时显著提升搜索效率。代码已开源。论文多模态大模型高分辨率图像视觉搜索自适应框架开源/仓库推荐理由:高分辨率图像感知是 MLLMs 落地的硬骨头,CVSearch 用零训练成本解决了覆盖率和效率的矛盾,做多模态感知或视觉问答的团队可以直接拿来用。原文