AITP
精选全部 AI 动态AI 日报Agent 接入关于更新日志信源提报反馈
登录 / 注册
AITOP
全部 AI 动态
AI 相关资讯全量信息流
全部博客资讯推文论文
全部模型产品行业论文技巧
标签:GMM×
6月19日
11:45
11:45arXiv cs.LG@Linda Lu, Karthik Sridharan
该论文提出名为'可预测性'(predictability)的隐私度量框架,与差分隐私(DP)不同,它通过考虑攻击者的核心知识(部分泄露的数据)来评估隐私泄漏。研究证明可预测性与DP在一般情况下不可比较,但在最坏情形(仅一位个体未泄露且所有查询为二值)下,可预测性隐含互信息差分隐私。作者引入基于广义矩估计(GMM)的渐近分析方法,适用于由平稳遍历混合过程产生的泄露数据。最后,他们设计了一种基于可预测性校准的输出扰动方案,可与DP结合使用以提供细粒度隐私控制。
论文差分隐私可预测性GMM隐私度量AI安全

推荐理由:这篇论文提出了一个新的隐私度量'可预测性',比差分隐私更细致,还能和它一起用,很适合关注AI隐私的研究者。
原文
6月16日
20:46
AITOP6月16日 20:46
600亿美元买下Cursor,xAI终于拿到了编程工具,但真正值得跟踪的或许不是AI600亿美元买下Cursor,xAI终于拿到了编程工具,但真正值得跟踪的或许不是AI
6月12日
12:57
AITOP6月12日 12:57
Claude代码里藏了个20260612,18个月后的AI记忆革命已经开始倒计时
6月11日
15:28
AITOP6月11日 15:28
1107 vs 303:谷歌悄悄开源了一个“拆打字机”的模型,把大模型速度翻了4倍
15:23
AITOP6月11日 15:23
DiffusionGemma颠覆文本生成?自回归模型的“统治”要结束了
15:07
AITOP6月11日 15:07
每秒1107个token,Google开源的扩散模型为什么能改变本地推理格局?
6月10日
09:21
09:21arXiv cs.LG@Gal Bloch, Ariel Gera, Matan Orbach, Ohad Eytan, Assaf Toledo
精选
Flash-GMM 是一个融合的 Triton 内核,用于在单次 GPU 传递中高效计算高斯混合模型(GMM)。它通过避免在 GPU 内存中实例化完整的责任矩阵,实现了比现有实现快 20 倍的加速,并支持在单个设备上训练比以往大 100 倍以上的数据集。该内核被集成到 IVF 粗量化器中用于近似最近邻搜索,表明软 GMM 聚类可以替代 k-means,并利用 GMM 责任将边界向量分配到多个簇。在达到固定召回率目标时,Flash-GMM 减少了最多 1.7 倍的距离计算,或在相同计算成本下召回率提升 2-12 个点。该项目已开源。
论文GMMGPU加速聚类近似最近邻搜索开源

推荐理由:做大规模聚类或近似最近邻搜索的团队,Flash-GMM 让你在单卡上处理百倍数据量,速度还快 20 倍,直接替换 k-means 就能提升召回率,值得一试。
原文
精选全部日报登录