全部 AI 动态 · AI 热点

AITOP

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

6月12日

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？

6月4日

03:12

03:12Google Research: Blog（资讯）

Google 宣布开源其水文框架，旨在提升全球洪水预测与应对能力。该框架结合了 Earth AI、生成式 AI 和开源模型，能够更准确地模拟洪水风险。此举将帮助社区、政府和组织更好地准备和应对洪水灾害，减少生命财产损失。开源意味着全球开发者可以贡献和定制，加速气候适应技术的普及。

AI产品开源/仓库洪水预测气候适应 Earth AI 生成式 AI

推荐理由：气候科技和防灾领域的团队终于有了 Google 级别的开源工具——水文框架直接提升洪水预测精度，做灾害管理、城市规划或气候适应的开发者可以立即研究并集成。

原文

5月14日

01:10

01:10DeepSeek: GitHub 新仓库（资讯）

75°

DeepSeek 开源了 DeepEP，这是首个专为 MoE（混合专家）模型设计的专家并行（EP）通信库。它提供了高吞吐、低延迟的 GPU 内核，支持训练和推理中的全到全通信。DeepEP 还支持低精度操作，如 FP8，并引入了高效的稀疏通信技术。该库已开源在 GitHub 上，开发者可以访问其 Pull Requests 页面了解更多。

AI模型 DeepSeek MoE EP通信库开源/仓库分布式训练

推荐理由：MoE 模型的通信瓶颈一直是训练和推理的痛点，DeepEP 专为此优化，做大规模分布式训练的团队值得关注。

原文

5月13日

21:36

21:36Moonshot AI: Kimi Blog（资讯）

70°

AI模型智能体开源/仓库推理模型 Moonshot Kimi K2

推荐理由：Kimi K2 开源让开发者直接获得了一个在工具使用和推理上超越 GPT-4 的智能体模型，做 AI 应用和自动化流程的团队建议立即上手试试。

原文

21:35

21:35Moonshot AI: Kimi Blog（资讯）

Kimi 发布了 K2 Thinking 模型并开源，该模型在 Agent 和推理能力上实现显著提升。K2 Thinking 基于 K2 架构，通过强化学习优化了长链推理和多步决策能力，在多个基准测试中表现优异。开源版本允许开发者自由部署和二次开发，降低了使用门槛。这一发布标志着 Kimi 在 Agent 和推理模型领域的持续投入，为开发者和企业提供了更强大的工具。

AI模型 Kimi K2 Thinking 开源/仓库推理模型智能体

推荐理由：K2 Thinking 的开源让 Agent 和推理能力更强的模型触手可及，做智能体或复杂推理应用的开发者可以直接下载试用，降低自研成本。

原文

21:35

21:35DeepSeek: GitHub 新仓库（资讯）

DeepSeek 发布了 DeepEP，这是一个专为 MoE（混合专家）模型设计的高效通信库，旨在优化专家并行场景下的 GPU 通信效率。它支持低延迟推理和高吞吐量训练，并提供了节点内和节点间的通信优化。该库还引入了低精度操作和 FP8 调度，进一步提升了性能。对于使用 MoE 架构的团队，DeepEP 可以直接集成到现有框架中，显著减少通信开销。

AI模型 MoE 通信库 DeepSeek 开源/仓库 GPU优化

推荐理由：MoE 模型的通信瓶颈是训练和推理的常见痛点，DeepEP 直接解决了这个问题。做大规模 MoE 训练或推理的团队，值得集成试试。

原文

21:35

21:35DeepSeek: GitHub 新仓库（资讯）

70°

DeepSeek 开源了 FlashMLA，一个专为英伟达 Hopper GPU 优化的高效 MLA 解码内核。它针对可变长度序列进行了优化，已在生产中部署。该项目支持 BF16 精度，分页和块大小 64 的块大小，并提供预填充和分页预填充内核。FlashMLA 通过优化内存访问和计算，显著提升了推理性能。开发者可以直接在 GitHub 上获取代码和文档。

AI模型 DeepSeek FlashMLA 开源/仓库推理优化 Hopper GPU

推荐理由：DeepSeek 开源 FlashMLA 解决了大模型推理中 MLA 解码的性能瓶颈，做推理优化和模型部署的开发者可以直接拿来用，值得一试。

原文

21:35

21:35DeepSeek: GitHub 新仓库（资讯）

70°

DeepSeek 开源了 DeepGEMM，一个专为 FP8 矩阵乘法设计的高性能库。该库支持密集和 MoE 分组 GEMM，性能优异，在 NVIDIA Hopper GPU 上可达 1350+ TFLOPS。DeepGEMM 采用轻量级即时编译（JIT）方式，核心代码仅约 300 行，但通过精细的调优实现了接近理论峰值的性能。对于使用 FP8 进行训练或推理的团队，这是一个可以直接集成的高效工具。

AI产品 DeepGEMM FP8 矩阵乘法开源/仓库高性能计算

推荐理由：DeepGEMM 解决了 FP8 矩阵乘法的性能瓶颈，做大规模模型训练或推理的团队可以直接集成，获得接近理论峰值的算力利用率，值得一试。

原文

21:35

21:35DeepSeek: GitHub 新仓库（资讯）

70°

DeepSeek 官方在 GitHub 上发布了 awesome-deepseek-agent 仓库，汇集了基于 DeepSeek 模型构建智能体的最佳实践、工具和示例。该资源库旨在帮助开发者快速上手使用 DeepSeek 模型开发 AI 智能体，包括 API 调用、提示词工程、工具集成等关键内容。对于希望利用 DeepSeek 模型构建生产级智能体应用的开发者来说，这是一个一站式的参考资源。

AI产品智能体 DeepSeek 开源/仓库最佳实践开发者工具

推荐理由：DeepSeek 官方整理的智能体开发资源库，做 AI 智能体的开发者可以直接拿来参考，省去自己摸索的时间。

原文

21:35

21:35Anthropic: Research（资讯）

Anthropic 宣布将其内部开发的对齐工具 Petri 捐赠给开源社区，该工具旨在帮助研究人员更有效地评估和提升 AI 系统的安全性。Petri 通过自动化测试和监控 AI 行为，降低了对齐研究的门槛。此举有望加速全球 AI 安全领域的协作与创新。Anthropic 表示，开源 Petri 是其推动负责任 AI 发展承诺的一部分。

AI产品 Anthropic 开源/仓库对齐工具 AI安全 Petri

推荐理由：做 AI 安全研究的团队可以直接用 Petri 降低对齐实验的重复劳动，建议关注其源码和文档。

原文

21:35

21:35Anthropic: Engineering（资讯）

精选

Anthropic 发布 Agent Skills，一套用于增强 AI 智能体在真实环境中执行任务能力的工具集。Agent Skills 包含多个预构建模块，如文件操作、网络请求、数据解析等，让开发者无需从零编写复杂逻辑即可快速部署实用智能体。该项目旨在解决当前智能体在现实应用中缺乏可靠基础能力的问题，降低开发门槛并提升任务成功率。Anthropic 同时开源了相关代码，鼓励社区贡献更多技能模块。

AI产品智能体 Anthropic Agent Skills 开源/仓库工具集

推荐理由：做智能体应用的开发者不用再重复造轮子了——Agent Skills 直接提供了文件处理、网络请求等高频基础能力，拿来就能用，建议直接看源码。

原文

00:33

00:33Moonshot AI: Kimi Blog（资讯）

Moonshot AI 在2025年11月发布了Kimi K2 Thinking模型并开源，该模型聚焦于提升智能体和推理能力。同时，公司对Kimi K2 Turbo API进行了价格调整，并为K2官方高速版API提供5折优惠。此外，Kimi K2在2025年9月更新了更强的代码能力和更快的API，8月发布了高速版。这些动作表明Moonshot AI正积极推动其模型的推理与工具调用能力，以降低开发者成本。

AI模型 Kimi K2 开源/仓库推理模型智能体 API/价格

推荐理由：Kimi K2 Thinking开源增强了开源大模型在智能体与推理领域的选择，配合降价策略，开发者可更经济地使用其API进行复杂任务。

原文

00:33

00:33DeepSeek: GitHub 新仓库（资讯）

70°

DeepSeek 的 GitHub 组织页展示了其多个关键开源项目，包括高效FP8内核DeepGEMM、面向AI训练和推理的高性能分布式文件系统3FS、多头部隐式注意力内核FlashMLA、专家并行通信库DeepEP，以及用于V3/R1训练的双向流水线并行算法DualPipe等。这些仓库总计获得数万星标，反映了社区对DeepSeek技术栈的高度关注。此次页面加载存在部分错误，但不影响对核心开源成果的概览。

AI模型开源/仓库推理模型基础设施分布式训练 DeepGEMM

推荐理由：DeepSeek 的开源仓库是其技术实力的集中体现，覆盖了从底层计算内核到分布式训练框架的全链路优化，对追求高效AI基础设施的开发者有重要参考价值。

原文

00:33

00:33Google Research: Blog（资讯）

Google Research 博客更新多项AI研究成果，涵盖全球科研合作与开放资源、AI辅助科研工具、图像重构技术、基于经验学习的推理Agent、合成数据设计方法、AI加速脑神经图谱、生成式AI教育应用、用户模拟器、学术工作流AI代理及LLM行为对齐评估等10个方向。其中，ReasoningBank 让智能体从经验中学习，显著提升推理能力；AI生成合成神经元将脑图谱绘制速度提高50倍。这些进展显示了AI在基础科学、算法理论及实际应用中的广泛渗透与加速趋势。

行业 AI科研推理智能体合成数据安全评估开源/仓库

推荐理由：多项成果集中在AI辅助科研与智能体推理，尤其是ReasoningBank和AI加速脑神经研究，表明AI正从工具向自主式科研伙伴演进。对研究人员和AI工程师而言，这些开源资源和评估方法具有实践参考价值。

原文

5月11日

22:35

李开复 Kai-Fu Lee@kaifulee

李开复在Capgemini访谈中提出，各国在AI主权问题上不应陷入“接受美国模型或自研”的二元对立。真正的选择是：接受闭源美国平台并权衡主权风险，或基于开源模型针对本地语言、价值观和法规进行微调，成本低且成功可能性高。自研从头追赶美中，对于大多数国家来说难以成功。这一观点为全球AI治理提供了务实路线。

行业 AI主权开源/仓库闭源模型 AI治理

推荐理由：李开复为各国AI主权发展提供了清晰策略，强调开源模型在平衡成本、合规与自主性上的优势，值得政策制定者和技术负责人参考。

原文

22:18

岚叔@lufzzliz

9Router是一个新开源的模型智能路由项目，宣称可连接Claude Code、Cursor等所有主流AI代码工具到40多个AI提供商和100多个模型，包括免费模型。它实现了自动fallback和成本控制功能，类似本机开发者的"AI工具路由器"，与Sub2API的API中转分发平台定位不同。该项目旨在简化多工具多模型使用场景下的路由管理。

AI产品开源/仓库模型路由 AI代码工具成本控制

推荐理由：该开源项目解决了AI开发工具碎片化问题，通过统一路由提升效率和灵活性，对频繁切换模型和提供商的专业用户具有实用价值。

原文

22:18

岚叔@lufzzliz

CloakBrowser宣称其工具已通过所有常见bot检测系统的测试，可作为Playwright的替代方案，用于自动化浏览器操作。该项目目前已开源，吸引开发者关注。这为反爬虫和自动化测试领域提供了新选择，可能影响网站安全策略和自动化工具的生态系统。

AI产品 CloakBrowser Playwright bot检测自动化开源/仓库

推荐理由：这是一个具体的技术工具发布，对于从事自动化测试或数据采集的开发者具有实用价值，但影响力有限，更多是技术层面的替代方案。

原文

22:18

岚叔@lufzzliz

作者复刻了DilumSanjaya的3D细胞可视化项目，并分享了完整教程和开源代码。过程包括用Coex复刻网站基础结构，用Three.js做初步3D展示，然后通过GPT image 2生成细胞多视角图，再用Tripo图生3D模型替换为真3D文件。目前完成前两个3D效果，后面部分待更新。该项目展示了AI辅助3D内容生成的实用工作流。

AI产品 3D生成 Coex Tripo GPT image 2 开源/仓库

推荐理由：该教程展示了结合Coex、GPT image 2和Tripo进行3D内容复刻的完整流程，对AI模型与3D工具协同工作有参考价值，适合关注AI生成3D应用的开发者。

原文

22:18

阿里通义 Qwen@Alibaba_Qwen

阿里巴巴Qwen团队启动大使招募计划，面向技术开发者及社区领袖。入选者将获得Qwen模型早期访问权限、API额度及年度周边产品等福利。申请可通过官方网站提交。此举旨在增强技术社区互动，促进模型推广与应用。

行业 Qwen 社区招募开发者关系开源/仓库

推荐理由：对于关注Qwen模型及开源AI社区的从业者，这是一个获取早期资源和官方支持的直接渠道，有助于更早掌握前沿模型动态。

原文

22:16

Clement Delangue@ClementDelangue

Hugging Face联合创始人Clement Delangue透露，Hugging Face上公开GGUF模型总数已达17.6万个。2024年10月至2月，月均新增约5100个GGUF模型；3月至4月跃升至约9200个/月，近乎翻倍。3月成为转折点（环比增长55%），4月维持9700个的高位，表明增长并非暂时现象。这一趋势得益于llama.cpp工具改进、自动化量化流程以及更多模型原生支持GGUF，社区量化模型速度创历史新高。

行业开源/仓库模型量化 GGUF Hugging Face 本地AI

推荐理由：GGUF模型数量的快速增长反映了本地AI部署的实际需求和技术成熟度的提升。对于开发者和企业，这意味着更丰富的开源模型选择和更便捷的本地推理实践，推动AI应用向边缘设备转移。

原文

22:16

Clement Delangue@ClementDelangue

HuggingFace CEO Clement Delangue指出，本地开源权重AI在笔记本电脑上的性能提升速度是摩尔定律的两倍多。从2024年5月到2026年5月，MacBook Pro硬件上限仅停留在128GB统一内存，但可运行的顶级开源模型（如Llama 3 70B到DeepSeek V4 Flash）在AI指数上的评分从10跃升至47，相当于智能水平每10.7个月翻倍。这表明算法和模型的进步正在大幅超越硬件迭代，使得本地AI能力持续快速增长。

行业开源/仓库本地推理模型优化硬件限制技术趋势

推荐理由：该数据直观展示了算法优化在AI发展中的巨大潜力，对本地部署和边缘计算场景具有重要参考价值，暗示未来AI应用无需依赖昂贵硬件升级。

原文

22:16

Replit@Replit

Replit 在其10周年之际举办了Buildathon编程马拉松，并公布了获奖项目。本次活动旨在激励开发者利用Replit平台快速构建创新应用，重点展示了AI辅助编程的潜力。获奖项目涵盖教育、生产力、娱乐等多个领域，体现了低代码和AI驱动开发的趋势。Replit通过此类活动进一步强化其作为AI编程协作平台的地位，吸引更多开发者和创作者加入其生态系统。

AI产品编程助手低代码/无代码智能体 Replit 开源/仓库

推荐理由：对关注低代码平台和AI编程工具的开发者而言，获奖项目展示了当前Replit生态中的创新方向，如智能体应用和实时协作工具，可参考学习其中技术思路。

原文

22:15

阿里云 Alibaba Cloud@alibaba_cloud

阿里云通义实验室与AI Singapore联合举办开发者会议，探讨如何构建真正理解东南亚语言和文化的AI。东南亚有超过7亿人口、1200多种语言，AI Singapore通过利用Qwen、Gemma等开源基础模型，与本地社区合作整合语言和文化背景，开发更包容的LLM。此举旨在缩小全球技术与本地文化之间的鸿沟，推动AI普惠化。

行业阿里云 AI Singapore 多语言开源/仓库本地化

推荐理由：这表明阿里云正推动开源模型在多语言、多文化场景的落地，对东南亚市场的本地化AI发展具有实际意义，值得关注相关生态进展。

原文