DeepSeek: GitHub 新仓库(资讯)75DeepSeek 开源了 DeepEP,这是首个专为 MoE(混合专家)模型设计的专家并行(EP)通信库。它提供了高吞吐、低延迟的 GPU 内核,支持训练和推理中的全到全通信。DeepEP 还支持低精度操作,如 FP8,并引入了高效的稀疏通信技术。该库已开源在 GitHub 上,开发者可以访问其 Pull Requests 页面了解更多。AI模型DeepSeekMoEEP通信库开源/仓库分布式训练推荐理由:MoE 模型的通信瓶颈一直是训练和推理的痛点,DeepEP 专为此优化,做大规模分布式训练的团队值得关注。
Moonshot AI: Kimi Blog(资讯)70Moonshot AI 正式开源了其最新的智能体模型 Kimi K2,该模型在多个基准测试中表现优异,尤其在代码生成、工具使用和复杂推理任务上超越了 GPT-4 和 Claude 3.5。K2 采用混合专家架构,拥有 1.5 万亿参数,但通过稀疏激活机制实现了高效推理。此次开源不仅提供了模型权重,还包括了训练代码和详细的技术报告,旨在推动智能体技术的民主化。对于开发者而言,K2 的开放意味着可以基于其强大的工具调用能力构建更自主的 AI 应用。AI模型智能体开源/仓库推理模型MoonshotKimi K2推荐理由:Kimi K2 开源让开发者直接获得了一个在工具使用和推理上超越 GPT-4 的智能体模型,做 AI 应用和自动化流程的团队建议立即上手试试。
Moonshot AI: Kimi Blog(资讯)65Kimi 发布了 K2 Thinking 模型并开源,该模型在 Agent 和推理能力上实现显著提升。K2 Thinking 基于 K2 架构,通过强化学习优化了长链推理和多步决策能力,在多个基准测试中表现优异。开源版本允许开发者自由部署和二次开发,降低了使用门槛。这一发布标志着 Kimi 在 Agent 和推理模型领域的持续投入,为开发者和企业提供了更强大的工具。AI模型KimiK2 Thinking开源/仓库推理模型智能体推荐理由:K2 Thinking 的开源让 Agent 和推理能力更强的模型触手可及,做智能体或复杂推理应用的开发者可以直接下载试用,降低自研成本。
DeepSeek: GitHub 新仓库(资讯)0DeepSeek 发布了 DeepEP,这是一个专为 MoE(混合专家)模型设计的高效通信库,旨在优化专家并行场景下的 GPU 通信效率。它支持低延迟推理和高吞吐量训练,并提供了节点内和节点间的通信优化。该库还引入了低精度操作和 FP8 调度,进一步提升了性能。对于使用 MoE 架构的团队,DeepEP 可以直接集成到现有框架中,显著减少通信开销。AI模型MoE通信库DeepSeek开源/仓库GPU优化推荐理由:MoE 模型的通信瓶颈是训练和推理的常见痛点,DeepEP 直接解决了这个问题。做大规模 MoE 训练或推理的团队,值得集成试试。
DeepSeek: GitHub 新仓库(资讯)70DeepSeek 开源了 FlashMLA,一个专为英伟达 Hopper GPU 优化的高效 MLA 解码内核。它针对可变长度序列进行了优化,已在生产中部署。该项目支持 BF16 精度,分页和块大小 64 的块大小,并提供预填充和分页预填充内核。FlashMLA 通过优化内存访问和计算,显著提升了推理性能。开发者可以直接在 GitHub 上获取代码和文档。AI模型DeepSeekFlashMLA开源/仓库推理优化Hopper GPU推荐理由:DeepSeek 开源 FlashMLA 解决了大模型推理中 MLA 解码的性能瓶颈,做推理优化和模型部署的开发者可以直接拿来用,值得一试。
DeepSeek: GitHub 新仓库(资讯)70DeepSeek 开源了 DeepGEMM,一个专为 FP8 矩阵乘法设计的高性能库。该库支持密集和 MoE 分组 GEMM,性能优异,在 NVIDIA Hopper GPU 上可达 1350+ TFLOPS。DeepGEMM 采用轻量级即时编译(JIT)方式,核心代码仅约 300 行,但通过精细的调优实现了接近理论峰值的性能。对于使用 FP8 进行训练或推理的团队,这是一个可以直接集成的高效工具。AI产品DeepGEMMFP8矩阵乘法开源/仓库高性能计算推荐理由:DeepGEMM 解决了 FP8 矩阵乘法的性能瓶颈,做大规模模型训练或推理的团队可以直接集成,获得接近理论峰值的算力利用率,值得一试。
DeepSeek: GitHub 新仓库(资讯)70DeepSeek 官方在 GitHub 上发布了 awesome-deepseek-agent 仓库,汇集了基于 DeepSeek 模型构建智能体的最佳实践、工具和示例。该资源库旨在帮助开发者快速上手使用 DeepSeek 模型开发 AI 智能体,包括 API 调用、提示词工程、工具集成等关键内容。对于希望利用 DeepSeek 模型构建生产级智能体应用的开发者来说,这是一个一站式的参考资源。AI产品智能体DeepSeek开源/仓库最佳实践开发者工具推荐理由:DeepSeek 官方整理的智能体开发资源库,做 AI 智能体的开发者可以直接拿来参考,省去自己摸索的时间。
Anthropic: Research(资讯)60Anthropic 宣布将其内部开发的对齐工具 Petri 捐赠给开源社区,该工具旨在帮助研究人员更有效地评估和提升 AI 系统的安全性。Petri 通过自动化测试和监控 AI 行为,降低了对齐研究的门槛。此举有望加速全球 AI 安全领域的协作与创新。Anthropic 表示,开源 Petri 是其推动负责任 AI 发展承诺的一部分。AI产品Anthropic开源/仓库对齐工具AI安全Petri推荐理由:做 AI 安全研究的团队可以直接用 Petri 降低对齐实验的重复劳动,建议关注其源码和文档。
Anthropic: Engineering(资讯)精选50Anthropic 发布 Agent Skills,一套用于增强 AI 智能体在真实环境中执行任务能力的工具集。Agent Skills 包含多个预构建模块,如文件操作、网络请求、数据解析等,让开发者无需从零编写复杂逻辑即可快速部署实用智能体。该项目旨在解决当前智能体在现实应用中缺乏可靠基础能力的问题,降低开发门槛并提升任务成功率。Anthropic 同时开源了相关代码,鼓励社区贡献更多技能模块。AI产品智能体AnthropicAgent Skills开源/仓库工具集推荐理由:做智能体应用的开发者不用再重复造轮子了——Agent Skills 直接提供了文件处理、网络请求等高频基础能力,拿来就能用,建议直接看源码。
Moonshot AI: Kimi Blog(资讯)65Moonshot AI 在2025年11月发布了Kimi K2 Thinking模型并开源,该模型聚焦于提升智能体和推理能力。同时,公司对Kimi K2 Turbo API进行了价格调整,并为K2官方高速版API提供5折优惠。此外,Kimi K2在2025年9月更新了更强的代码能力和更快的API,8月发布了高速版。这些动作表明Moonshot AI正积极推动其模型的推理与工具调用能力,以降低开发者成本。AI模型Kimi K2开源/仓库推理模型智能体API/价格推荐理由:Kimi K2 Thinking开源增强了开源大模型在智能体与推理领域的选择,配合降价策略,开发者可更经济地使用其API进行复杂任务。
DeepSeek: GitHub 新仓库(资讯)70DeepSeek 的 GitHub 组织页展示了其多个关键开源项目,包括高效FP8内核DeepGEMM、面向AI训练和推理的高性能分布式文件系统3FS、多头部隐式注意力内核FlashMLA、专家并行通信库DeepEP,以及用于V3/R1训练的双向流水线并行算法DualPipe等。这些仓库总计获得数万星标,反映了社区对DeepSeek技术栈的高度关注。此次页面加载存在部分错误,但不影响对核心开源成果的概览。AI模型开源/仓库推理模型基础设施分布式训练DeepGEMM推荐理由:DeepSeek 的开源仓库是其技术实力的集中体现,覆盖了从底层计算内核到分布式训练框架的全链路优化,对追求高效AI基础设施的开发者有重要参考价值。
Google Research: Blog(资讯)60Google Research 博客更新多项AI研究成果,涵盖全球科研合作与开放资源、AI辅助科研工具、图像重构技术、基于经验学习的推理Agent、合成数据设计方法、AI加速脑神经图谱、生成式AI教育应用、用户模拟器、学术工作流AI代理及LLM行为对齐评估等10个方向。其中,ReasoningBank 让智能体从经验中学习,显著提升推理能力;AI生成合成神经元将脑图谱绘制速度提高50倍。这些进展显示了AI在基础科学、算法理论及实际应用中的广泛渗透与加速趋势。行业AI科研推理智能体合成数据安全评估开源/仓库推荐理由:多项成果集中在AI辅助科研与智能体推理,尤其是ReasoningBank和AI加速脑神经研究,表明AI正从工具向自主式科研伙伴演进。对研究人员和AI工程师而言,这些开源资源和评估方法具有实践参考价值。
李开复 Kai-Fu Lee@kaifulee65李开复在Capgemini访谈中提出,各国在AI主权问题上不应陷入“接受美国模型或自研”的二元对立。真正的选择是:接受闭源美国平台并权衡主权风险,或基于开源模型针对本地语言、价值观和法规进行微调,成本低且成功可能性高。自研从头追赶美中,对于大多数国家来说难以成功。这一观点为全球AI治理提供了务实路线。行业AI主权开源/仓库闭源模型AI治理推荐理由:李开复为各国AI主权发展提供了清晰策略,强调开源模型在平衡成本、合规与自主性上的优势,值得政策制定者和技术负责人参考。
岚叔@lufzzliz609Router是一个新开源的模型智能路由项目,宣称可连接Claude Code、Cursor等所有主流AI代码工具到40多个AI提供商和100多个模型,包括免费模型。它实现了自动fallback和成本控制功能,类似本机开发者的"AI工具路由器",与Sub2API的API中转分发平台定位不同。该项目旨在简化多工具多模型使用场景下的路由管理。AI产品开源/仓库模型路由AI代码工具成本控制推荐理由:该开源项目解决了AI开发工具碎片化问题,通过统一路由提升效率和灵活性,对频繁切换模型和提供商的专业用户具有实用价值。
岚叔@lufzzliz25CloakBrowser宣称其工具已通过所有常见bot检测系统的测试,可作为Playwright的替代方案,用于自动化浏览器操作。该项目目前已开源,吸引开发者关注。这为反爬虫和自动化测试领域提供了新选择,可能影响网站安全策略和自动化工具的生态系统。AI产品CloakBrowserPlaywrightbot检测自动化开源/仓库推荐理由:这是一个具体的技术工具发布,对于从事自动化测试或数据采集的开发者具有实用价值,但影响力有限,更多是技术层面的替代方案。
岚叔@lufzzliz45作者复刻了DilumSanjaya的3D细胞可视化项目,并分享了完整教程和开源代码。过程包括用Coex复刻网站基础结构,用Three.js做初步3D展示,然后通过GPT image 2生成细胞多视角图,再用Tripo图生3D模型替换为真3D文件。目前完成前两个3D效果,后面部分待更新。该项目展示了AI辅助3D内容生成的实用工作流。AI产品3D生成CoexTripoGPT image 2开源/仓库推荐理由:该教程展示了结合Coex、GPT image 2和Tripo进行3D内容复刻的完整流程,对AI模型与3D工具协同工作有参考价值,适合关注AI生成3D应用的开发者。
阿里通义 Qwen@Alibaba_Qwen25阿里巴巴Qwen团队启动大使招募计划,面向技术开发者及社区领袖。入选者将获得Qwen模型早期访问权限、API额度及年度周边产品等福利。申请可通过官方网站提交。此举旨在增强技术社区互动,促进模型推广与应用。行业Qwen社区招募开发者关系开源/仓库推荐理由:对于关注Qwen模型及开源AI社区的从业者,这是一个获取早期资源和官方支持的直接渠道,有助于更早掌握前沿模型动态。
Clement Delangue@ClementDelangue65Hugging Face联合创始人Clement Delangue透露,Hugging Face上公开GGUF模型总数已达17.6万个。2024年10月至2月,月均新增约5100个GGUF模型;3月至4月跃升至约9200个/月,近乎翻倍。3月成为转折点(环比增长55%),4月维持9700个的高位,表明增长并非暂时现象。这一趋势得益于llama.cpp工具改进、自动化量化流程以及更多模型原生支持GGUF,社区量化模型速度创历史新高。行业开源/仓库模型量化GGUFHugging Face本地AI推荐理由:GGUF模型数量的快速增长反映了本地AI部署的实际需求和技术成熟度的提升。对于开发者和企业,这意味着更丰富的开源模型选择和更便捷的本地推理实践,推动AI应用向边缘设备转移。
Clement Delangue@ClementDelangue65HuggingFace CEO Clement Delangue指出,本地开源权重AI在笔记本电脑上的性能提升速度是摩尔定律的两倍多。从2024年5月到2026年5月,MacBook Pro硬件上限仅停留在128GB统一内存,但可运行的顶级开源模型(如Llama 3 70B到DeepSeek V4 Flash)在AI指数上的评分从10跃升至47,相当于智能水平每10.7个月翻倍。这表明算法和模型的进步正在大幅超越硬件迭代,使得本地AI能力持续快速增长。行业开源/仓库本地推理模型优化硬件限制技术趋势推荐理由:该数据直观展示了算法优化在AI发展中的巨大潜力,对本地部署和边缘计算场景具有重要参考价值,暗示未来AI应用无需依赖昂贵硬件升级。
Replit@Replit55Replit 在其10周年之际举办了Buildathon编程马拉松,并公布了获奖项目。本次活动旨在激励开发者利用Replit平台快速构建创新应用,重点展示了AI辅助编程的潜力。获奖项目涵盖教育、生产力、娱乐等多个领域,体现了低代码和AI驱动开发的趋势。Replit通过此类活动进一步强化其作为AI编程协作平台的地位,吸引更多开发者和创作者加入其生态系统。AI产品编程助手低代码/无代码智能体Replit开源/仓库推荐理由:对关注低代码平台和AI编程工具的开发者而言,获奖项目展示了当前Replit生态中的创新方向,如智能体应用和实时协作工具,可参考学习其中技术思路。
阿里云 Alibaba Cloud@alibaba_cloud45阿里云通义实验室与AI Singapore联合举办开发者会议,探讨如何构建真正理解东南亚语言和文化的AI。东南亚有超过7亿人口、1200多种语言,AI Singapore通过利用Qwen、Gemma等开源基础模型,与本地社区合作整合语言和文化背景,开发更包容的LLM。此举旨在缩小全球技术与本地文化之间的鸿沟,推动AI普惠化。行业阿里云AI Singapore多语言开源/仓库本地化推荐理由:这表明阿里云正推动开源模型在多语言、多文化场景的落地,对东南亚市场的本地化AI发展具有实际意义,值得关注相关生态进展。