18:45IT之家(博客/媒体)月之暗面今日发布并开源 Kimi K2.7 Code 编程模型,相比 K2.6 在长上下文编程、指令遵循和长程任务性能上显著提升,平均 token 消耗减少 30%。内外部基准测试显示,代码能力提升 11%-31.5%,Agent 自主化执行能力提升约 10%。模型已通过 Kimi API 开放平台提供,价格与 K2.6 一致,并预告 6 月 15 日推出 5-6 倍输出速度的高速版,仅需 2 倍价格。非编程任务仍推荐使用 K2.6 模型。AI模型月之暗面Kimi K2.7 Code编程模型开源/仓库API5 个信源在谈推荐理由:Kimi K2.7 Code 在编程场景下 token 消耗降低 30%,做 AI 编程的开发者可以立刻通过 API 体验,高速版下周上线值得关注。原文
17:01IT之家(博客/媒体)商汤科技开源了 SenseNova U1 系列新成员 U1-8B-MoT-Interleaved 模型,专为图文交错创作场景优化。该模型解决了多轮生成中角色形象飘移、画风断裂、图文脱节等痛点,支持绘本、故事书、多页 PPT 等连续内容创作。核心升级包括叙事连贯性与角色一致性提升、图文语义对齐增强、视觉质量改善,以及新增多页 PPT 自动生成能力。模型已在 Hugging Face 开源,适合需要高质量图文内容生成的创作者和开发者。AI模型商汤SenseNova U1图文交错生成开源/仓库多模态模型推荐理由:做绘本、PPT 或教程的创作者终于不用反复修图了——这个模型能保持角色和画风从头到尾一致,直接生成多页内容,建议试试。原文
16:13marktechpost@Asif RazzaqZyphra 发布了 Zamba2-VL 系列开源视觉语言模型,包含 1.2B、2.7B 和 7B 三个参数版本。该模型采用混合 Mamba2 状态空间和 Transformer 骨干架构,在 Apache 2.0 许可下发布。与同类 Transformer 视觉语言模型相比,Zamba2-VL 在保持竞争力的同时,将首 token 生成时间降低了约一个数量级。这标志着在高效视觉语言推理方面的重要进展,尤其适合对延迟敏感的应用场景。AI模型视觉语言模型Mamba2Transformer开源/仓库低延迟推荐理由:做视觉语言模型部署或实时推理的开发者,Zamba2-VL 的首 token 延迟优势能显著提升用户体验,值得直接尝试。原文
15:16IT之家(博客/媒体)Nous Research 为 Hermes Agent 推出 Profile Builder,将分散的命令行配置整合为网页端可视化流程,用户只需 5 步即可完成智能体角色创建与配置。该工具支持身份名称、模型服务商、内置技能开关、Skills Hub 安装及 MCP 服务器设置,技能以 SKILL.md 形式存在,智能体按需加载,避免性能开销。MCP 服务器支持 HTTP URL 和本地 stdio 命令,并提供一键安装功能。Hermes Agent 定位为“越用越聪明”的开源智能体,能记住用户习惯并自动构建技能库。AI产品智能体Hermes AgentProfile Builder开源/仓库MCP/工具推荐理由:智能体配置终于从命令行拖进了网页端,做 AI 智能体开发或个性化定制的团队可以省下大量调试时间,直接上手试试 Profile Builder。原文
11:49AWS Machine Learning Blog@Ishan Singh精选AWS 发布了 Agent-EvalKit,一个基于 Apache 2.0 的开源工具包,用于系统评估 AI 智能体。它集成了 Claude Code、Kiro CLI 和 Kilo Code 等 AI 编程助手,提供六个评估阶段来全面测试智能体性能。文章以 Strands Agents SDK 和 Amazon Bedrock 构建的旅行研究智能体为例,展示了如何应用该工具。Agent-EvalKit 解决了智能体评估缺乏标准化的问题,帮助开发者量化智能体的准确性和可靠性。AI产品智能体评估工具开源/仓库AWSClaude Code1 个信源在谈推荐理由:做 AI 智能体开发的团队终于有了标准化的评估工具——Agent-EvalKit 覆盖六个阶段,直接集成主流编程助手,建议做智能体项目的开发者试试。原文
03:12Simon Willison’s Weblog(博客/媒体)精选Datasette 1.0a33 是迈向 1.0 稳定版的重要一步,将 ?_extra= 模式从表扩展到查询和行。该模式现已正式文档化。作者还利用 Claude Code 和 Codex Desktop 构建了自定义 extras API 浏览器来演示新功能。该版本进一步增强了 Datasette 的 JSON API 灵活性,方便开发者按需获取数据。AI产品DatasetteJSON API开源/仓库数据工具AI辅助编程推荐理由:Datasette 用户终于可以在查询和行级别使用 ?_extra= 模式,做数据 API 开发的团队可以直接升级体验更灵活的 JSON 输出。原文
08:48Simon Willison’s Weblog(博客/媒体)精选datasette-agent 0.2a0 版本发布,核心更新是工具现在可以在执行过程中向用户提问。工具通过 ToolContext 对象支持 yes/no、多选和自由文本三种问题类型。提问时,代理会暂停执行,问题以表单形式显示在聊天界面并持久化到数据库,即使服务器重启也能恢复。用户回答后,工具从头重新执行,因此建议在产生副作用前调用 ask_user()。此外,新增了 save_query 工具,允许代理将 SQL 保存为 Datasette 存储查询,但保存前必须获得用户批准。AI产品datasette-agentAI代理用户交互SQL查询开源/仓库推荐理由:这个版本让 AI 代理在复杂任务中能主动向用户确认关键信息,做 Datasette 数据查询或自动化工具的开发者可以直接用起来,避免 AI 擅自执行危险操作。原文
04:44Simon Willison’s Weblog(博客/媒体)76°Google 去年曾短暂发布实验性的 Gemini Diffusion 模型,如今以开源形式回归,推出 DiffusionGemma-26B-A4B-it 模型,采用 Apache 2 许可证。该模型在 NVIDIA NIM 云 API 上免费托管,生成速度可达 500+ tokens/秒。作者实测生成 2409 tokens 仅需 4.4 秒,性能出色。这是 Google 在扩散模型领域的重要开源动作,为开发者提供了高性能的生成式 AI 选项。AI模型GoogleDiffusionGemma开源/仓库NVIDIA生成式AI10 个信源在谈推荐理由:Google 把去年惊艳的扩散模型开源了,做图像/文本生成的开发者可以直接用 NVIDIA 免费 API 体验,速度超 500 tokens/秒,值得立刻上手试。原文
04:12IT之家(博客/媒体)小米 MiMo 团队正式发布并开源了 MiMo Code V0.1.0,这是一款基于 OpenCode 二次开发的终端 AI 编程助手,采用 MIT 协议。它内置限时免费的多模态模型 MiMo-V2.5,同时支持接入 DeepSeek、Kimi 和 GLM 等主流模型。MiMo Code 独创持久记忆系统,通过项目记忆、会话检查点和任务进度三重机制解决长会话中模型“越用越忘”的问题,即使上百轮对话也能保持输出质量。它还支持语音输入与控制,以及 Compose 模式,用户只需一个简单想法即可自动完成设计、规划、编码、测试和审查的全流程。此外,内置的 /dream 命令每 7 天自动整理记忆,让助手持续成长。AI产品编程助手开源/仓库小米MiMo Code持久记忆推荐理由:小米把 AI 编程助手的“记忆”痛点解决了——长会话不丢关键信息,做复杂项目的开发者可以直接用起来,省去反复重述上下文的烦恼。原文
16:25IT之家(博客/媒体)精选72°摩尔线程发布并开源了首个基于国产 GPU 算力底座全链路训练的代码大模型 MusaCoder,包含 9B 和 27B 两个参数规模。该模型专注于 GPU 底层算子生成,可从 PyTorch 标准算子自动生成高性能 CUDA/MUSA 原生 Kernel 代码,降低开发者手写门槛。在 KernelBench 评测中,MusaCoder-27B-RL 以 Overall Pass@8 93.2% 的成绩超越 Claude Opus 4.7、DeepSeek-V4 Pro 等主流模型,性能领先。模型已在 Hugging Face 开源,论文同步发布。AI模型代码大模型GPU 算子开源/仓库国产算力MusaCoder推荐理由:国产 GPU 生态终于有了自己的代码大模型,做 GPU 算子开发或国产算力适配的团队可以直接试用,降低底层开发门槛。原文
12:17Simon Willison’s Weblog(博客/媒体)精选Simon Willison 发布了 llm 0.32a3 版本,该版本的代码几乎完全由 Anthropic 的新模型 Claude Fable 5 编写。这标志着 AI 辅助编程进入新阶段,开发者只需描述需求即可获得完整实现。Simon 在博客中详细记录了这一过程,展示了 AI 生成代码的质量和效率。对于使用 llm 工具或关注 AI 编程的开发者来说,这是一个值得关注的里程碑。AI产品Claude Fable 5llmAI 编程代码生成开源/仓库10 个信源在谈推荐理由:Simon Willison 用实践证明了 Claude Fable 5 的代码生成能力,做工具开发或 AI 编程的团队可以看看 AI 如何独立完成一个完整项目,值得点开了解细节。原文
08:18SuperTechFans(博客/媒体)本期 HackerNews 头条涵盖多个话题:一位作者分享从14岁起经历毒瘾、入狱和重罪,最终通过开源社区重建稳定生活的真实故事,引发关于社会歧视与个人重生的讨论。文章《多巴胺压裂》提出资本和算法从体验中榨取纯粹快感导致文化同质化的概念,并给出个人应对方法。Performative-UI 是一个幽默自嘲的 React 组件库,封装了 AI 产品常见的营销设计套路。此外,Linear 的本地优先架构、小米 MiMo 模型极速推理、赛默飞抗体图像造假、DeepSeek V4 Pro 击败 GPT-5.5 Pro 等新闻也备受关注。行业开源/仓库React 组件库多巴胺压裂人生重建AI 产品1 个信源在谈推荐理由:从毒瘾到开源重建人生的故事能激励任何处于低谷的开发者,看完会感受到社区的力量;多巴胺压裂概念戳中了算法时代体验贫瘠的痛点,做内容或产品的团队值得反思。原文
05:27IT之家(博客/媒体)精选苹果在 WWDC 2026 上发布了 Game Porting Toolkit 4,旨在完善 Mac 游戏生态。该工具包新增 GitHub 开源代码仓库,提供 AI 智能体技能和示例代码,帮助开发者利用 AI 编程能力加速游戏移植。AI 智能体具备更深入的 Metal 知识,能通过命令行直接进行 Metal 工作负载的捕获、调试与性能分析。评估环境已支持 Metal 4,让开发者基于最新接口测试兼容性与性能。这一更新大幅降低了游戏适配 Mac 的工作量,对游戏工作室和技术团队意义重大。AI产品游戏移植Mac 生态AI 智能体Metal 4开源/仓库推荐理由:苹果用 AI 智能体降低了 Mac 游戏移植的门槛,游戏开发者和技术团队可以直接利用开源代码和 Metal 4 支持,减少调试时间,值得关注。原文
02:22Decoder@Jonathan Kemper精选72°微软研究院推出Lens,一个仅3.8B参数的文本到图像模型,在基准测试中匹配更大模型,训练成本大幅降低。其关键创新是使用GPT-4.1生成的8亿条详细图像描述,而非模糊的网页替代文本。代码和权重已开源。这表明高质量标注比模型规模更重要。AI模型图像生成微软LensGPT-4.1开源/仓库推荐理由:做图像生成模型训练或研究的团队,可以借鉴Lens用详细标注替代规模扩张的思路,直接复用其开源代码和权重,能大幅降低训练成本。原文
08:18Simon Willison’s Weblog(博客/媒体)Simon Willison 发布了 datasette-agent-edit 0.1a0,这是一个为 Datasette Agent 设计的插件,用于实现智能体对文本的编辑操作。该插件参考了 Claude 文本编辑器的设计,提供了 view、str_replace 和 insert 三个核心工具,支持查看带行号的文件、精确替换文本和在指定行后插入内容。作者计划基于此插件开发协作 Markdown 编辑、SQL 查询更新和 SVG 文件编辑等功能。通过将编辑模式抽象为通用插件,避免了为每个场景重复实现相同逻辑。AI产品Datasette智能体文本编辑插件开源/仓库推荐理由:做 Datasette 插件或智能体应用的开发者,这个插件解决了文本编辑工具重复造轮子的问题,可以直接复用核心逻辑来构建自己的编辑功能。原文
19:15Decoder@Jonathan Kemper78°一款名为 Audio Interaction 的新型开源语音模型发布,它能够持续监听音频流,并每 0.4 秒决定是否说话或保持沉默,无需等待录音结束。该模型支持翻译、转录、聊天以及识别日常噪音(如咳嗽),实现了真正的实时交互。与 GPT-4o 或 Qwen3.5-Omni 不同,它在一个流中处理所有任务。代码、模型权重和下载说明已在 GitHub 上以 Apache 2.0 开源许可证发布,训练数据也将随后提供。AI模型开源/仓库语音模型实时交互Audio InteractionApache 2.0推荐理由:这款模型解决了实时语音交互中“等待录音结束”的痛点,做语音助手或实时翻译的开发者可以直接在 GitHub 上试玩,体验每 0.4 秒的决策能力。原文
17:16marktechpost@Michal Sutter精选Moonshot AI 开源了 Kimi Code CLI,一个基于 TypeScript 的终端 AI 编程智能体。它支持子智能体和 MCP 配置,可直接在终端中执行代码生成、调试等任务。该工具旨在提升开发者的编程效率,尤其适合需要快速迭代和自动化编码的场景。Kimi Code CLI 的开源特性使其易于集成到现有工作流中,为下一代智能体开发提供了新选择。AI产品编程助手开源/仓库MCP/工具智能体Kimi Code CLI推荐理由:Kimi Code CLI 解决了终端编程的自动化痛点,做 CLI 工具或 AI 编程的开发者可以直接拿来用,省去自己造轮子的时间。原文
06:32Hugging Face: Blog(博客/媒体)72°该项目在Hugging Face的Build Small Hackathon中获奖,展示了如何在仅有3B参数的小模型上运行一个多智能体经济模拟系统。系统模拟了一个包含工人、伐木工、建造者和商人等角色的经济循环,每个智能体由独立的3B模型驱动,通过自然语言交互进行资源交易和协作。这一成果证明了小模型在复杂多智能体场景中的可行性,为资源受限环境下的AI应用提供了新思路。AI产品多智能体经济模拟小模型开源/仓库3B模型推荐理由:多智能体系统通常依赖大模型,而该项目用3B模型实现了经济模拟,做AI Agent或资源受限场景的开发者值得一看,可以直接复现或借鉴。原文
20:42IT之家(博客/媒体)72°腾讯混元团队提出 Stem 稀疏注意力算法,已被 ICML-26 收录。该算法通过 Token 位置衰减和输出感知度量两大创新,仅用 25% 算力即可逼近稠密注意力的精度。配套的 HPC 算子库将理论加速转化为实际性能,在 128K 上下文下首字延迟降低 3.6 倍。该方案为长文本推理场景提供了高效、低成本的注意力加速方案,相关论文和代码已开源。论文稀疏注意力长文本推理腾讯混元ICML-26开源/仓库推荐理由:长文本推理的延迟痛点终于有了低成本解法——Stem 用 25% 算力实现近无损精度,做 LLM 推理优化的团队可以直接用开源代码实测,128K 上下文下首字延迟降低 3.6 倍的效果值得关注。原文
19:42Simon Willison’s Weblog(博客/媒体)Ladybird 浏览器创始人 Andreas Kling 宣布项目将不再接受公开的 pull request,原因是 AI 生成的代码大量涌入,使得“提交代码即代表努力和善意”的假设不再成立。他强调,代码是否由手工编写已不重要,关键在于谁为进入浏览器的代码负责。这一决定旨在确保 Ladybird 成为面向真实用户的浏览器时,引入变更的人必须能承担后果。此举反映了开源项目在 AI 时代面临的信任与责任挑战。行业开源/仓库AI 伦理Ladybird代码责任生成式 AI2 个信源在谈推荐理由:Ladybird 的决定戳中了开源社区在 AI 时代的核心痛点——代码责任归属问题,做开源维护或使用 AI 辅助开发的团队值得认真思考这一案例。原文
14:31marktechpost@Asif Razzaq精选72°斯坦福研究人员发布 OpenJarvis,一个完全在设备上运行的开源 AI 智能体框架,涵盖推理、智能体、记忆和学习。它将个人 AI 系统分解为五个可组合原语:智能、引擎、智能体、工具与记忆、学习。在性能上,OpenJarvis 仅比最佳云端模型低 3.2 个点,但边际 API 成本降低约 800 倍。该框架旨在实现隐私保护、低延迟和低成本,适合个人设备上的 AI 应用。AI产品智能体开源/仓库本地优先记忆工具推荐理由:OpenJarvis 解决了隐私和成本两大痛点,做本地 AI 智能体开发的团队可以直接用——性能接近云端但成本低 800 倍,值得一试。原文
14:03IT之家(博客/媒体)76°Ideogram 发布 4.0 开放权重文生图模型,9.3B 参数,采用单流 DiT 架构,文本与图像 tokens 共享注意力序列。该模型在文字绘制上表现突出,能准确呈现长文本,适合海报、商品图等场景。通过边界框和结构化 JSON 训练,用户可精确控制版式和元素位置。在 DesignArena 人类评价榜单中排名全球第 4,超越 Nano Banana Pro,成为最强开源生图模型。AI模型Ideogram 4.0开源/仓库文生图扩散 Transformer文字绘制6 个信源在谈推荐理由:做设计、营销或内容创作的团队终于有了开源可部署的高质量生图模型——Ideogram 4.0 的文字绘制和布局控制能力直接对标商用产品,建议下载权重试试。原文
10:02pandaily@contact@pandaily.com (Pandaily)精选76°中国科学技术大学(USTC)研究人员开源了一种创新的智能体驱动长上下文训练范式,该范式通过智能体引导的数据生成和训练策略,显著提升了长上下文处理效率。实验表明,一个30亿参数的模型在长上下文任务上达到了与阿里巴巴Qwen3-235B模型相当的性能,而参数量仅为后者的八分之一。这一突破降低了长上下文模型训练的门槛,为资源有限的团队提供了高效方案。该范式已开源,有望推动长上下文AI应用的普及。论文长上下文智能体开源/仓库训练范式USTC推荐理由:中科大用30B模型打平235B的长上下文能力,做长上下文训练的团队可以直接复用这套开源范式,省下大量算力和数据成本。原文
04:27Decoder@Matthias Bastian78°Google DeepMind 发布了 Gemma 4 12B 开源模型,原生支持文本、图像和音频处理,仅需 16GB 内存即可在笔记本上运行。该模型在基准测试中几乎与两倍大小的 26B 模型持平,并采用 Apache 2.0 许可证,允许商业使用。这标志着多模态 AI 在消费级硬件上的重大突破,降低了开发者和企业的使用门槛。AI模型多模态开源/仓库Gemma 4Google DeepMind本地推理10 个信源在谈推荐理由:多模态模型终于能跑在普通笔记本上了,做本地 AI 应用或边缘计算的开发者可以直接下载试试,性能还接近两倍大的模型。原文
02:51marktechpost@Asif Razzaq88°Google DeepMind 发布了 Gemma 4 12B,一款无编码器的多模态模型,直接将视觉和音频输入送入 LLM 主干,无需传统视觉或音频编码器。该模型原生支持音频理解,可在 16GB 内存的笔记本电脑上本地运行,并采用 Apache 2.0 开源许可。这降低了多模态 AI 的硬件门槛,让开发者能在消费级设备上部署视觉和音频处理能力。Gemma 4 12B 的发布标志着多模态模型向轻量化和本地化迈出重要一步。AI模型多模态模型开源/仓库Gemma 4 12B本地部署无编码器2 个信源在谈推荐理由:多模态模型终于能跑在普通笔记本上了,做本地 AI 应用或边缘计算的开发者可以直接下载试用,16GB 内存就能跑视觉+音频推理,开源许可也友好。原文
22:39IT之家(博客/媒体)京东发布并开源了 JoyAI-Echo 长音视频生成框架,解决了长视频生成中角色身份、声音不一致和生成速度慢的行业难题。该框架内置记忆库,可在多镜头中保持角色外观和音色一致,实测 5 分钟视频无崩坏。通过 DMD 技术实现约 7.5 倍推理加速,并支持对话式编辑,用户可直接用自然语言修改镜头,无需重跑整条视频。京东官方称该框架已进入全球第一梯队,项目已开源在 GitHub。AI产品视频生成开源/仓库京东JoyAI-Echo对话式编辑推荐理由:长视频生成领域终于有了能保持角色一致的开源方案,做视频生成、影视制作的团队可以直接拿来用,省去大量后期修复时间。原文
21:57IT之家(博客/媒体)上海海思一站式集成开发环境 HiSpark Studio 正式在 GitCode 平台开源。该 IDE 基于 VS Code 扩展架构,提供工程管理、代码编辑、编译构建、烧录调试、图形化配置等全链路开发能力。开源后开发者可自由修改源码并拓展功能,已支持智能设备、星闪(NearLink)和嵌入式 AI 等开发场景。核心亮点包括一键 SDK 下载、图形化系统配置、AI 模型处理及远程开发等。这降低了海思芯片开发门槛,尤其利好嵌入式与物联网开发者。AI产品海思HiSpark Studio开源/仓库嵌入式开发IDE推荐理由:海思芯片开发者终于有了可定制的官方 IDE,能自由改源码和扩展功能,做智能设备或嵌入式 AI 的团队可以直接在 GitCode 上获取并尝试。原文
19:15Decoder@Maximilian Schreiner78°Nous Research 推出了 Hermes Desktop,一个基于 MIT 许可证的开源 AI 智能体应用。该应用旨在跨平台运行,为用户提供统一的 AI 助手体验。Hermes Desktop 支持多种操作系统,包括 Windows、macOS 和 Linux,并集成了本地 AI 模型,确保数据隐私。这一发布标志着开源 AI 智能体在桌面端的重大进展,让开发者可以自由定制和部署。AI产品智能体开源/仓库跨平台桌面应用Nous Research5 个信源在谈推荐理由:开源 AI 智能体终于有了跨平台桌面版,做本地化 AI 应用的开发者可以直接用 MIT 许可证代码,省去从头搭建的麻烦。原文
16:41marktechpost@Asif Razzaq83°NVIDIA 发布了 Cosmos 3,这是一款开源的“全模态世界模型”,采用双塔混合 Transformer 架构,将自回归 VLM 推理器与扩散生成器结合。该模型能够统一物理推理、世界生成和动作生成,为物理 AI 提供基础能力。Cosmos 3 旨在让机器人、自动驾驶等系统更好地理解物理世界并生成合理动作。其开源特性有望加速物理 AI 领域的研究与应用开发。AI模型NVIDIACosmos 3物理 AI世界模型开源/仓库10 个信源在谈推荐理由:NVIDIA 把物理推理和世界生成塞进一个开源模型,做机器人或自动驾驶的团队可以直接拿来用,省去从头训练物理世界模型的成本。原文
14:48Pandaily@contact@pandaily.com (Pandaily)精选中国开源世界模型 Boundless 在全球排行榜上超越 Google、NVIDIA 等巨头的产品,成为第一名。世界模型是能理解和模拟物理现实的 AI 系统,对机器人、自动驾驶等领域至关重要。Boundless 的开源特性降低了研究门槛,让更多团队能参与开发。这一突破显示中国在 AI 基础模型领域的竞争力正在增强。AI模型世界模型开源/仓库物理模拟中国AIBoundless10 个信源在谈推荐理由:世界模型是 AI 的下一个前沿,做机器人或自动驾驶的团队可以直接用 Boundless 开源代码加速研发,值得关注。原文
12:21IT之家(博客/媒体)精选智元机器人开源了行业首个聚焦物理交互的具身数据集 AGIBOT WORLD 2026 第二期“多样交互”。该数据集系统记录了机器人与真实物理世界之间的复杂、高密度、非理想交互过程,旨在补齐当前世界模型训练中缺失的真实物理交互数据。它将具身智能的数据范式从“学习成功动作”推进到“理解完整的物理分布”,对世界模型、神经仿真器、物理感知等研究至关重要。目前数据集已在 Hugging Face 开放下载。AI模型具身智能开源/仓库数据集物理交互智元推荐理由:做具身智能或世界模型研究的团队终于有了真实物理交互数据,不再是模拟器里的完美动作——补齐了训练的关键短板,搞机器人的建议直接去 Hugging Face 下载。原文
08:48Simon Willison’s Weblog(博客/媒体)micropython-wasm 0.1a1 版本发布,主要修复了作者在构建 datasette-agent-micropython 时遇到的一些限制。该项目将 MicroPython 编译为 WebAssembly,可在浏览器或 Node.js 中运行 Python 代码,适用于沙箱化执行场景。新版本解决了此前版本中的兼容性问题,提升了在 WebAssembly 环境下的可用性。对于需要在 Web 端安全运行 Python 脚本的开发者来说,这是一个实用的工具。AI产品PythonWebAssembly沙箱micropython-wasm开源/仓库推荐理由:如果你需要在浏览器或 Node.js 中安全运行 Python 代码,micropython-wasm 提供了一个轻量沙箱方案,这次更新修复了关键限制,做 Web 端 Python 沙箱的开发者值得关注。原文
03:14IT之家(博客/媒体)72°微软推出开源框架 ASSERT,能将自然语言写成的行为规范自动转换为可执行的评估流程,包括生成测试场景、数据集、评估指标和计分卡。该框架通过四个阶段工作:细化行为规范、生成分层测试用例、运行测试并记录轨迹、对照行为分类评分。验证显示,ASSERT 生成的测试集覆盖更广,能暴露更多失败模式,与人工审核一致率达 80%-90%。该框架适用于行为定义明确的场景,旨在让评估更快速、明确和易于迭代。AI产品开源/仓库AI 评测智能体ASSERT微软推荐理由:做 AI 智能体或应用评测的开发者,终于有了一个能把需求文档直接变成测试用例的工具,省去手动编写评估脚本的繁琐,建议试试 ASSERT 的 travel-planning 实例。原文
02:50IT之家(博客/媒体)76°微软在Build 2026大会上推出Agent Control Specification(ACS)开源标准,旨在统一和细化AI智能体的行为控制。ACS允许开发、合规和安全团队共同制定策略规则,明确智能体允许或禁止的操作、需人工审批的行为及审计记录。该规范在智能体工作流的多个阶段(如输入接收前、工具调用前后、回复前)执行策略检查,支持允许、阻止、脱敏或人工审批等操作。ACS以单一文件定义策略,可随智能体跨框架迁移,并已支持LangChain、OpenAI Agents SDK、Anthropic Agents SDK、AutoGen、CrewAI、Semantic Kernel及MCP等主流框架。这解决了当前控制机制分散、难以审计和复用的问题,为AI智能体在企业级部署中的安全性和合规性提供了标准化方案。行业智能体开源/仓库安全/合规微软MCP/工具10 个信源在谈推荐理由:ACS解决了AI智能体在企业落地中行为失控的痛点,做智能体应用开发或合规管理的团队可以直接用这套标准统一策略,省去重复配置的麻烦。原文
01:59marktechpost@Asif RazzaqTinyFish 发布了开源多智能体系统 BigSet,用户只需用自然语言描述数据集需求,系统便会自动从实时网络中搜索并返回结构化表格。BigSet 由编排器和并行子智能体组成,能够高效处理复杂的数据收集任务。这一工具大幅降低了数据获取的门槛,对需要快速构建定制化数据集的开发者和研究人员意义重大。BigSet 完全开源,可直接部署使用。AI产品多智能体系统开源/仓库数据采集自然语言处理BigSet推荐理由:做数据分析和 AI 训练的人终于不用手动爬数据了——BigSet 用一句话就能生成结构化实时数据集,建议做 NLP 或数据工程的团队直接试试。原文
16:05marktechpost@Asif Razzaq精选JetBrains 发布了 Mellum2,一个 12B 参数的混合专家(MoE)模型,基于 Apache 2.0 开源协议。该模型在 10.6 万亿 token 上训练,专为多模型 AI 流水线中的快速专用任务优化,如代码补全、重构建议等。Mellum2 旨在平衡性能与效率,适合集成到开发工具中,提升开发者体验。其 MoE 架构使其在保持较小激活参数的同时,实现高精度输出。AI模型JetBrainsMellum2MoE代码补全开源/仓库推荐理由:JetBrains 把 MoE 模型塞进开发者工具链,做 IDE 插件或代码分析工具的团队可以直接用 Mellum2 替换通用模型,提升响应速度且不牺牲质量。原文
13:44IT之家(博客/媒体)精选72°JetBrains 于 6 月 1 日开源了 Mellum2 模型,这是其面向软件工程系统的新一代机器学习模型。相比原版 Mellum,Mellum2 从代码补全模型升级为完整的编码助手,上下文窗口从 8192 Token 扩展到 131072 Token。该模型总参数为 12B,采用稀疏混合专家框架,激活时参数量为 2.5B,在标准硬件上仍能保持较快计算。Mellum2 支持代码生成与编辑、外部工具调用、多步骤智能体工作流和长对话维持,定位在 AI 工作负载路由、低延迟 RAG 管线、复杂工作流中的子智能体以及私有本地 AI 部署。JetBrains 已开源基础版、指令版和思考版,开发者可在 Apache 2.0 许可证下使用。AI模型JetBrainsMellum2开源/仓库编程助手智能体推荐理由:JetBrains 把自家 IDE 的 AI 能力下放给社区了——做 JetBrains 插件开发或自建 AI 编程管线的团队,可以直接用 Mellum2 跑本地智能体工作流,省去自己训练和调优的麻烦。原文
00:56marktechpost@Michal Sutter精选Memory OS 是一个基于 Hermes Agent 的开源项目,通过六层记忆架构、门控检索和 Wiki 功能,为智能体添加本地持久记忆。该项目解决了智能体缺乏长期记忆的痛点,使 AI 能跨会话保持上下文。六层结构包括工作记忆、情景记忆、语义记忆等,支持高效检索和更新。开发者可直接集成,提升智能体的连续性和个性化能力。AI产品智能体开源/仓库记忆系统Hermes Agent本地持久化推荐理由:做智能体开发的团队终于有了开箱即用的记忆方案——Memory OS 的六层架构解决了长期记忆缺失的痛点,建议做对话系统或个性化助手的开发者直接集成试试。原文
00:33Hugging Face: Blog(博客/媒体)精选72°JetBrains 发布了 Mellum2,一个 12B 参数的混合专家(MoE)模型,专为代码生成和软件工程任务优化。该模型在 HumanEval 和 SWE-bench 等基准测试中表现优异,超越了同等规模的模型。Mellum2 基于 JetBrains 的代码数据训练,旨在为开发者提供更高效、更准确的代码补全和生成能力。该模型现已开源,可在 Hugging Face 上获取。AI模型JetBrainsMellum2MoE代码生成开源/仓库推荐理由:JetBrains 的 Mellum2 为 IDE 内代码生成带来了更精准的 MoE 方案,用 JetBrains 全家桶的开发者可以直接在 Hugging Face 上体验,看看它能否提升你的编码效率。原文
14:33Hugging Face: Blog(博客/媒体)83°NVIDIA 发布了 Cosmos 3,这是首个开源的物理 AI 全能模型,能够同时进行推理和行动。该模型基于多模态输入(如视觉、语言)理解物理世界,并生成可执行的动作序列。Cosmos 3 在机器人、自动驾驶等需要物理交互的领域具有重大意义,因为它将感知、推理和行动整合在一个模型中。NVIDIA 在 Hugging Face 上开源了该模型,开发者可以直接使用或微调。AI模型物理 AI开源/仓库NVIDIA机器人自动驾驶9 个信源在谈推荐理由:做机器人或自动驾驶的开发者终于有了一个开源的物理世界理解模型,能直接推理并生成动作,省去多模型拼接的麻烦,值得立即上手试试。原文