全部 AI 动态 · AI 热点

6月4日

14:43

宝玉@dotey

精选

Zara Zhang 的开源项目 feishu-claude-code-bridge 升级后，除了连接 Claude Code，现在也支持连接 Codex CLI，解决了 Claude 订阅计划对 claude -p 独立计费的问题。用户可通过飞书直接指挥 Codex 抓取网页、翻译、画图并创建飞书文档。项目工作原理是作为飞书消息与本地 CLI 的桥接，支持自定义工作区，且代码开源可定制。对于同时使用飞书和 AI 编程工具的团队，这是一个实用的效率工具。

AI产品飞书 Claude Code Codex 开源/仓库效率工具

推荐理由：飞书用户终于有了一个打通 AI 编程工具和协作平台的桥梁——升级后支持 Codex 并规避了 Claude 的计费变化，做自动化工作流的团队可以直接部署试试。

原文

14:31

marktechpost@Asif Razzaq

精选72°

斯坦福研究人员发布 OpenJarvis，一个完全在设备上运行的开源 AI 智能体框架，涵盖推理、智能体、记忆和学习。它将个人 AI 系统分解为五个可组合原语：智能、引擎、智能体、工具与记忆、学习。在性能上，OpenJarvis 仅比最佳云端模型低 3.2 个点，但边际 API 成本降低约 800 倍。该框架旨在实现隐私保护、低延迟和低成本，适合个人设备上的 AI 应用。

AI产品智能体开源/仓库本地优先记忆工具

推荐理由：OpenJarvis 解决了隐私和成本两大痛点，做本地 AI 智能体开发的团队可以直接用——性能接近云端但成本低 800 倍，值得一试。

原文

14:03

14:03IT之家（博客/媒体）

76°

Ideogram 发布 4.0 开放权重文生图模型，9.3B 参数，采用单流 DiT 架构，文本与图像 tokens 共享注意力序列。该模型在文字绘制上表现突出，能准确呈现长文本，适合海报、商品图等场景。通过边界框和结构化 JSON 训练，用户可精确控制版式和元素位置。在 DesignArena 人类评价榜单中排名全球第 4，超越 Nano Banana Pro，成为最强开源生图模型。

AI模型 Ideogram 4.0 开源/仓库文生图扩散 Transformer 文字绘制

推荐理由：做设计、营销或内容创作的团队终于有了开源可部署的高质量生图模型——Ideogram 4.0 的文字绘制和布局控制能力直接对标商用产品，建议下载权重试试。

原文

13:01

阶跃星辰 Stepfun@Stepfun_AI

精选

StepFun 发布 Step 3.7 Flash 模型，主打高智能与高速度的平衡。该模型采用 MTP 辅助解码技术，输出速度超过 400 tokens/s，具备更强的智能体性能和原生多模态能力。模型权重以 Apache 2.0 协议开源，适合生产级智能体工作负载。独立评测者 @ArtificialAnlys 对其进行了详细评估。

AI模型推理模型开源/仓库智能体多模态 StepFun

推荐理由：做智能体应用或需要高吞吐推理的团队，Step 3.7 Flash 的开源高速度方案值得直接拿来用，尤其适合生产环境部署。

原文

10:56

arXiv cs.AI@Linyao Chen, Qinlao Zhao, Zechen Li, Mingming Li, Likun Ni, Jinyu Chen, Yuhao Yao, Xuan Song, Noboru Koshizuka, Hiroki Kobayashi

AgentMob 提出了一种无需训练的 LLM 驱动智能体框架，用于个体级移动预测。它通过快速路径处理常规出行，对模糊情况则触发迭代工具调用，结合历史轨迹、停留概率和地理证据进行决策。在三个数据集上，AgentMob 在无需训练的 LLM 方法中表现最佳，GPT-5.4 在 BW 数据集上达到 71.42% 的 Acc@1。该方法显著提升了模糊预测的准确性，并提供了决策透明度。代码已开源。

论文移动预测 LLM智能体可解释性工具调用开源/仓库

推荐理由：做城市模拟、交通规划或政策分析的团队，终于有了一个无需训练就能解释预测结果的方案——AgentMob 在模糊场景下准确率提升 18%，建议直接试一下开源代码。

原文

10:35

arXiv cs.AI@Zhangchen Xu, Junda Chen, Yue Huang, Dongfu Jiang, Jiefeng Chen, Hang Hua, Zijian Wu, Zheyuan Liu, Zexue He, Lichi Li, Shizhe Diao, Jiaxin Pei, Jinsung Yoon, Hao Zhang, Mengdi Wang, Radha Poovendran, Misha Sra, Alex Pentland, Zichen Chen

精选76°

AutoLab 是一个新基准，用于评估 AI 模型在超长周期闭环优化任务中的表现，涵盖系统优化、谜题挑战、模型开发和 CUDA 内核优化四个领域。每个任务从次优基线开始，要求智能体在严格时间预算内通过反复实验和反馈改进。测试 17 个前沿模型后发现，成功的关键不是初始尝试的质量，而是持续迭代和利用经验反馈的能力。Claude Opus 4.6 表现突出，但多数模型过早终止或进展有限。该基准开源，旨在推动长周期自主智能体的研究。

论文基准测试长周期优化智能体 Claude Opus 4.6 开源/仓库

推荐理由：AutoLab 填补了现有基准只测短周期任务的空白，做 AI 智能体研究和开发的团队可以直接用它来测试模型的持久迭代能力，值得关注。

原文

10:23

arXiv: Anthropic@Arquimedes Canedo, Grama Chethan

精选

当AI Agent调用API遇到验证错误时，传统做法返回自然语言错误描述，但Agent往往无法有效修复。该论文提出Self-Reflective API，在验证失败时返回机器可读的结构化恢复建议（recovery_feedback.suggestions[]），使Agent能直接修复请求并重试，无需外部推理。在30个样本、3个LLM、10个对抗任务的实验中，结构化建议在Anthropic模型上将任务完成率提升36.7-40个百分点，且每个成功token效率提升1.8-2.2倍。在gpt-4o-mini上效果不显著，但计费API的二次验证确认了模式。研究还发现了LLM基准测试中两类未记录的答案泄露问题，并开源了审计工具。

论文 Agent API设计错误恢复结构化反馈开源/仓库

推荐理由：做Agent系统或API设计的开发者，这个方案直接解决了Agent调用API时频繁失败、需要人工介入的痛点——用结构化建议代替自然语言错误，让Agent自己就能修复重试，实测效果显著，建议直接参考其设计思路。

原文

10:19

berryxia@berryxia

78°

OpenMOSS团队发布开源模型MOSS-Audio，首次将语音、音乐和环境音统一建模，实现音频语言统一。该模型能同时转录语音、识别环境音、理解音乐情绪，并生成文本描述或执行下游任务。它登顶Hugging Face Trending第一，代码和模型权重完全开源可商用。这颠覆了音频AI作为视觉/文本附属品的认知，让普通开发者能本地搭建音频Agent。开源社区在音频多模态领域的速度和开放度已领先闭源方案。

AI模型开源/仓库音频模型多模态 MOSS-Audio 智能体

推荐理由：做音频Agent或播客工具的开发者终于不用在闭源高价和割裂方案间纠结——MOSS-Audio一个模型搞定语音+声音+音乐，直接本地跑，建议立刻拉下来试试。

原文

10:02

pandaily@contact@pandaily.com (Pandaily)

精选76°

中国科学技术大学（USTC）研究人员开源了一种创新的智能体驱动长上下文训练范式，该范式通过智能体引导的数据生成和训练策略，显著提升了长上下文处理效率。实验表明，一个30亿参数的模型在长上下文任务上达到了与阿里巴巴Qwen3-235B模型相当的性能，而参数量仅为后者的八分之一。这一突破降低了长上下文模型训练的门槛，为资源有限的团队提供了高效方案。该范式已开源，有望推动长上下文AI应用的普及。

论文长上下文智能体开源/仓库训练范式 USTC

推荐理由：中科大用30B模型打平235B的长上下文能力，做长上下文训练的团队可以直接复用这套开源范式，省下大量算力和数据成本。

原文

07:42

Ideogram@ideogram_ai

Ideogram 4.0 在第三方评测平台 DesignArena 的排行榜上成为全球第一的开源权重文生图模型。其性能仅次于 OpenAI 和 Google 的闭源模型，在开源模型中处于领先地位。该模型提供前沿质量、完全可定制性和数据隐私保护。这标志着开源文生图模型在质量上又迈出了一大步。

AI模型 Ideogram 4.0 开源/仓库文生图模型 DesignArena 排行榜

推荐理由：开源社区终于有了一个能接近闭源巨头（OpenAI/Google）的文生图模型，做图像生成应用或研究的团队可以直接下载权重，享受前沿质量与数据隐私。

原文

04:27

Decoder@Matthias Bastian

78°

Google DeepMind 发布了 Gemma 4 12B 开源模型，原生支持文本、图像和音频处理，仅需 16GB 内存即可在笔记本上运行。该模型在基准测试中几乎与两倍大小的 26B 模型持平，并采用 Apache 2.0 许可证，允许商业使用。这标志着多模态 AI 在消费级硬件上的重大突破，降低了开发者和企业的使用门槛。

AI模型多模态开源/仓库 Gemma 4 Google DeepMind 本地推理

推荐理由：多模态模型终于能跑在普通笔记本上了，做本地 AI 应用或边缘计算的开发者可以直接下载试试，性能还接近两倍大的模型。

原文

03:21

Clement Delangue@ClementDelangue

Hugging Face CEO Clement Delangue 指出，通过路由（routing）和后训练（post-training）开源模型，不仅能提升系统准确性，还能显著降低成本和提高速度。法律 AI 公司 Harvey 与 Fireworks AI 合作，在 100 个法律任务上测试发现：混合智能体（GLM 5.1 为主，路由到 Opus 4.7 作为顾问）在质量和成本上均优于单一前沿模型，18% 全通过率 vs 14%，成本 $368 vs $954。后训练（SFT）将 Kimi 2.6 的全通过率从 11% 提升至 15%，超过 Opus 的 14%，成本仅 $84，是 Opus 的 1/11。这挑战了“前沿模型在所有场景都更好”的营销叙事，为开发者提供了更务实、经济的 AI 系统构建思路。

AI产品路由/混合智能体开源/仓库法律 AI Harvey Fireworks AI

推荐理由：法律 AI 团队终于有了可落地的降本增效方案——路由+微调开源模型比纯用前沿模型便宜 11 倍还更准，做垂直领域 AI 应用的开发者可以直接参考 Harvey 的实践。

原文

03:14

LangChain@LangChainAI

LangChain 推出 Managed Deep Agents，结合开源 Deep Agents 框架与 LangSmith 平台，提供持久化执行、托管上下文、沙箱工作流和可观测性。这一方案让开发者既能利用开源框架的灵活性，又能享受托管平台的稳定性和监控能力，适合需要可靠 AI 代理的生产环境。

AI产品智能体 LangChain LangSmith 开源/仓库生产部署

推荐理由：做 AI 代理的团队终于不用在灵活性和稳定性之间二选一了——开源框架 + 托管平台，生产部署可以直接用。

原文

03:12

03:12Google Research: Blog（资讯）

Google 宣布开源其水文框架，旨在提升全球洪水预测与应对能力。该框架结合了 Earth AI、生成式 AI 和开源模型，能够更准确地模拟洪水风险。此举将帮助社区、政府和组织更好地准备和应对洪水灾害，减少生命财产损失。开源意味着全球开发者可以贡献和定制，加速气候适应技术的普及。

AI产品开源/仓库洪水预测气候适应 Earth AI 生成式 AI

推荐理由：气候科技和防灾领域的团队终于有了 Google 级别的开源工具——水文框架直接提升洪水预测精度，做灾害管理、城市规划或气候适应的开发者可以立即研究并集成。

原文

02:55

elvis@omarsar0

78°

Miso One 是一个 8B 参数的开源文本转语音模型，具备真实情感范围，能表达温暖、犹豫和兴奋等情绪，告别机械感。它专为短视频、播客和教育内容等配音场景设计，推理延迟仅 110 毫秒，快于人类反应时间。模型权重完全开源，支持自托管、微调和数据隐私保护，适合将语音集成到工具和产品的开发者。

AI模型 Miso One 文本转语音情感语音开源/仓库配音

推荐理由：做语音合成或配音工具的开发者终于有了一个情感丰富且开源的 TTS 模型——Miso One 的 8B 参数和 110ms 延迟让实时配音成为可能，建议直接克隆仓库试试。

原文

02:51

marktechpost@Asif Razzaq

88°

Google DeepMind 发布了 Gemma 4 12B，一款无编码器的多模态模型，直接将视觉和音频输入送入 LLM 主干，无需传统视觉或音频编码器。该模型原生支持音频理解，可在 16GB 内存的笔记本电脑上本地运行，并采用 Apache 2.0 开源许可。这降低了多模态 AI 的硬件门槛，让开发者能在消费级设备上部署视觉和音频处理能力。Gemma 4 12B 的发布标志着多模态模型向轻量化和本地化迈出重要一步。

AI模型多模态模型开源/仓库 Gemma 4 12B 本地部署无编码器

推荐理由：多模态模型终于能跑在普通笔记本上了，做本地 AI 应用或边缘计算的开发者可以直接下载试用，16GB 内存就能跑视觉+音频推理，开源许可也友好。

原文

02:42

Google AI Developers@googleaidevs

Google AI 开发者团队宣布推出 Gemma 3 模型，该模型兼容 llama.cpp、MLX、LM Studio、vLLM、Ollama、UnslothAI 和 SGLang 等主流推理框架。权重已同步上传至 Kaggle 和 Hugging Face 平台，开发者可自由下载使用。这一发布意味着 Gemma 3 能无缝融入现有 AI 工具链，降低部署门槛。

AI模型 Gemma 3 Google 推理框架开源/仓库模型部署

推荐理由：Google 终于把 Gemma 3 的兼容性做全了——主流推理框架全覆盖，做本地部署或模型微调的开发者可以直接去 Hugging Face 下载权重，省去适配烦恼。

原文

01:46

Fireworks AI@FireworksAI_HQ

Fireworks AI 在 Harvey 的法律智能体基准上测试了稀疏顾问模式：用 GLM 5.1 作为执行工人，Claude Opus 4.7 作为稀疏顾问，结果全部通过率从 Opus 单独运行的 14/100 提升至 18/100，成本仅为 Opus 单独运行的 39%。该模式通过让强大模型仅在关键步骤提供建议，显著降低了推理成本。Fireworks 已开源相关 harness 设计、顾问模式及训练结果。

AI产品智能体法律AI GLM 5.1 Claude Opus 4.7 开源/仓库

推荐理由：法律 AI 团队终于有了降本增效的实战方案——用 GLM 5.1 搭配 Claude Opus 4.7 做稀疏顾问，性能提升 28% 的同时成本砍掉 61%，做法律智能体或长链推理的开发者值得一试。

原文

01:30

SiliconFlowAI@siliconflowai

Andrej Karpathy 的 llm-wiki 项目在短时间内获得超过 5000 个 GitHub 星标。该项目旨在让 LLM 自动构建和维护一个知识库，避免每次会话都重新发现知识。用户可以通过 OpenCode、JustSisyphus OMO 和 SiliconFlow 等工具搭建自己的 llm-wiki。这解决了 AI 对话中知识无法积累的问题，让每次使用都变得更智能。

AI产品知识管理 LLM 开源/仓库 Karpathy 智能体

推荐理由：Karpathy 的 llm-wiki 解决了 AI 对话中知识碎片化的痛点，做知识管理或频繁使用 LLM 的团队可以试试，让 AI 越用越聪明。

原文

01:23

Ideogram@ideogram_ai

78°

AI模型 Ideogram 4.0 开源/仓库图像生成生成式媒体设计

推荐理由：Ideogram 4.0 开源让图像生成模型更易定制，做设计工具或内容创作的团队可以直接上手尝试，值得关注。

原文

01:14

Justine Moore@venturetwins

AI模型图像生成开源/仓库 Ideogram AI 模型发布 AI 艺术

推荐理由：图像生成模型终于有了开源权重版本，做 AI 艺术或需要定制化图像生成的开发者可以直接下载微调，值得一试。

原文

01:09

Justine Moore@venturetwins

72°

Ideogram 4.0 是一款新发布的开源图像模型，权重可下载，支持在自有硬件上运行和微调。该模型在文本渲染、高分辨率图像生成和设计方面表现优异，被官方称为“世界上最好的开源图像模型”。目前已在所有 Ideogram 计划和 API 上可用。用户可下载权重、用自己的数据微调，并在本地硬件上运行。

AI模型开源/仓库图像生成文本渲染设计 Ideogram

推荐理由：开源图像模型又添猛将，做设计、生成海报或需要高质量文本渲染的团队可以直接下载权重微调，值得一试。

原文

00:45

a16z@a16z

精选72°

Ideogram 4.0 正式发布，并宣布开源权重。该模型被官方称为“世界上最好的开源图像模型”，支持用户下载权重、在自有数据上微调，并可在本地硬件上运行。目前已在所有 Ideogram 套餐和 API 上可用。这一举措将推动图像生成领域的开源生态发展，为开发者和创作者提供更多自主权和灵活性。

AI模型开源/仓库图像生成 Ideogram 4.0 模型权重本地部署

推荐理由：图像生成领域终于有了一个真正能打的开源模型——Ideogram 4.0 权重可下载、可微调、可本地跑，做 AI 图像应用或研究的团队可以直接上手试试。

原文

00:33

Philipp Schmid@_philschmid

76°

Google 发布了 Gemma 4 12B，这是其首个支持原生音频输入的中型多模态模型。该模型采用无编码器架构，直接将视觉和音频信息融入大语言模型，仅需 16GB 内存即可运行。在基准测试中，其性能接近 26B 参数模型，且采用 Apache 2.0 开源许可。这标志着中小型模型在多模态能力上的重要突破，尤其适合资源受限的开发者。

AI模型 Gemma 4 多模态模型音频输入开源/仓库 Google

推荐理由：Gemma 4 12B 让中小团队也能用上原生音频多模态模型，16GB 内存门槛极低，做语音交互或视觉应用的开发者可以直接下载试试。

原文

00:30

lmarena.ai@lmarena_ai

Ideogram 4.0 开源模型在 Text-to-Image Arena 中排名第8，成为该榜单上最强的开源图像生成模型。该模型得分为1204，性能接近闭源模型 Nano Banana Pro。Ideogram 4.0 支持权重下载、微调和本地部署，已在所有 Ideogram 计划和 API 上线。这一发布标志着开源图像生成模型在质量上迈出了重要一步。

AI模型开源/仓库图像生成 Ideogram Text-to-Image Arena 模型评测

推荐理由：开源图像生成模型终于追上闭源水平了，做 AI 绘画应用或自建图像生成管线的开发者可以直接下载权重和微调，值得试试。

原文

6月3日

22:39

22:39IT之家（博客/媒体）

京东发布并开源了 JoyAI-Echo 长音视频生成框架，解决了长视频生成中角色身份、声音不一致和生成速度慢的行业难题。该框架内置记忆库，可在多镜头中保持角色外观和音色一致，实测 5 分钟视频无崩坏。通过 DMD 技术实现约 7.5 倍推理加速，并支持对话式编辑，用户可直接用自然语言修改镜头，无需重跑整条视频。京东官方称该框架已进入全球第一梯队，项目已开源在 GitHub。

AI产品视频生成开源/仓库京东 JoyAI-Echo 对话式编辑

推荐理由：长视频生成领域终于有了能保持角色一致的开源方案，做视频生成、影视制作的团队可以直接拿来用，省去大量后期修复时间。

原文

21:57

21:57IT之家（博客/媒体）

上海海思一站式集成开发环境 HiSpark Studio 正式在 GitCode 平台开源。该 IDE 基于 VS Code 扩展架构，提供工程管理、代码编辑、编译构建、烧录调试、图形化配置等全链路开发能力。开源后开发者可自由修改源码并拓展功能，已支持智能设备、星闪（NearLink）和嵌入式 AI 等开发场景。核心亮点包括一键 SDK 下载、图形化系统配置、AI 模型处理及远程开发等。这降低了海思芯片开发门槛，尤其利好嵌入式与物联网开发者。

AI产品海思 HiSpark Studio 开源/仓库嵌入式开发 IDE

推荐理由：海思芯片开发者终于有了可定制的官方 IDE，能自由改源码和扩展功能，做智能设备或嵌入式 AI 的团队可以直接在 GitCode 上获取并尝试。

原文

20:03

Geek@geekbb

Datawhale 推出了一套开源的世界模型课程，包含五讲和五个配套项目，覆盖从 VAE 到 Dreamer 再到评估仪表盘的完整学习路径。课程强调动手实践，帮助学习者系统理解世界模型的原理、架构和实现。对于想深入世界模型领域的研究者、学生或开发者来说，这是一份难得的免费学习资源。

AI模型世界模型开源/仓库课程 VAE Dreamer

推荐理由：想系统入门世界模型的开发者终于有了一条清晰的动手路径——五讲五项目从 VAE 到 Dreamer 全覆盖，比啃论文高效得多，建议直接跟着项目跑一遍。

原文

19:15

Decoder@Maximilian Schreiner

78°

Nous Research 推出了 Hermes Desktop，一个基于 MIT 许可证的开源 AI 智能体应用。该应用旨在跨平台运行，为用户提供统一的 AI 助手体验。Hermes Desktop 支持多种操作系统，包括 Windows、macOS 和 Linux，并集成了本地 AI 模型，确保数据隐私。这一发布标志着开源 AI 智能体在桌面端的重大进展，让开发者可以自由定制和部署。

AI产品智能体开源/仓库跨平台桌面应用 Nous Research

推荐理由：开源 AI 智能体终于有了跨平台桌面版，做本地化 AI 应用的开发者可以直接用 MIT 许可证代码，省去从头搭建的麻烦。

原文

19:13

小互@imxiaohu

国内团队开源了 OpenSquilla，用 Python 重写了“小龙虾”项目，解决了其 Token 消耗高、不按规则执行和安全问题。它集成本地小模型，对请求进行智能路由：简单任务派给便宜模型，复杂任务才用顶级模型，类似医院分诊。官方测试显示，25 个任务混合使用 Opus 4.7、GLM 5.1 和 DS4 Flash，成本从 6.2 美元降至 0.68 美元，效果几乎一致。此外，它还能根据对话语义只注入匹配度最高的 Skill，避免将所有 Skill 描述塞入上下文，100 次对话可省 100 万 Token。

AI产品开源/仓库 Token 优化模型路由成本控制 Python

推荐理由：AI 调用成本高、Token 浪费严重的团队终于有了实用解法——OpenSquilla 智能路由能省 90% 费用，做多模型编排或 Skill 密集型应用的开发者值得立刻试试。

原文

18:11

Geek@geekbb

Harness 是一个开源工具，能让 AI Agent 直接操控 Windows 上的 WPS Office、Adobe 全家桶和 Zotero 等桌面应用。它通过模拟用户操作实现自动化，无需 API 或插件，解决了 AI 与桌面软件交互的难题。这对于需要自动化办公、设计或文献管理的用户来说，是一个实用的开源方案。项目已在 GitHub 上发布，开发者可以快速集成或扩展。

AI产品 AI Agent 桌面自动化开源/仓库 WPS Office Adobe

推荐理由：做办公自动化或 AI 工作流的开发者，终于有了一个能直接操控 WPS 和 Adobe 的开源方案，建议试试这个 Harness 项目。

原文

17:03

Geek@geekbb

QMAI 是一款专为长篇小说创作设计的记忆型 AI 写作桌面系统，旨在解决 AI 写作中常见的遗忘前文、人设崩坏和时间线混乱等问题。该系统通过内置的记忆机制，能够持续跟踪故事上下文，确保角色设定和情节逻辑的一致性。对于需要创作复杂长篇故事的作者，QMAI 提供了一种更可靠的 AI 辅助写作方案。项目已在 GitHub 开源，开发者可以自行部署或参与改进。

AI产品 AI写作长篇小说记忆系统开源/仓库 QMAI

推荐理由：长篇小说创作者终于有了能记住前文的 AI 工具——QMAI 通过记忆机制解决人设崩坏和时间线混乱，写长篇的可以直接去 GitHub 试试。

原文

16:41

marktechpost@Asif Razzaq

83°

NVIDIA 发布了 Cosmos 3，这是一款开源的“全模态世界模型”，采用双塔混合 Transformer 架构，将自回归 VLM 推理器与扩散生成器结合。该模型能够统一物理推理、世界生成和动作生成，为物理 AI 提供基础能力。Cosmos 3 旨在让机器人、自动驾驶等系统更好地理解物理世界并生成合理动作。其开源特性有望加速物理 AI 领域的研究与应用开发。

AI模型 NVIDIA Cosmos 3 物理 AI 世界模型开源/仓库

推荐理由：NVIDIA 把物理推理和世界生成塞进一个开源模型，做机器人或自动驾驶的团队可以直接拿来用，省去从头训练物理世界模型的成本。

原文

16:05

Ate-a-Pi@svpino

Bigset 是一个开源工具，用户只需描述所需数据，即可自动生成结构化数据集。它通过编排智能体搜索网络，并派发子智能体并行抓取数据，最终输出可下载的 CSV/JSON 文件。例如，输入“亚马逊上所有徕卡镜头”或“京都徕卡门店及评分”，即可获得整理好的数据。该工具底层调用 TinyFish 的免费搜索与抓取 API，支持定时刷新和自托管。对于需要快速收集结构化信息的开发者、数据科学家或研究者，Bigset 提供了一条低代码、高效率的路径。

AI产品开源/仓库数据集智能体数据抓取 TinyFish

推荐理由：Bigset 解决了手动收集和整理网络数据的高成本问题，适合需要快速获取结构化数据集的开发者、数据科学家或研究者，直接输入自然语言就能拿到结果，值得一试。

原文

14:48

Pandaily@contact@pandaily.com (Pandaily)

精选

中国开源世界模型 Boundless 在全球排行榜上超越 Google、NVIDIA 等巨头的产品，成为第一名。世界模型是能理解和模拟物理现实的 AI 系统，对机器人、自动驾驶等领域至关重要。Boundless 的开源特性降低了研究门槛，让更多团队能参与开发。这一突破显示中国在 AI 基础模型领域的竞争力正在增强。

AI模型世界模型开源/仓库物理模拟中国AI Boundless

推荐理由：世界模型是 AI 的下一个前沿，做机器人或自动驾驶的团队可以直接用 Boundless 开源代码加速研发，值得关注。

原文

14:17

ollama@ollama

Nous Research 发布了 Hermes Desktop，这是 Hermes Agent 的桌面原生版本，首次在 Jensen 的 GTC 主题演讲中演示，现已公开预览。该工具允许用户通过 Ollama 使用本地或云端模型，实现智能体功能。这意味着开发者可以在自己的机器上运行 Hermes，无需依赖远程服务器，降低了使用门槛。对于希望探索本地 AI 智能体的用户来说，这是一个值得关注的新选择。

AI产品智能体 Hermes Desktop Ollama 本地模型开源/仓库

推荐理由：Hermes Desktop 让本地 AI 智能体落地更简单，做自动化或智能体开发的团队可以直接通过 Ollama 体验，无需复杂配置。

原文

12:21

12:21IT之家（博客/媒体）

精选

智元机器人开源了行业首个聚焦物理交互的具身数据集 AGIBOT WORLD 2026 第二期“多样交互”。该数据集系统记录了机器人与真实物理世界之间的复杂、高密度、非理想交互过程，旨在补齐当前世界模型训练中缺失的真实物理交互数据。它将具身智能的数据范式从“学习成功动作”推进到“理解完整的物理分布”，对世界模型、神经仿真器、物理感知等研究至关重要。目前数据集已在 Hugging Face 开放下载。

AI模型具身智能开源/仓库数据集物理交互智元

推荐理由：做具身智能或世界模型研究的团队终于有了真实物理交互数据，不再是模拟器里的完美动作——补齐了训练的关键短板，搞机器人的建议直接去 Hugging Face 下载。

原文

11:49

Geek@geekbb

精选

Ore Code 是一款专为 DeepSeek 设计的桌面端 AI 编码工作台，支持 macOS 和 Windows。它聚焦长上下文编码、结构化工具调用、本地项目上下文理解，并集成了 MCP 协议、技能和自动化功能。该项目已在 GitHub 开源，旨在为开发者提供更高效的 AI 辅助编程体验。

AI产品 DeepSeek 桌面端 AI 编码工作台 MCP/工具开源/仓库

推荐理由：如果你在用 DeepSeek 做编码，Ore Code 把长上下文、工具调用和项目上下文整合到了桌面端，省去来回切换的麻烦，做 AI 编程的开发者可以直接下载试试。

原文

11:12

arXiv: OpenAI@Justice Owusu Agyemang, Jerry John Kponyo, Kwame Opuni-Boachie Obour Agyekum, Francisca Adoma Acheampong, Kwame Agyeman-Prempeh Agyekum, James Dzisi Gadze

精选

Entropy Gate 提出了一种基于熵淬火（entropy quenching）的令牌压缩框架，通过为每个令牌计算多因素信息能量，并模拟热力学过程逐步“冻结”低能量令牌，实现近无损压缩。该框架在五种提示类别上达到40-60%的压缩率，同时保持语义保真度（S_E > 0.80）。上下文去重可额外节省50-70%的重复块开销，输出端压缩进一步减少响应冗余。结合外部存储时，代理工作负载的压缩率可达88-96%。该方案无状态、模型无关，可作为兼容OpenAI的HTTP代理部署。

论文令牌压缩熵淬火语义保真度 LLM管道开源/仓库

推荐理由：LLM 开发者常被冗长上下文和重复输出浪费大量令牌预算——Entropy Gate 用热力学思路解决了这个痛点，做长上下文推理或代理应用的团队可以直接集成，省令牌就是省成本。

原文

10:45

arXiv cs.LG@Tao Chen, Gangwei Jiang, Pengyu Cheng, Siyuan Huang, Yihao Liu, Jingwei Ni, Jiaqi Guo, Mengyu Zhou, Kai Tang, Junling Liu, Qinliang Su, Xiaoxi Jiang, Guanjun Jiang

精选

当前大语言模型后训练中的奖励模型依赖规则验证器、真实参考、程序检查表等异构标准，缺乏统一机制。Skill-RM 将奖励建模重构为可复用的“奖励评估技能”执行过程，通过智能体动态选择和聚合证据，实现一致且透明的评估。在奖励基准和下游任务（如 Best-of-N 选择和强化学习）中，Skill-RM 持续超越传统基线。该方法为奖励建模提供了统一解决方案，并通过策略性证据编排取得更优性能。代码已开源。

论文奖励模型智能体 LLM后训练强化学习开源/仓库

推荐理由：做 LLM 后训练（RFT/RL）的团队终于有了统一的奖励评估框架，不用再为不同任务拼凑规则和检查表了——Skill-RM 用智能体思路动态整合证据，效果还更好，做对齐和强化学习的建议直接看代码。

原文