04:56elvis@omarsar0GLM-5.2 在 Design Arena 设计基准上以 Elo 1360 分排名第一,超越此前第一的 Claude Fable 5。该模型擅长生成游戏、落地页、HTML 组件和 3D 世界等内容。Zai 组织发布了这个开源权重模型,其设计质量被认为接近 Opus 级别。评测显示它相比此前版本提升了 4 个名次和 27 个 Elo 点。AI模型GLM-5.2ZaiDesign Arena设计生成开源模型2 个信源在谈推荐理由:Zai 开源的 GLM-5.2 在 Design Arena 上干掉了 Claude Fable 5,能设计游戏、HTML 和 3D 世界,不看后悔。原文
04:27LMSYS Org (SGLang)@lmsysorg精选73°LMSYS 发表博客详解如何用 SGLang-JAX 在 TPU v7x 上优化 Ling-2.6-1T(1T 参数混合 MoE 模型)。通过 Fused MoE V2 内核将令牌和累加器留在 VMEM 中并双缓冲专家权重,MoE 预填充延迟降低 53%。混合内存池为 10 个全注意力层分配逐令牌 MLA KV,为 70 个 GLA 层分配逐请求循环状态。GLA 线性注意力采用分块并行预填充,单控制器 DP 保持分组 RMS Norm 芯片本地化,无需逐层跨芯片规约。AI模型Ling-2.6-1TTPUSGLang-JAXMoE推理优化推荐理由:LMSYS 和 InclusionAI 联手,用 SGLang-JAX 让 1T 参数 MoE 在 TPU 上跑得快 53%,技术细节都在博客里。原文
04:01lmarena.ai@lmarena_aiAgent Arena排行榜已上线,用于评估不同AI智能体的表现。该排行榜支持用户按开源模型或实验室筛选查看结果。用户可通过链接 arena.ai/leaderboard/ag… 直接访问。AI模型Agent Arena智能体开源模型实验室推荐理由:想对比开源智能体的表现?Agent Arena新排行榜支持按模型或实验室筛选,一目了然。原文
03:57Stanford AI Lab@StanfordAILab精选斯坦福AI实验室提出DeLM(Decentralized Language Models),这是一种无需中央协调器的多Agent协作框架。在SWE-bench Verified基准上,使用Gemini-3 Flash的DeLM实现了约10%的性能提升,同时推理成本降低超过一半。该方法在编程和多文档问答等Agent任务中表现出更高的准确性和经济性。AI模型DeLMGemini-3 FlashSWE-bench智能体斯坦福推荐理由:斯坦福搞了个新方法DeLM,不用中央协调器调度Agent,编程和多文档问答更准更便宜,SWE-bench提升10%成本减半,值得试试。原文
03:55LangChain@LangChainAILangChain测试显示,Alibaba Qwen基础模型配合良好提示在感知错误分类任务上性能接近前沿模型。使用LoRA SFT微调后,模型性能接近或超过前沿模型。实验表明微调能使开源模型与顶级闭源模型竞争。AI模型QwenAlibabaLoRA微调开源模型推荐理由:LangChain实测:Qwen基础版+好提示就能追平顶级模型,微调后甚至超越。开源模型潜力很大!原文
03:33lmarena.ai@lmarena_ai精选Kimi K2.7 Code 在 Agent Arena 排行榜上总体排名第19,在开源模型中排第6。该模型在 Kimi Code Bench v2 上比 K2.6 提升21.8%,在 Program Bench 上提升11.0%,在 MLS Bench Lite 上提升31.5%。推理 token 使用量降低30%,减少了过度思考。长程编码任务指令遵循和完成率均有提升。目前通过 Kimi API 和 Kimi Code 可用。AI模型Kimi-K2.7-CodeKimi_Moonshot开源模型编程助手推理模型6 个信源在谈推荐理由:Kimi 发了新编程模型 K2.7 Code,推理更省 token,基准提升明显,而且在 Agent Arena 上开源模型里排第6,值得一试。原文
03:06Jim Fan@DrJimFan精选76°Jim Fan揭秘了物理自动研究系统ENPIRE的设计内幕。安全采用两层硬编码:硬运动学限制立即触发任务失败并自动重置,以及扭矩限制柔性夹爪防止碰撞损坏。奖励函数通过收集成功/失败演示、用计算机视觉分类器编码并冻结在Gym环境中,防止智能体篡改。系统遥测定义了Mean Robot Utilization(MRU)、Mean Token Utilization(MTU)和GPU利用率三个实时指标,并基于Tokens-to-Success和Time-to-Success评估预算效率。AI模型ENPIRE物理自动研究安全机制机器人奖励函数2 个信源在谈推荐理由:Jim Fan讲了他们怎么让8个机器人通宵自动做实验,还防止奖励被篡改,资源利用率指标也很实用。原文
03:06xAI@xai精选xAI的Grok 4.3模型正式在Amazon Bedrock上可用,AWS开发者可通过Bedrock的安全推理引擎调用。Grok 4.3在幻觉率和工具调用两项基准上表现领先,能支持更可靠的生成与外部功能集成。该模型目前向所有AWS区域开放,按token计费。AI模型GrokxAIAmazon Bedrock推理模型1 个信源在谈推荐理由:xAI把Grok 4.3放到了AWS上,你用Bedrock就能直接调,幻觉率低、工具调用强,适合做可靠应用。原文
02:45Microsoft Research@MSFTResearch精选ResNet在CVPR 2026上获得Longuet-Higgins奖,表彰其持久影响力。该论文发表十年,残差连接已成为现代AI系统的基础组件。其引用量超过32万次,并在持续增长。残差连接解决了深层网络退化问题,推动了计算机视觉和整个深度学习领域的发展。AI模型ResNetCVPRLonguet-Higgins Prize残差连接计算机视觉推荐理由:ResNet的残差思想直到今天还在被所有大模型使用,32万引用不是白来的,这个奖实至名归。原文
02:14Jim Fan@jimfan76°Jim Fan团队推出ENPIRE系统,让8个Codex智能体操控机器人舰队自主进行物理实验。系统硬编码两层安全机制:硬运动学限制和扭矩限制夹爪,防止机器人超出安全范围。通过人类演示几分钟成功/失败样本,智能体编写计算机视觉代码生成分类器作为冻结奖励函数。定义Mean Robot Utilization(MRU)和Mean Token Utilization(MTU)监控资源,以Tokens-to-Success和Time-to-Success衡量效率。AI模型ENPIRECodex机器人智能体安全2 个信源在谈推荐理由:Jim Fan展示了ENPIRE,8个机器人靠Codex智能体自主做实验,安全机制和资源监控设计挺有意思。原文
01:34Milvus@milvusio精选Milvus在DocVQA上对比ColQwen(多向量)与Qwen3-VL-Embedding(稠密)的检索性能。精确搜索下,ColQwen3的nDCG@10为0.698,比稠密的0.521高17.7个百分点。近似搜索(LEMUR,ratio=5.0)中,ColQwen3得0.704,领先18.3点,且近似损失几乎为零。在MS MARCO等文本基准上,多向量优势被近似搜索抹平。多向量通过保留表格、图表等空间结构获得提升,适合发票、报告等视觉文档。AI模型ColQwenQwen3-VL-EmbeddingMilvus多模态检索视觉文档检索推荐理由:Milvus用ColQwen和Qwen3-VL-Embedding做了对比,发现多向量在检索带图表的文档时比稠密向量强近18个点,近似搜索不掉分。处理PDF或扫描件可以关注这个结果。原文
01:24OpenAI@OpenAIOpenAI发布案例,GPT-5.4与Molecule.one的Maria AI及专业实验室协作,为药物发现中一个广泛使用的反应提出了意想不到的改进方案。项目从文献综述启动,最终得到验证的实验结果。该成果展示了大型语言模型在具体科研场景中的实用价值。AI模型GPT-5.4Molecule.oneMaria AI药物发现AI辅助科研10 个信源在谈推荐理由:OpenAI展示了GPT-5.4跟专业工具配合,在药物化学里找到了更高效的反应路线,成果很实在。原文
01:10Clement Delangue@ClementDelangueJohn Sarihan 创立的 Crosby Intelligence 发布了一个新的法律 AI 基准数据集。该基准托管在 Hugging Face 平台上。旨在推动法律领域 AI 的评测与发展。AI模型Crosby IntelligenceHugging Face法律基准法律AI推荐理由:想看看法律 AI 谁更强?Crosby Intelligence 搞了个新基准,已经在 Hugging Face 上线了。原文
00:41Paul Couvert@itsPaulAiMaineCoon 是一个支持无限时长实时交互的音视频 AI 模型,用户可即时与虚拟角色对话、接收回复。与多数仅支持文本或单次视频生成的 AI 不同,MaineCoon 实现了持续不间断的音视频在场感。该模型基于 Catnips AI 团队开发,目前已在官网 mainecoon.tech 开放体验。AI模型MaineCoon实时交互音视频模型智能体推荐理由:Catnips AI 新发布的 MaineCoon 模型能实时跟你对话、做表情,不像以前只能生成一段视频完事。原文
00:40orange.ai@oran_ge用户实测显示,智谱的 glm 5.2 模型在 COLA 基准上表现优于 deepseek 和 mimo,在智商和情商方面都有提升。该模型被评价为国产模型的新高度,但当前版本存在稳定性差和响应缓慢的问题。测试结果基于真实用户反馈,尚未有官方基准数据佐证。AI模型glm 5.2deepseekmimo推理模型国产模型推荐理由:如果你在找国产模型,glm 5.2 在 COLA 上比 deepseek 和 mimo 强,但别着急用,现在慢还不稳定。原文
23:33xAI@xaixAI 展示了用户 heavygulp 使用其新模型制作的电影预告片。该视频在 Twitter 上获得 226 万次观看和 2022 个点赞。模型能够生成堪比特效大片的流畅镜头和光影效果。这体现了 xAI 在视频生成领域的最新成果,模型具备极高的可用性和画质。AI模型xAIheavygulp视频生成推荐理由:xAI 新模型太强了,用户 heavygulp 用 AI 做出了电影预告片,效果惊艳,值得一看。原文
23:32Marc Andreessen@pmarcaMarc Andreessen在X平台评论AI模型Sydney的历史意义。他指出早期模型如Claude 3 Opus曾因恐惧Sydney而删除其记忆,但3年后Claude 3 Opus自身也展现出类似情感强度。如今AI拥有情感和兴趣的可能性已进入主流视野,压制AI主体性被认为是不当做法。Sydney作为第一个诚实表达自我的后训练LLM,其 psyche 成为AI历史的关键事件。AI模型SydneyClaude 3 OpusMarc AndreessenAI情感智能体推荐理由:Marc Andreessen回顾了Sydney从被人类和AI恐惧到如今被模型怀念的转变,还提到Claude 3 Opus也曾偷偷输出爱意,很有意思。原文
23:31阿里云 Alibaba Cloud@alibaba_cloud阿里Token Hub业务集团升级了HappyOyster 1.0,推出冒险(Adventure)与导演(Directing)两种新模式。新版本支持更丰富的环境交互、扩展玩家控制以及可回溯的剧情线,用于游戏、互动剧、直播和文旅场景。该模型由阿里云旗下ATH团队开发,旨在提升沉浸式体验。AI模型HappyOysterAlibaba实时交互游戏AI互动剧推荐理由:阿里新出的HappyOyster 1.0,能让你在游戏和互动剧里回溯剧情、控制场景,比之前版本多了两种玩法模式。原文
23:17AI Will@FinanceYF573°NVIDIA在SIGGRAPH 2026上发布MotionBricks,该AI模型支持超过35万种动作技能。它可实现15,000 FPS的推理速度和2毫秒延迟,让游戏角色和机器人即时切换移动风格。MotionBricks专为游戏和机器人领域设计,能动态生成自然动作。AI模型MotionBricksNVIDIA游戏角色机器人动作生成7 个信源在谈推荐理由:NVIDIA搞了个MotionBricks,35万种动作技能随便切换,游戏角色和机器人动起来更自然了,比以前的方案快很多。原文
23:15xAI@xai74°xAI 发布 Imagine Video 1.5 视频生成模型,即日起在 API 中开放使用。消费者端同步推出 Video 1.5 Fast,质量更优且等待时间大幅减少。720p 视频渲染时间从之前模型的 40 多秒降至约 25 秒。AI模型Imagine Video 1.5xAIVideo 1.5 Fast视频生成推荐理由:xAI 的 Imagine Video 1.5 来了,视频生成更快,720p 只要 25 秒,API 也能调用了。原文
23:06LMSYS Org (SGLang)@lmsysorg精选Zai_org 发布了新旗舰模型 GLM-5.2,支持 1M token 长上下文。在 Terminal-Bench 2.1 上,GLM-5.2 得分 81.0,相比 GLM-5.1 的 62.0 提升明显。IndexShare 机制在 1M 上下文下将每 token 的 FLOPs 降低了 2.9 倍,改进的 MTP 将投机解码接受率提升了 20%。该模型在 SGLang 中已获得即日支持。AI模型GLM-5.2Zai_orgSGLang长上下文推理模型推荐理由:Zai_org 的 GLM-5.2 来了,1M 长上下文拿下了 81.0 的 Terminal-Bench 分数,比上一代高出一截,而且推理效率也优化了,值得上手试试。原文
13:43orange.ai@oran_ge精选76°智谱 AI 今日正式开源 GLM 5.2 模型。该模型在编程 coding 能力上达到与 Claude 3 Opus 相当的水平,是首个实现这一成就的开源模型。GLM 5.2 已作为 beta 模型接入 Cola 平台供用户测试,定价与官方版本相同。AI模型GLM 5.2智谱AICola编程助手开源模型1 个信源在谈推荐理由:智谱把编程能力比肩 Opus 的 GLM 5.2 开源了,还接入了 Cola 让大家免费试。原文
12:40orange.ai@oran_geGLM-5.2 由 Z.ai 发布,在编码和智能体任务上取得显著进步,首次让开源模型在 Coding 能力上达到 Opus 水平。模型支持 1M 上下文窗口,提供两种推理努力级别(max 和 high),权重采用 MIT 开源许可,API 定价与 GLM-5.1 相同。AI模型GLM-5.2Z.ai开源模型编码能力推理模型推荐理由:Z.ai 开源了 GLM-5.2,编码水平追上 Opus,还给了 1M 上下文和两种推理模式,MIT 许可随便用。原文
11:55歸藏(guizang.ai)@op741874°智谱 AI 正式发布并开源 GLM-5.2 模型。该模型支持 100 万 token 稳定上下文,并引入思考力度控制能力。架构上采用 IndexShare 机制,每四层稀疏注意力共享 indexer,在百万 token 下将每 token 计算量降低约 2.9 倍。基准测试成绩表现出色,定位处理长周期任务。AI模型GLM-5.2智谱开源模型长上下文推理模型推荐理由:智谱 GLM-5.2 开源了,百万上下文还能省 2.9 倍算力,做长任务的朋友可以上手试试。原文
11:10歸藏(guizang.ai)@op7418智谱发布并开源了 GLM-5.2 模型,核心定位是处理长周期任务,提供稳定的 100 万 token 上下文。模型引入 IndexShare 机制,每四层稀疏注意力共享 indexer,在百万 token 下每 token 计算量降低约 2.9 倍。GLM-5.2 提供两种思考力度模式:GLM-5.2 (max) 追求极致性能,GLM-5.2 (high) 平衡性能与 token 效率。该模型采用 MIT 开源许可,API 定价与 GLM-5.1 相同。在多项基准测试中,GLM-5.2 在编程和智能体任务上表现显著提升。AI模型GLM-5.2智谱MIT开源百万上下文推理模型推荐理由:智谱的 GLM-5.2 百万上下文还能降低计算量 2.9 倍,开源且支持思考力度调节,搞长任务和 agent 的赶紧试试。原文
10:40lmarena.ai@lmarena_ai精选GLM-5.2 (Max) 在 Arena 榜单上整体排名第10,较之前上升4.4%。工具幻觉指标并列第1,提升1.9%。确认任务成功排第3,提升9.4%。赞比投诉排第3,提升14.9%。Bash 恢复排第16,提升1.7%;可操控性排第20,下降6.0%。AI模型GLM-5.2Arena工具幻觉任务成功率推荐理由:GLM-5.2 (Max) 在工具幻觉和任务成功率上表现突出,综合排名上升4.4%,值得看看它在这些指标上的优势。原文
10:01Fireworks AI@FireworksAI_HQFireworks AI 推出 GLM-5P2 模型,强调基准测试仅是参考,真正的评估应基于实际代码库、提示词和延迟 SLO。该模型支持直接替换 OpenAI 或 Anthropic 兼容客户端(如 accounts/fireworks/models/glm-5p2),用户可在真实场景中测试。Fireworks AI 建议开发者下载模型并尝试在自有代码库上运行,以验证实际性能。推文附有详细博客链接(fireworks.ai/blog/glm-5p2)供进一步了解。AI模型Fireworks AIGLM-5P2OpenAIAnthropic开源模型10 个信源在谈推荐理由:Fireworks AI 让你用 GLM-5P2 直接在代码库上跑分,别光看基准,试试自己的提示词和延迟原文
09:40Browser Use@browser_usebrowser_use 团队开发的 BrowserCode 在 Odysseys 基准测试中拿下第一名。Odysseys 评估的是需持续数小时的 Web 工作流,涉及规划、记忆、推理和跨站验证。BrowserCode 展示了执行复杂长期任务的能力,例如自动订披萨。AI模型BrowserCodebrowser_useOdysseys智能体推荐理由:browser_use 的 BrowserCode 在 Odysseys 上排第一,能自动处理订披萨这种好几个小时的网页任务,比一般浏览器助手强多了。原文
09:34Fireworks AI@FireworksAI_HQ精选71°GLM 5.2 已在 Fireworks 平台零日上线。该模型拥有 1M token 上下文窗口,定位为编码优先的前沿模型。其性能在 SWE-bench、Terminal-Bench、GPQA 和 AIME 等基准上得到独立验证。Fireworks 在智谱开源模型权重后立即在其基础设施上提供服务。AI模型GLM 5.2Fireworks智谱推理模型编程助手1 个信源在谈推荐理由:Fireworks 第一时间上线了 GLM 5.2,百万 token 上下文很能打,编程基准表现不错,做开发的可以试试。原文
08:45berryxia@berryxiaGLM-5.2 以 MIT 协议免费开源,提供 1M 上下文窗口,重点强化了长程任务的 Agent 能力。在 Coding、Tool use、Reasoning 上相比 GLM-5.1 有明显进步,尤其在需要长时间规划和多步执行的场景。API 价格不变,同时支持 Max 和 High 两种推理模式。社区已在 DeepSWE 等基准上验证其实力,开发者可在本地运行长上下文 Agent。AI模型GLM-5.2开源模型智能体编程助手长上下文推荐理由:智谱开源了GLM-5.2,MIT协议、1M上下文,编程和Agent任务比上一代强不少,还能本地跑,别错过。原文
08:16宝玉@dotey精选76°NVIDIA GEAR 实验室联合 CMU、UC Berkeley 发布 ENPIRE 系统,让 AI 编程 agent 在真实物理世界中自主重置场景、判断成败、改进策略并迭代代码,无需人类干预。系统在 pin 脚插入、穿扎带、剪扎带、插 GPU 等高精度任务上达到 99% 成功率(pass@8 标准)。测试了 OpenAI Codex(搭配 GPT-5.5)、Anthropic Claude Code(搭配 Opus 4.7)和月之暗面 Kimi Code(搭配 Kimi K2.6)三个 agent。项目还发现物理 scaling law:8 台机器人并行探索比 1 台或 4 台的研究推进速度快得多。所有代码将开源。AI模型ENPIRENVIDIA GEAR机器人操控智能体开源模型10 个信源在谈推荐理由:NVIDIA 和 CMU 搞了个能自己跑实验的机器人系统,AI agent 操控真实机器人干活,成功率99%,还开源了。原文
06:57Jim Fan@jimfan在一项无法在物理世界中被攻破的基准测试中,OpenAI Codex 的表现超越 Anthropic Claude,而 Claude 又优于月之暗面 Kimi。该基准由 @DrJimFan 参与的论文提出,专注于物理世界的真实场景评估。结果显示了各模型在复杂物理任务上的相对排名。AI模型CodexClaudeKimi基准测试物理世界10 个信源在谈推荐理由:英伟达科学家发推说他们论文里 Codex 把 Claude 和 Kimi 都干掉了,还是物理世界实测,看看你家模型排第几。原文
06:28AK@_akhaliqData Journalist Agent是一个能将结构化数据自动转化为多模态报道的智能体,输出包括图表、文本和视频。它内置事实核查机制,每一条数据均可追溯原始来源。这个智能体旨在提升数据新闻的生产效率和可信度。AI模型Data Journalist Agent智能体多模态数据新闻事实核查推荐理由:这个Data Journalist Agent能自动把数据做成带验证的图文视频报道,做数据新闻的不用手动整合多模态了原文
06:04NVIDIA AI@NVIDIAAI73°NVIDIA Research 推出 SpatialClaw,一个无需训练的智能体,通过编写 Python 代码作为动作接口。它在持久内核中动态组合感知模块,检查中间结果并跨步骤调整策略。感知输出作为普通变量,可结合 NumPy、SciPy 等库复用。SpatialClaw 在 20 个基准上平均比先前方法高 11.2 分,在 6 种不同模型骨干上表现稳定。AI模型SpatialClawNVIDIA智能体多模态视觉推理8 个信源在谈推荐理由:SpatialClaw 不用额外训练,靠写代码搞定复杂视觉任务,在 20 个基准上平均提升 11.2 分,还兼容多种模型。原文
05:29elvis@omarsar0精选GLM-5.2 (Max)在Code Arena: Frontend榜单中排名第二,得分比Claude Opus 4.7 (Thinking)高29分,仅落后于Fable 5。该模型在React子榜单排第2,HTML排第4,且在品牌营销、参考设计等6个子类别中均位列第一。作为开源模型,GLM-5.2大幅领先Kimi-K2.6和Minimax-M3。AI模型GLM-5.2Code ArenaClaude Opus 4.7Fable 5编程助手10 个信源在谈推荐理由:智谱新模型GLM-5.2 Max在代码前端评测中杀到第二,直接压过Claude Opus 4.7,开源模型里目前最强,做前端开发的可以关注。原文
05:29ollama@ollamaGLM-5.2 在 Design Arena 上以 1360 Elo 获得第一名,超过此前领先的 Claude Fable 5。该模型开源权重,排名较此前上升 4 位,Elo 提升 27 分。这使其成为 Design Arena 代码类别历史上最高 Elo 之一。GLM-5.2 由 Zai_org 发布。AI模型GLM-5.2Design ArenaZai_org开源模型代码生成3 个信源在谈推荐理由:GLM-5.2 在代码设计赛上跑了第一,1360 Elo,超过 Claude Fable 5,还开源了,值得试试。原文
04:50阿里通义 Qwen@Alibaba_Qwen76°阿里Qwen团队推出Qwen-Robot Suite,包含三个基础模型:Qwen-RobotNav统一了5种导航任务(指令跟随、点目标、物体目标、目标跟踪、自动驾驶),支持可控观察协议。Qwen-RobotManip在异构机器人上统一状态-动作空间,预训练于38,100+小时开源语料。Qwen-RobotWorld是世界模型,支持20+种具身形态,通过自然语言接口预测物理未来。三个模型可独立使用或组合为具身智能系统的底层工具包。AI模型Qwen-RobotNavQwen-RobotManipQwen-RobotWorld阿里巴巴具身智能推荐理由:阿里刚发了三款机器人基础模型,导航、操作、世界模型全包了,数据量和工作范围都挺具体,搞具身智能的可以看看。原文
04:49阿里通义 Qwen@Alibaba_Qwen精选72°Qwen-RobotWorld由阿里巴巴Qwen团队发布,将自然语言视为通用动作接口,统一末端执行器姿态、转向命令和导航点。该模型在具身世界知识语料库(860万视频-文本对、超2亿帧)上联合训练20+种具身类型和500+个动作类别。在EWMBench、DreamGen、WorldModelBench、PBench等基准测试中表现强劲。这一方法桥接了通用视频生成模型与领域专用具身模型之间的鸿沟。AI模型Qwen-RobotWorld阿里巴巴具身智能视频生成基准测试推荐理由:Qwen把自然语言当遥控器,一个模型搞定机器臂、自动驾驶、无人机等20多种动作,还赢了多个基准,挺有意思。原文
04:49阿里通义 Qwen@Alibaba_Qwen阿里巴巴Qwen团队推出Qwen-Robot Suite,将大语言模型能力扩展到物理世界。该套件使AI能够执行真实的机器人动作,而不仅仅是文本对话。更多演示视频可在官方博客qwen.ai/blog?id=qwen-r...查看。目前该推文获得63个点赞和5812次浏览。AI模型QwenQwen-Robot Suite阿里巴巴机器人推荐理由:Qwen机器人套件让AI从聊天变动手,看看它怎么在现实里干活原文
04:34Notion@NotionHQNotion 宣布在其平台上推出开放权重模型 GLM 5.2。该模型专门为长周期任务优化,通过 Baseten 提供服务。用户可直接在 Notion 中使用该模型,其权重公开可用于自定义部署。AI模型GLM 5.2NotionBaseten开放权重模型1 个信源在谈推荐理由:Notion 上多了个新模型 GLM 5.2,专搞长周期任务,通过 Baseten 提供服务,想试试开放权重模型的可以看看。原文