全部 AI 动态 · AI 热点

6月19日

03:29

Decoder@Matthias Bastian

OpenAI发布了ChatGPT的医疗功能升级，基于GPT-5.5 Instant模型。在内部对比测试中，该模型在准确性、清晰度和完整性上均超过医生撰写的答案。健康相关陈述的错误率降低了71%。OpenAI声称这是医疗问答能力的一次显著提升。

推荐理由：OpenAI用GPT-5.5 Instant让ChatGPT在医疗问答上比医生答得更好，准确率提升了71%，值得试。

原文

03:09

Sebastian Raschka@rasbt

73°

AI模型 GLM-5.2 DeepSeek V3.2 IndexShare 推理模型开源模型

推荐理由：智谱的GLM-5.2开放权重模型，用DeepSeek V3.2的注意力机制加上自己的IndexShare，把1M长上下文推理搞便宜了，值得看看。

原文

03:08

vLLM@vllm_project

精选72°

Anyscale 与 Google Cloud GKE 合作推出 Ray Serve LLM 新版本，在 vLLM 基础上实现显著性能飞跃。预填密集型负载吞吐量提升 4.4 倍，解码密集型负载提升 24 倍。三个关键优化包括：控制平面端点选择器的直接流式传输、新的 vLLM Ray V2 执行器后端、以及基于 HAProxy 的 C 语言级路由。Ray 的容错、可观察性和跨 K8s/VM 可移植性为复杂推理部署奠定基础。

AI模型 Ray Serve LLM vLLM Anyscale Google Cloud 推理优化

推荐理由：Anyscale 和 Google Cloud 联手让 vLLM 推理快了好几倍，预填负载快 4.4 倍，解码负载快 24 倍，用 Ray V2 执行器就能体验。

原文

03:04

vLLM@vllm_project

精选

Poolside 发布开源智能体编程模型 Laguna M.1，采用 70 层稀疏 MoE 架构，总参数量 225B，每 token 激活 23B，支持 256K 上下文。模型使用 256 个专家，top-k=16 路由，专为长程智能体编程设计。支持工具调用间交错推理，可每请求切换，采用 Apache 2.0 许可。vLLM v0.21.0 已提供 Day-0 支持。

AI模型 Laguna M.1 Poolside 开源模型编程助手智能体

推荐理由：Poolside 刚开源了 Laguna M.1，225B 参数的智能体编程模型，256K 上下文，vLLM 已原生支持，想玩 agentic coding 的可以试试。

原文

03:03

Greg Brockman@gdb

76°

OpenAI 发布 GPT-5.5 Instant，其健康相关问题的回答水平已与前沿思考模型持平。该模型联合 60 个国家、49 种语言、26 个专科的数百名医生共同开发。每周有超过 2.3 亿用户向 ChatGPT 咨询健康问题。GPT-5.5 Instant 在识别紧急情况、询问上下文、解释不确定性及简化复杂信息方面表现更优。该模型已面向所有免费用户开放。

AI模型 GPT-5.5 OpenAI ChatGPT 健康问答医疗AI

推荐理由：OpenAI 出了 GPT-5.5 Instant，免费版就能用，健康问答能力大幅提升，和医生合作训练的，靠谱。

原文

02:39

OpenAI@OpenAI

OpenAI 发布 GPT-5.5 Instant，该模型在健康相关问题上的表现与前端推理模型（如 o1）持平。每周超过 2.3 亿人通过 ChatGPT 咨询健康问题，新模型能更准确识别需要紧急护理的情况，主动询问相关背景，明确解释不确定性，并简化复杂医学术语。所有免费用户均可使用 GPT-5.5 Instant，无需订阅。此次改进基于医生主导的评估，确保了医疗场景下的可靠性。

AI模型 GPT-5.5 Instant OpenAI 健康推理模型 ChatGPT

推荐理由：OpenAI 把 GPT-5.5 Instant 的医疗问答能力做到了和自家顶级推理模型一样好，而且免费用户都能用，生病问AI更放心了。

原文

02:17

@koltregaskes@koltregaskes

79°

据消息，OpenAI GPT-5.6和GPT-5.6 Pro预计下周四（next Thursday）正式登陆。部分用户可能已在ChatGPT网页端体验GPT-5.6 Pro模型。同时，Anthropic的Claude Fable 5也可能在未来几天内回归。

AI模型 GPT-5.6 GPT-5.6 Pro OpenAI Claude Fable 5 模型发布

推荐理由：GPT-5.6和Pro版下周就来，Claude Fable 5也快回来了，想尝鲜的可以留意。

原文

02:10

02:10OpenAI Blog（博客/媒体）

OpenAI 推出 GPT-5.5 Instant，用于增强 ChatGPT 在健康和 wellness 领域的回复质量。新模型在推理、上下文理解、沟通清晰度上均有提升，并引入 physician-informed 评估方法。该改进旨在提高医疗健康场景下 AI 回复的准确性和可信度。

AI模型 GPT-5.5 Instant ChatGPT OpenAI 健康推理模型

推荐理由：GPT-5.5 Instant 让 ChatGPT 的健康建议更靠谱了，医生参与评估的设计值得关注。

原文

01:54

LMSYS Org (SGLang)@lmsysorg

poolside发布的Laguna M.1是一个225B参数的MoE模型，专为智能体编码和长期任务设计。该模型采用70层结构：3个密集SwiGLU层加67个稀疏MoE层，共有256个专家，top-k=16且使用无辅助损失负载均衡。它在所有层使用全局注意力：64个Q头、8个KV头，以及softplus输出门控。Laguna M.1支持原生交错推理：在工具调用之间进行思考，并可每个请求切换。在SWE-bench Verified、SWE-bench Multilingual、SWE-Bench Pro和Terminal-Bench 2.0上表现强劲。现在可通过SGLang运行。

AI模型 Laguna M.1 poolside SGLang 智能体编程助手

推荐理由：poolside刚发的225B MoE模型Laguna M.1，专为智能体编码设计，SGLang直接跑起来了，在SWE-bench上很强。

原文

01:44

Anthropic@AnthropicAI

Anthropic发布Project Fetch实验，让两个零机器人经验的团队编程机器狗。其中一个团队使用Claude辅助，另一个团队仅靠传统方法。实验对比了两组的表现，展示了Claude在机器人编程中的实际效果。结果视频已在Anthropic官方推文中公开。

AI模型 Anthropic Claude Project Fetch 机器人编程编程助手

推荐理由：Anthropic让没碰过机器人的团队用Claude写机器狗代码，看看AI到底能帮多少忙，结果挺有意思。

原文

01:43

Anthropic@AnthropicAI

精选

Anthropic 发布 Frontier Red Team 博客，介绍 Project Fetch 第二阶段：测试 Claude 编程机器人狗的能力。Opus 4.7 自主完成编程任务，速度比去年最佳人类团队（使用 Opus 4.1）快约 20 倍。尽管速度提升显著，机器人狗仍未成功取回沙滩球。该研究旨在评估前沿模型在物理世界中的自主能力与安全风险。

AI模型 Claude Opus 4.7 Anthropic 机器人编程安全测试

推荐理由：Anthropic 让 Claude 自己写代码控制机器狗，速度比人快20倍，虽然最后没抓到球，但过程特别有意思

原文

01:33

SiliconFlowAI@siliconflowai

精选

Z.ai 的 GLM 5.2 在编码基准 CodeArena 上排名第一。每百万 token 输入缓存/输入/输出价格为 0.26/1.40/4.40 美元，支持 1M 上下文长度。其编码性能与 Opus 4.8 相当，并提供 max 和 high 两种推理模式。该模型已完全开源，可通过 SiliconFlow 的 T+0 合作获取。

AI模型 GLM 5.2 Z.ai CodeArena SiliconFlow 开源模型

推荐理由：Z.ai 的 GLM 5.2 在编码竞技场拿了第一，价格比 Opus 便宜，还有 1M 上下文，编程党可以白嫖开源版。

原文

01:32

SiliconFlowAI@siliconflowai

精选

MoonshotAI 基于 K2.6 推出了 Kimi K2.7 Code，参数量为 32B 激活/1T 总参数，支持交错思考与多步工具调用。相比 K2.6，推理 token 使用量降低 30%，在编码与指令遵循上表现提升，接近 GPT-5.5 和 Opus 4.8。定价为缓存输入/输入/输出每百万 token 0.19/0.94/4.00 美元。该模型可在 SiliconFlow 上使用。

AI模型 Kimi K2.7 Code MoonshotAI 编码模型推理效率 VLM

推荐理由：想少想多做？K2.7 Code 编码专用，推理开销比 K2.6 低三成，还能对标 GPT-5.5，适合写代码时不用纠结。

原文

01:31

歸藏(guizang.ai)@op7418

81°

OpenAI 正在准备 GPT-5.6 模型家族的发布，GPT-5.6-Pro 版本已在测试中被发现。该消息来自 TestingCatalog 的监测数据，暗示发布可能临近。目前尚未公布具体参数、性能基准或发布日期。

AI模型 GPT-5.6 GPT-5.6-Pro OpenAI 模型发布

推荐理由：OpenAI 的 GPT-5.6 快来了，Pro 版本已经在测试，想尝鲜新模型的朋友可以关注起来。

原文

01:29

xAI@xai

精选

Vapi 的 Humanness Index 盲测显示，xAI 的 Grok TTS 模型以 96 分（满分 100）位居榜首，仅比人类真实语音低 4 分。该测试将同一段语音用不同模型克隆后，让听众盲评打分。Grok TTS 在多家主要语音模型中表现最接近真人。

AI模型 Grok TTS xAI 语音合成 Humanness Index 文本转语音

推荐理由：xAI 的 Grok TTS 在语音盲测中拿了 96 分，离真人只差 4 分，想听最像人说话的 AI 可以试试。

原文

01:28

xAI@xai

精选

xAI 宣布 Grok 模型集成到 Databricks Agent Bricks 平台。企业用户可在 Databricks 环境中直接使用 Grok 模型处理数据，构建 AI 智能体。该集成支持企业将自有数据与 Grok 模型结合，提升智能体能力。

AI模型 Grok Databricks xAI 智能体企业应用

推荐理由：xAI 把 Grok 搬上 Databricks，企业可以直接在自己的数据上跑 Grok 做智能体，不用再折腾部署了。

原文

00:32

Replicate@replicate

P-Image-Try-On 是 PrunaAI 发布的虚拟试穿模型，现已上线 Replicate 平台。每次试穿第一件衣服仅 $0.015，每增加一件 $0.008，最多可同时试穿 11 件衣物。支持质量模式（每件 <2 秒）和 Turbo 模式（总计 <4 秒）。提供提示引导和姿态引导实现精确控制。适合电商和时装团队无需重拍即可生成试穿效果。

AI模型 P-Image-Try-On PrunaAI Replicate 虚拟试穿图像生成

推荐理由：PrunaAI 出了个超便宜的虚拟试穿模型，第一件才一分五，快至2秒一件，还能一次穿11件，电商团队看过来。

原文

00:22

AK@_akhaliq

GLM-5.2 模型在 Hugging Face 的推理提供商上提供免费使用，限时6小时。支持的提供商包括 Zai、Together AI、Novita、Fireworks 和 DeepInfra。用户可通过 Pi、opencode、Codex 或 Claude Code 等编码代理进行配置。该免费服务由 xgo.ing 支持。

AI模型 GLM-5.2 Hugging Face 免费模型推理提供商编码代理

推荐理由：GLM-5.2 现在能免费调用了，6小时内搭配 Pi、Codex 等编码工具就能用，赶紧去试试。

原文

00:10

elvis@omarsar0

精选

OpenAI 推出 LifeSciBench，一个针对生命科学研究的基准测试，包含 750 个专家编写的任务，覆盖 7 个生物学研究工作流。该基准由 173 位来自生物技术和制药领域的科学家共同开发，旨在衡量 AI 在真实世界科研场景中的表现。结果显示通用模型在复杂结构处理上仍有不足，而专用模型在科学研究中优势明显。

AI模型 OpenAI LifeSciBench 基准生命科学科学智能

推荐理由：OpenAI 联合 173 位科学家搞了个新基准 LifeSciBench，750 个专家任务专测 AI 搞科研的能力，比通用模型靠谱多了。

原文

00:02

Geek@geekbb

精选

Unsloth AI 将最强开源模型 GLM-5.2 从 1.51TB 压缩至 238GB（缩小 84%），2-bit 量化版本保留约 82% 准确率。该模型可在 256GB Mac 或同等 RAM/VRAM 配置上本地运行。官方指南和 GGUF 文件已在 Hugging Face 发布。

AI模型 GLM-5.2 Unsloth 本地运行模型压缩开源模型

推荐理由：Unsloth 把 1.5TB 的 GLM-5.2 压到 238GB，本地就能跑，准确率还能保住 82%。有 256GB 内存的 Mac 就能玩，开源模型天花板。

原文

00:02

Gary Marcus@GaryMarcus

精选

Gary Marcus引用Matei Zaharia的研究，神经符号系统在机器人领域击败当前最优方法。该方法采用AI驱动的搜索（类似GEPA的方法），让AI生成AI与代码的混合体。Zaharia认为这类系统效率很高，并在其他应用中也观察到类似效果。该成果展示了神经符号系统在控制与规划方面的优势。

AI模型 Neurosymbolic Systems GEPA Robotics AI Search 机器人

推荐理由：Gary Marcus分享了Matei Zaharia的神经符号系统研究，用AI搜索在机器人上打败了现有最优方案，值得搞机器人或符号推理的人关注。

原文

6月18日

23:34

OpenAI@OpenAI

精选

OpenAI 的 o3 Deep Research 模型在罕见病诊断中发挥辅助作用，它能够处理测序产生的数百万变异。该模型连接临床特征、遗传模式、变异证据和科学文献，生成假设供专家审核。所有结果都经过人工裁决和临床确认，AI的作用是帮助专家更快、更全面地推理复杂、碎片化的证据。

AI模型 o3 Deep Research OpenAI 推理模型医疗AI 智能体

推荐理由：OpenAI 的 o3 Deep Research 能帮医生快速分析海量变异数据，连接文献和临床特征，生成诊断假设。

原文

20:01

Patrick Loeber@patloeber

在heyAI第二年活动中，Google DeepMind的Pat Loeber展示了AI智能体的现场演示，演示了AI代理可以完成的多种任务。现场演示成功运行。

AI模型 Google DeepMind AI智能体 heyAI Pat Loeber

推荐理由：Google DeepMind演示了AI智能体，可以实际运行任务，看他们怎么用现场演示展示能力

原文

17:43

17:43IT之家（博客/媒体）

小米发布并开源 Xiaomi Miloco 2.0，基于自研 MiMo 大模型，以 Agent 形式接入 OpenClaw，实现从 Miloco 1.0 到主动智能的升级。新方案具备通用常识，可识别孩子玩刀具、老人跌倒等危险并预警。通过人脸与体态识别家庭成员，支持主动注册新成员及个性化操作。系统能沉淀家庭成员的长期习惯，在用户开口前主动执行如提醒休息、推荐场景联动等任务。硬件要求内存≥4GB、存储≥256GB，推荐 Mac mini 运行，需要米家设备和多模态大模型 API Key。

AI模型 Xiaomi Miloco 2.0 MiMo OpenClaw 智能体主动智能

推荐理由：小米把全屋智能 Agent 开源了，基于 MiMo 大模型，能认人、记习惯、主动干活，自己搭一套试试。

原文

16:09

Pandaily@contact@pandaily.com (Pandaily)

腾讯元宝在2026年高考数学中取得150/150满分，展示了其推理能力。该模型还具备AI agent功能，可辅助学生进行高考志愿填报。这一成绩标志着中国大语言模型在数学推理和智能体应用上的进步。测试中元宝能理解多步复杂问题并给出准确答案。

AI模型 Yuanbao Tencent 推理模型智能体高考

推荐理由：腾讯元宝高考数学考了满分，还能帮你填志愿，比很多真人老师还靠谱。

原文

15:10

LMSYS Org (SGLang)@lmsysorg

精选71°

SGLang-Omni 现已支持 MOSS-TTS-Local Transformer v1.5 模型。该模型基于 Qwen3-4B 骨干，可生成 48kHz 立体声语音。支持零样本语音克隆和原生流式，覆盖 31 种语言，训练数据约 400 万小时。非流式场景下达到 5.976 req/s，RTF 0.644，WER 1.75%（SeedTTS English，2×GPU）。采用三阶段管线：参考编码、AR 引擎、流式声码器。

AI模型 MOSS-TTS SGLang-Omni Qwen3-4B 语音克隆开源模型

推荐理由：SGLang-Omni 刚上线 MOSS-TTS v1.5，开源、零样本克隆声音，支持31种语言，速度也不错，玩玩看。

原文

15:03

小互@imxiaohu

Apodex 1.0 模型已正式发布，官方介绍页面提供了技术细节。在线体验平台 apodex.ai 可供用户直接试用。模型权重已在 Hugging Face 上开源下载。

AI模型 Apodex 开源模型 Hugging Face

推荐理由：Apodex 发布了 1.0 版本，有在线体验和开源下载，感兴趣可以试试。

原文

14:43

小互@imxiaohu

6月，Apodex 向 FutureX 提交了四个基于 Apodex-1.0-mini 35B 的实验预测框架。该模型在6月第一周排名包揽第1至第4名，并在第二周持续霸榜第1名。这一成绩展示了 Apodex-1.0-mini 35B 在预测任务上的竞争力。

AI模型 Apodex Apodex-1.0-mini FutureX 推理模型基准

推荐理由：Apodex 用 35B 参数模型做的预测框架，在 FutureX 排行榜上直接包揽前四名，太猛了。

原文

13:58

13:58IT之家（博客/媒体）

76°

英伟达GEAR实验室联合负责人Jim Fan宣布首次在物理世界中启用AutoResearch。ENPIRE是编码智能体框架，将8个Codex智能体配备多个机器人、GPU分配和Token预算，设定任务目标。机器人学会寻找视觉线索、系扎带、整理钉子以及把显卡插到主板上。Jim Fan表示机器人可整夜自我改进，并计划开源该技术。

AI模型英伟达 ENPIRE Codex 机器人开源

推荐理由：英伟达的机器人自己学会了装显卡，还能整夜自我训练，以后在家也能托管一个机器人实验室了。

原文

13:07

@atomic_chat_hq@atomic_chat_hq

精选

智谱GLM-5.2与月之暗面Kimi K2.7 Code在三个物理模拟HTML5编程任务中对比。GLM-5.2使用12,640 tokens完成全部任务，包括台球碰撞、弹簧上方方块弹跳和高尔顿板，粒子和动量表现正确。Kimi K2.7 Code仅用7,420 tokens，但三个场景均出现严重错误：方块穿透弹簧、台球碰撞不真实、高尔顿板珠子重叠。评测显示GLM-5.2在物理模拟细节和精度上显著优于Kimi K2.7 Code。

AI模型 GLM-5.2 Kimi K2.7 智谱代码生成物理模拟

推荐理由：智谱的GLM-5.2写物理模拟代码完胜Kimi K2.7，三个场景全部精准，Kimi翻车在弹簧穿透和球乱撞上。

原文

13:05

@atomic_chat_hq@atomic_chat_hq

精选

Kimi K2.7 Code在三个物理模拟任务上与GPT-5.5进行对比，使用相同的提示词。弹簧摆和1kg块碰撞100000kg块的任务两者表现持平。但在22球自旋六边形任务中，Kimi生成的球随滚筒旋转，而GPT-5.5的球呈现混沌运动，Kimi表现更优。Kimi推理成本为0.28美元（52.4k tokens），GPT-5.5为0.93美元（23.4k tokens），成本降低约70%。

AI模型 Kimi K2.7 Code GPT-5.5 推理模型编程助手

推荐理由：Kimi新出的K2.7 Code模型，花不到三毛钱就能和GPT-5.5打平手，物理模拟甚至更聪明，性价比直接秒杀。

原文

13:03

@atomic_chat_hq@atomic_chat_hq

精选

Diffusion Gemma 在单个H100（FP8）上速度达763 tok/s，比Gemma 4的218 tok/s快约4倍。但事实准确性测试中，Diffusion Gemma 33个事实正确、28个错误，而Gemma 4为45正确、5错误。话题越冷门错误越多：乔布斯传4错、俄罗斯方块12错、BeOS故事12错。Diffusion Gemma胡编了乔布斯的母亲名字和游戏同事名称，并将BeBox价格虚构为$9,999（实际$1,600）。

AI模型 Diffusion Gemma Gemma 4 Google 推理模型事实准确性

推荐理由：想用更快的推理速度就得接受更多幻觉，Google官方也为此打预防针了。

原文

13:02

@atomic_chat_hq@atomic_chat_hq

精选

Fable 5 模型在三个真实物理模拟任务（混沌双摆、高尔顿板、WCSPH 旋转桶中水）中生成的 HTML5 仿真效果优于 Opus 4.8。水模拟中，Fable 5 生成的水体更连续稳定，而 Opus 4.8 在器壁附近出现较大空隙、粒子散落且流体不稳定。Fable 5 的生成成本为 3.35 美元（68.7k tokens，耗时 14 分 47 秒），Opus 4.8 为 0.93 美元（38.9k tokens，耗时 8 分 10 秒）。

AI模型 Fable 5 Opus 4.8 物理模拟代码生成 HTML5

推荐理由：Fable 5 写物理仿真比 Opus 4.8 更扎实，尤其水粒子效果更真实，虽然贵了点但值得一试。

原文

13:01

@atomic_chat_hq@atomic_chat_hq

Nemotron 3 Ultra 在三个物理模拟任务中与 GPT 5.5 表现相当，但成本仅为后者的十分之一。测试用例包括旋转桶中水体、高尔顿板钉球和极端质量碰撞。Nemotron 3 Ultra 输出 11.3k tokens 花费 $0.051，而 GPT 5.5 输出 11.0k tokens 花费 $0.57。质量差距远小于价格差距。

AI模型 Nemotron 3 Ultra GPT 5.5 推理模型成本对比

推荐理由：想用 GPT-5.5 级别能力但嫌贵？Nemotron 3 Ultra 几乎一样好，价格只有十分之一，值得试试。

原文

13:00

@atomic_chat_hq@atomic_chat_hq

精选

Google Gemma 4 12B模型在RTX 4090上实测仅需9GB VRAM，生成8.9k tokens，速度80 tok/s，性能接近26B版本。其对比的Gemma 4 26B-A4B使用15GB VRAM，生成6.9k tokens，速度138 tok/s，所有场景胜出。但12B在近半VRAM下表现十分接近，成为16GB笔记本的理想选择。

AI模型 Gemma 4 12B 26B-A4B Google 推理模型

推荐理由：新Gemma 4 12B别看参数小，实测代码能力接近26B版，而且只需要9GB显存，16GB笔记本就能跑。

原文

13:00

@atomic_chat_hq@atomic_chat_hq

StepFun 的 Step 3.7 Flash 模型与 DeepSeek V4-Flash 在物理动画生成任务中直接对比。任务要求编写自包含 HTML5 Canvas 动画，包含高尔顿板、旋转六边形中弹跳的球、五个同步节拍器三个场景。Step 3.7 Flash 输出 59.6k tokens (9分57秒)，DeepSeek V4-Flash 输出 52.5k tokens (6分21秒)。虽然 DeepSeek 更快，但 StepFun 在物理模拟、视觉效果和逻辑渲染三个维度全面获胜。

AI模型 Step 3.7 Flash DeepSeek V4-Flash StepFun 代码生成基准测试

推荐理由：StepFun 的 Step 3.7 Flash 在生成物理动画上把 DeepSeek V4-Flash 比下去了，慢点但模拟和画面都好很多。

原文

12:59

@atomic_chat_hq@atomic_chat_hq

精选

Liquid 的 LFM2.5-8B-A1B（8B总参、1B激活）在 MacBook Pro M5 Max 上本地运行，与 OpenAI 的 gpt-oss-20b 对比工具调用能力。面对需执行7个工具调用的旅行规划任务，LFM2.5-8B-A1B 全部成功，而 gpt-oss-20b 仅完成 3 个。内存方面，LFM2.5-8B-A1B 仅用 4.8 GB，远低于对手的 11 GB。速度上，LFM2.5-8B-A1B 达到 266 tok/s，总耗时 6.9 s，而 gpt-oss-20b 为 146 tok/s 和 15.0 s。该模型利用 38T 训练 token 的 MoE 架构，实现了小参数下的高效工具调用。

AI模型 Liquid LFM2.5-8B-A1B gpt-oss-20b 工具调用 MoE

推荐理由：Liquid 这个 8B MoE 模型只用 4.8GB 内存就比 OpenAI 20B 模型多调用了一倍工具，速度还快两倍，本地跑 agent 任务很实用。

原文

12:50

AI Will@FinanceYF5

Min Choi发布了一段对比视频，展示3年前Modelscope与现在Grok Imagine 1.5的图像生成结果。Grok Imagine 1.5生成的图像在细节和真实感上明显优于Modelscope。视频直观呈现了AI图像模型在三年间的视觉进步。

AI模型 Grok Grok Imagine 1.5 Modelscope 图像生成模型对比

推荐理由：看看Grok Imagine 1.5比三年前的Modelscope强多少，一段视频就能看清差距。

原文

12:41

AI Will@FinanceYF5

ModelScope和Grok Imagine 1.5分别左右展示AI图像生成模型3年间的进步。左图来自ModelScope，右图来自Grok Imagine 1.5，生成质量有明显差异。Grok Imagine 1.5在细节、真实感和多样性上表现更优。这种对比直观反映了模型迭代的效果。

AI模型 ModelScope Grok Imagine 1.5 图像生成 AI进步

推荐理由：看看ModelScope和Grok Imagine 1.5的生成效果左右对比，感受AI图像模型3年间的进化。

原文

12:35

12:35IT之家（博客/媒体）

73°

阿里与人大联合开源 LOGOS，这是一个基于统一“科学语法”的多领域科学生成基础模型。LOGOS-1B 仅用 1B 参数量，在多项科学任务上超越参数为 8×7B 的微软 NatureLM。模型预训练语料涵盖蛋白质（28.9B tokens）、抗体（3.0B tokens）、小分子（2.1B tokens）等 7 类模态共 44.87B tokens。它通过共享词表将异构对象编码为离散 token，无需 3D 坐标即可理解 3D 空间互作规律。LOGOS 已开源模型权重、推理代码与技术报告。

AI模型 LOGOS NatureLM 开源模型科学大模型多模态

推荐理由：阿里开源的 LOGOS 模型，用 1/56 参数就碾压了微软 NatureLM，还统一了蛋白质、小分子等科学对象的语言，搞科研的可以看看源码和论文，开箱即用。

原文