DeepSeek 识图模式正式上线 App 和网页端

精选理由

DeepSeek 现在能识图了,App 和网页都能用,不只是 OCR,还能理解画面,背后有专门的多模态技术。

AI 摘要

DeepSeek 识图模式已在网页和 App 端正式上线,App 端标注“图片理解功能内测中”,网页端无此提示。该模式与快速模式、专家模式并列,支持用户上传图片让 DeepSeek 解读。其能力不仅是文字提取,还能理解图像内容。背后的多模态模型技术已于今年 4 月公开,核心框架名为“Thinking with Visual Primitives”。

AI 翻译 · 中文

DeepSeek 识图模式已在网页和 App 端正式上线,App 端标注“图片理解功能内测中”,网页端无此提示。该模式与快速模式、专家模式并列,支持用户上传图片让 DeepSeek 解读。其能力不仅是文字提取,还能理解图像内容。背后的多模态模型技术已于今年 4 月公开,核心框架名为“Thinking with Visual Primitives”。

IT之家IT之家 6 月 18 日消息,DeepSeek 多模态研究员 Xiaokang Chen 今日表示, DeepSeek 的识图模式已在网页和 App 端正式上线 。 IT之家测试,目前 DeepSeek 的 App 端识图模式依然提示“ 图片理解功能内测中 ”,网页端没有这项提示。 “识图模式”与“快速模式”和“专家模式”并列,开启该模式后,用户可以直接上传图片让 DeepSeek“看”世界,其能力边界远超简单的文字提取。 伴随着识图