AI-NEWS · 2026年 5月 10日

DeepSeek 内测:真能看懂图了

核心进展

DeepSeek 终于把“图像识别模式”推出来了,就在 5 月 9 号。

之前 4 月下旬只是小范围试水,但这回明显是动了真格,访问权限一下子扩大了。

如果你手头有测试账号,现在直接进聊天界面就能用,不用绕弯子。

划个重点: 虽然界面上还挂着“内部测试”的标签,但你仔细看,它的位置已经和“快速模式”、“专家模式”排在一起了。这说明什么?说明官方心里也清楚,这多模态功能已经是它不想再藏着的“亲儿子”了。

到底能干嘛?

以前那些简单的看图识字工具,也就是把图里的字抠出来(OCR),DeepSeek 这次不一样。

它更像是在“看”图。

  • 不是死记硬背:它能把图里的内容拆解成逻辑关系,而不是单纯报菜名。
  • 有点“眼力见”:能理解图片背后的含义,甚至能跟你讨论图里没明说的东西。
  • 直接对话:你传张图上去,它就能当面对着你聊,而不是只负责截图。

我的感受

说实话,看到这一步挺让人意外的。

DeepSeek 之前主要靠“便宜”和“能写代码”出圈,现在突然补上了视觉这块短板,对它的定位绝对是提了个级。

毕竟现在国际上的 GPT-4o 早就靠这个功能抢占了市场,国产大模型要是想真正跟人家掰手腕,光靠打字确实不够用了。

不过,既然是“内部测试”,咱们也得留个心眼。这种跨模态的活儿,有时候 AI 容易“幻觉”——也就是看着挺有理,其实是瞎编的。

先让它在测试圈里跑跑,等稳定了再大张旗鼓地推,这步棋走得挺稳。

火龙果频道