AI-NEWS · 2026年 4月 30日

DeepSeek 图像模式灰度测试:真的能看懂图吗?

DeepSeek 刚把“图像识别模式”放出来做灰度测试了。简单说,就是现在不仅能认字,还能真的“看懂”图片里的事儿。

官方放话,这功能跟自家的“快捷模式”和“专家模式”是一个级别的。以前 AI 看图大多也就是 OCR 扫一下文字,现在不一样了,你扔张图上去,它不仅能把上面的字打出来,还能分析图里的内容、背景,甚至能跟你聊聊图里没明说的逻辑。

用的人反馈挺快,有的网友直接说“跟闪电似的”。不过说实话,因为还在内测,很多人点开是提示“暂时不可用,请稍后再试”。这说明什么?说明这玩意儿虽然快,但服务器扛不住,还得接着磨。

我就在想,这步棋下得挺险的。

以前大家玩大模型,要么是 OpenAI、Google、阿里、腾讯这些大厂在抢着拼文本能力,视觉理解这块大家普遍觉得是短板。DeepSeek 直接把图像模式拉到了跟核心文本模式一样的高度,这相当于直接跳进了对方围剿的阵地。如果它真能跑顺了,以后大家聊 AI,可能就得改口说“全能型选手”了。

对咱们普通用户来说,好处是实实在在的。以前遇到个复杂的图,得先截图、再用各种工具把字抠出来,再复制进对话框,那一套流程下来累得够呛。现在好了,直接拍张照,问它“这图里谁是谁?”或者“这图表在说啥意思?”,它就能直接回答。省事儿是真省事儿。

当然,我也没完全摸透底。现在还在排队,等全面开放后,服务器会不会崩?响应速度能不能一直这么稳?这些都是问号。要是真能像宣传的那样,在文档分析、医疗影像初筛这些 B 端场景,还有咱们日常聊天这种 C 端场景都扛得住,那 DeepSeek 这局算是赢了一半。

总之,看着这功能从“单挑文本”变成“文本图像两手抓”,感觉 AI 离真正能帮咱们干活的日子又近了一步。至于最后成不成功,咱们就等着看它能不能把那个“闪电般”的速度一直维持下去吧。

火龙果频道