【TechWeb】如果用一个词来形容当前的AI大模型圈,或许“DeepSeek速度”是最贴切的描述。距离DeepSeek V4的震撼发布还有不到五天,官方不仅展示了令人瞩目的“三轮降价”策略,后续的技术布局也悄然浮出水面——即将发布的“满血多模态版”正是DeepSeek家族最后一块核心拼图,正式进入倒计时。
官方亲自剧透,原生视觉能力即将解锁
近日,DeepSeek多模态研发团队的核心研究员陈小康在社交平台上发表文章,明确预告了“新版DeepSeek V4”的即将到来。在当前背景下,这个“新版”几乎没有悬念,已经引起外界的广泛期待。
事实证明,自V4发布以来,业界对其最大讨论与遗憾在于,只推出了Flash(快速)和Pro(专家)这两款纯文本大模型。在如今的大模型竞技场,纯文本能力固然是基础,但“原生多模态能力”早已成为进入顶级梯队的通行证。缺乏对图像、视频等视觉信息的原生理解,意味着在复杂的真实场景中,模型的上限会被死死锁住。而多模态版本的推出,正是DeepSeek弥补这一短板的关键所在。
APP端早埋伏笔:不拼榜分,只拼性价比
敏锐的用户早已发现,最近DeepSeek客户端的迭代中,模型选择栏悄然新增了“快速”、“专家”以及“视觉”三个独立选项。前两者对应V4的Flash和Pro,而一直待命的“视觉”选项,无疑是为即将上线的新版多模态V4预留的接口。
至于这款满血多模态V4的硬核性能能达到怎样的水平,目前尚无定论。但根据V4 Pro在纯文本领域的优秀表现,业界普遍预测其视觉处理能力至少将稳居行业“第一梯队”。
不过,对于一向不走寻常路的DeepSeek来说,盲目追求跑分榜单的“第一名”或许并不是首要目标。“把多模态大模型的价格打下来,让更多开发者和普通用户用得起”,才是其真正的杀手锏。如果DeepSeek能将多模态API的调用成本再次降低到“白菜价”,将引发的行业洗牌将比三轮降价更为猛烈。
