SuperCLUE团队公布了DeepSeek V4系列中文大模型的测评结果,其中DeepSeek-V4-Pro综合表现国内领先,排名第一,Flash版本则位列第二。此次测评涉及六大维度,Pro版本获得70.98分,Flash版本获得68.82分,均显著超越国内其他模型。该系列模型引入了全新的注意力机制,所有版本均支持百万级长上下文,有效降低了算力与显存的占用。与上一代V3.2相比,两个版本在各方面均有显著提升。然而,与海外顶尖模型相比,DeepSeek V4在代码生成和复杂指令执行等方面仍存在一定差距。尽管如此,DeepSeek V4凭借其均衡的能力,已稳居国内第一梯队。
