即时新闻

大模型“周一见”或成常态

深度求索发布V3模型更新

来源：羊城区域 2025年03月26日版次：ZA10 栏目：作者：王丹阳

　　羊城晚报记者王丹阳

　　继腾讯元宝35天更新30次后，今年3月堪称见证了大模型领域技术更迭的“忙碌月”。其中，大模型“周一见”正成常态。

　　3月24日周一晚，一如此前技术发烧友预期，深度求索DeepSeek再度“突然”发布了模型更新。不过这次更新的并不是外界高度关注的新大模型深度求索DeepSeek V4或R2，而是DeepSeek-V3模型的更新版。

　　目前，该开源版本已经上架开源网站，开源版本模型体积为6850亿参数。当晚，深度求索微信官方公众号小助手也确认，本次更新属于小版本升级，目前已经在官方网页、App小程序等入口开放。

　　新版V3究竟有哪些更新？在周一深夜，其发布一小时后迅速吸引全球用户对其测试体验。

　　要知道初代V3模型是在2024年12月发布，最出圈的是以“557.6万美元比肩Claude 3.5效果”的高性价比著称。而更新后的模型由其新的32KGPU集群上改进后的训练提供支持。但截至目前，还没有任何关于新版V3的能力基准测试榜单出现。

　　不过，根据网友对新版V3的上手测试显示，在编程能力上新版V3模型编码能力大幅提升。在提示词测试上，不仅新版V3超过自身R1，甚至与目前号称“编程能力最强模型”的Claude 3.7相比，新版V3在编码能力上已在接近。这意味着深度求索V3编程水平更向“专业程序员水平”靠拢。

　　除编程能力，在其他用户的测试中，新版V3在多轮对话中体现出了更强的上下文理解能力。

　　在“周一见”迎来了新版V3后，备受关注的DeepSeek R2或者V4模型会在何时发布，目前仍无详细时间。让我们拭目以待，下一个“周一见”。

scroll

分享到微信

使用"扫一扫"即可将网页分享至朋友圈