摘要:
DeepSeek V4正式发布当天,华为昇腾CANN官方通过直播宣布V4已在昇腾平台完成首发,国产模型与国产算力的组合首次进入实战部署阶段。 消息传出的同一天,英伟达官方技术博客紧急发文,宣布DeepSeek V4已在Blackwell平台完成适配,并晒出实测数据——GB200 NVL72上每用户推...
DeepSeek V4正式发布当天,华为昇腾CANN官方通过直播宣布V4已在昇腾平台完成首发,国产模型与国产算力的组合首次进入实战部署阶段。
消息传出的同一天,英伟达官方技术博客紧急发文,宣布DeepSeek V4已在Blackwell平台完成适配,并晒出实测数据——GB200 NVL72上每用户推理速度超过150 tokens/秒。
这份同日官宣,措辞专业、数据齐全,但发布节点之急迫,将焦虑暴露无遗。
更戏剧性的是,黄仁勋10天前才说过一句话。他在一档播客中直言,如果顶尖AI模型被优先优化用于华为芯片而非英伟达平台,这对我们而言将是灾难性的。
事实上,英伟达并非没有技术底牌。V4-Flash采用FP4+FP8混合精度,FP4目前仅Blackwell及之后的高端芯片原生支持。
值得一提的是,只靠Blackwell才能跑V4的壁垒,发布当天就被国产方案绕了过去。
智源FlagOS同日宣布实现了FP4到BF16的精度路径转换,将V4-Flash适配到了海光、沐曦、华为昇腾、摩尔线程、昆仑芯、平头哥真武、天数等8款以上国产芯片上,把适配周期从数周压缩至数天。
华为昇腾Atlas 350加速卡是国内目前唯一支持FP4低精度的推理产品,单卡算力达到英伟达H20的2.87倍。
DeepSeek官方也在定价说明中透露,预计下半年昇腾950超节点批量上市后,Pro版价格将大幅下调。
目前英伟达的NVIDIA NIM微服务已上线DeepSeek V4,SGLang和vLLM同步提供部署方案。从首日表现看,英伟达即便仍是主角,但不再是唯一的主角。
© 版权声明
商娱网所有文章,如无特殊说明或标注,均来自于互联网或为商娱网用户原创发布。任何个人或组织,在未征得原作者同意时,禁止复制、盗用、采集、发布商娱网内容到任何网站、书籍等各类媒体平台。如若商娱网内容侵犯了原著者的合法权益,可联系我们进行处理。
相关文章
暂无评论...
