4月24日,DeepSeek-V4模型正式發布并開源,華為云首發適配。DeepSeek-V4 擁有百萬Token超長上下文,在 Agent 能力、世界知識和推理性能上均實現國內與開源領域的領先。其中,DeepSeek-V4-Flash模型參數下降至284B,推理成本進一步降低,模型參數和激活更小,V4-Flash 能夠提供更加快捷、經濟的 API 服務,實現百萬上下文普惠。當前,華為云MaaS模型即服務平臺已為開發者提供免部署、一鍵調用DeepSeek-V4 -Flash API的Tokens服務。
在此次新模型適配過程中,華為云在系統層、算子層和集群層的關鍵能力上協同,分別從調度效率、計算效率和數據流轉效率三個維度保障新模型快速適配與高性能落地。
針對DeepSeek-V4,華為云首發適配模型分層注意力壓縮機制,實現V4注意力機制下 KVCache的高效分配管理,提供TopK、SWA、CFA等10+昇騰高性能融合算子,搭配框架異步調度、MTP多步投機等框架優化,支持原生1M長上下文的高性能推理。

華為云以高效的AI基礎設施為核心打造“硅基黑土地”,開放接納自研和第三方主流大模型和眾多智能體,為企業解難題,提升生產效率。
據悉,金山辦公、360等企業已通過華為云接入DeepSeek新模型,此外,DeepSeek-V4-Pro版本也將于近日上線。
行業資訊、企業動態、峰會活動可發送郵件至news#citmt.cn(把#換成@)。
海報生成中...