DeepSeek|發表新版模型 API大幅降價
內地傳媒報道,DeepSeek發表DeepSeek-V3.2-Exp模型。據悉,這是一個實驗性的版本,作為邁向新一代架構的中間步驟,V3.2-Exp在V3.1 Terminus的基礎上,引入了DeepSeek Sparse Attention(一種稀疏注意力機制),針對長文本的訓練和推理效率,進行了探索性的優化和驗證。
目前,官方App、網頁端、小程式均已同步更新為DeepSeek-V3.2-Exp,同時API大幅度降價。在新的價格政策下,開發者調用DeepSeek API的成本將降低50%以上。DeepSeek-V3.2-Exp模型現已在Huggingface與魔搭開源。
在各領域的公開評測集上,DeepSeek-V3.2-Exp的表現與V3.1-Terminus基本持平。
