輝達發布Rubin CPX晶片 可處理超長上下文推理
美國人工智能(AI)晶片廠商輝達(Nvidia)推出專為大規模推理打造、新一代Rubin CPX新型繪圖處理器。
Rubin CPX和相關的Vera Rubin NVL144 CPX平台將於2026年底推出,將顯著提高複雜軟件編碼和產生視訊應用程式的效能,這些應用程式可以接收多達100萬個詞元(Token)或更多的用戶輸入。
輝達行政總裁黃仁勳表示,Rubin CPX是首款專為百萬級詞元處理而建造的CUDA GPU,是首款專為大規模上下文AI而構建的CUDA GPU,模型可以同時進行數百萬個知識詞元的推理。
這款晶片系統在技術規格上實現重大突破。Rubin CPX GPU提供30千萬億次浮點(flops)運算能力(NVFP4精度),配備128GB GDDR7內存,並整合硬件視訊解碼和編碼功能。完整的Vera Rubin NVL144 CPX平台在單一機架中整合144個Rubin CPX GPU、144個Rubin GPU和36個Vera CPU,提供8 Exaflops AI效能,比GB300 NVL72系統高出7.5倍。