第二代 Transformer Engine 採用客製化 Blackwell Tensor Core 技術,結合 NVIDIA® TensorRT™-LLM 和 NeMo™ 框架創新技術,加速大型語言模型 (LLM) 和專家混合 (MoE) 模型的推論和訓練。Transformer Engine 由 Tensor Core 的 FP4 精度驅動,使性能和效率加倍,同時保持對當前和下一代 MoE 模型的高準確度。
Transformer Engine 致力於透過即時效能來普及化當今的大型語言模型。企業可以透過部署成本上可負擔的最先進生成式人工智慧模型來優化業務流程。