Nvidia声称,当开放源代码库在10月份到达NeMo时,TensorRT-LLM在领先的LLM上运行推理时,H100的性能将翻倍(Dylan Martin/CRN)

AI芯片巨头表示,开源软件库TensorRT-LLM将使H100运行推理的性能翻倍。

查看原文