来源 :新浪财经2023-06-30
金山办公宣布与 NVIDIA 团队合作,通过 NVIDIA Tensor Core GPU、TensorRT 提升图像文档识别与理解的推理效率;借助 NVIDIA Triton 推理服务器的部署,成功优化 GPU 利用率,提供高推理吞吐量。相比于 CPU 其 pipleline 耗时共下降 84%;采用 NVIDIA Triton 推理服务器部署,其部署成本节省了 23%。