应用部署
TurboTransformers 提供了 C++ 和 Python 调用接口,可以嵌入到 C++ 多线程后台服务流中,也可以加入到 PyTorch 服务流中 。官方建议通过 Docker 部署 TurboTransformers,一方面保证编译的可移植性,另一方面也可以无缝应用于 K8S 等线上部署平台 。
性能方面,官方分别以 CPU 和 GPU 两方面进行测试:
CPU 测试效果
在 3 种 CPU 硬件平台测试了 TurboTransformers 的性能表现,选择 pytorch、pytorch-jit 和 onnxruntime-mkldnn 和 TensorRT 实现作为对比 。性能测试结果为迭代 150 次的均值 。为了避免多次测试时,上次迭代的数据在 cache 中缓存的现象,每次测试采用随机数据,并在计算后刷新的 cache 数据 。
- Intel Xeon 61xx

文章插图

文章插图
- Intel Xeon 6133

文章插图

文章插图
GPU 测试效果
在 4 种 GPU 硬件平台测试了 TurboTransformers 的性能表现,选择 pytorch、NVIDIA Faster Transformers、onnxruntime-gpuTensorRT 实现作为对比 。性能测试结果为迭代 150 次的均值 。
- RTX 2060

文章插图

文章插图
- Tesla V100

文章插图

文章插图
- Tesla P40

文章插图

文章插图
- Tesla M40

文章插图

文章插图
同时,腾讯也表示,TurboTransformers 目前只支持了 FP32 的计算,对于 GPU FP16 的支持将在后续提供 。TurboTransformers 目前重点支持了 BERT 模型,未来也会增加 TurboTransformers 的自动化优化能力 。另外,TurboTransformers 解决了计算加速的问题,用户还需要自己搭建服务框架,未来腾讯也会将服务流程开源,打通用户上线的最后一站 。
推荐阅读
- 微信消息延迟,更改手机这5个设置一键改善,要是还不会可惜了
- 多人中招!快来查查你的身份证是否被别人绑定微信支付
- 探寻5G本质,抢占5G先机丨i黑马X宽带资本“5G加速度”产业独角兽在线沙龙
- 微信转账转错人后被对方拉黑,你可以这样要回钱!
- 微信朋友圈可以发20张图真的假的,微信朋友圈怎么发20张图2022
- 微信 小程序 POST请求中文乱码的解决方法
- 10万元放在微信零钱通安全吗,微信理财通10万元一天收益多少
- 5G深度报告:科技新基建发力,5G驱动“云大物智”加速向上
- 多亏这些强大到逆天的微信办公小程序,工作效率猛翻10倍!太强了
- 微信11亿用户,为啥发朋友圈的人却越来越少?原因无非这3点
