PaddlePaddle 3.0.0
在 200 张图像(包括通用图像与文档图像)上测试。测试时从磁盘读取图像,因此读图时间及其他额外开销也被包含在总耗时内。如果将图像提前载入到内存,可进一步减少平均每图约 25 ms 的时间开销。
如果不特别说明,则:
使用 PP-OCRv4_mobile_det 和 PP-OCRv4_mobile_rec 模型。
不使用文档图像方向分类、文本图像矫正、文本行方向分类。
将
text_det_limit_type
设置为
"min"
、
text_det_limit_side_len
设置为
732
。
1. PP-OCRv5 与 PP-OCRv4 推理性能对比
mobile_min_1280
使用 PP-OCRv5_mobile_det 和 PP-OCRv5_mobile_rec 模型,将
text_det_limit_type
设置为
"min"
、
text_det_limit_side_len
设置为
1280
。
mobile_min_736
使用 PP-OCRv5_mobile_det 和 PP-OCRv5_mobile_rec 模型,将
text_det_limit_type
设置为
"min"
、
text_det_limit_side_len
设置为
1280
。
mobile_max_960
使用 PP-OCRv5_mobile_det 和 PP-OCRv5_mobile_rec 模型,将
text_det_limit_type
设置为
"max"
、
text_det_limit_side_len
设置为
960
。
mobile_max_640
使用 PP-OCRv5_mobile_det 和 PP-OCRv5_mobile_rec 模型,将
text_det_limit_type
设置为
"max"
、
text_det_limit_side_len
设置为
640
。
server_min_1280
使用 PP-OCRv5_server_det 和 PP-OCRv5_server_rec 模型,将
text_det_limit_type
设置为
"min"
、
text_det_limit_side_len
设置为
1280
。
server_min_736
使用 PP-OCRv5_server_det 和 PP-OCRv5_server_rec 模型,将
text_det_limit_type
设置为
"min"
、
text_det_limit_side_len
设置为
1280
。
server_max_960
使用 PP-OCRv5_server_det 和 PP-OCRv5_server_rec 模型,将
text_det_limit_type
设置为
"max"
、
text_det_limit_side_len
设置为
960
。
server_max_640
使用 PP-OCRv5_server_det 和 PP-OCRv5_server_rec 模型,将
text_det_limit_type
设置为
"max"
、
text_det_limit_side_len
设置为
640
。
GPU,不使用高性能推理:
平均每图耗时(s)
平均每秒预测字符数量
平均 CPU 利用率(%)
峰值 RAM 用量(MB)
平均 RAM 用量(MB)
平均GPU利用率(%)
峰值 VRAM 用量(MB)
平均 VRAM 用量(MB)
多系统支持
:兼容Windows、Linux、Mac等主流操作系统。
多硬件支持
:除了英伟达GPU外,还支持Intel CPU、昆仑芯、昇腾等新硬件推理和部署。
高性能推理插件
:推荐结合高性能推理插件进一步提升推理速度,详见
高性能推理指南
。
服务化部署
:支持高稳定性服务化部署方案,详见
服务化部署指南
。
二次开发能力
:支持自定义数据集训练、字典扩展、模型微调。举例:如需增加韩文识别,可扩展字典并微调模型,无缝集成到现有产线,详见
文本检测模块使用教程
及
文本识别模块使用教程