OCR服务
服务简码
HOCR
默认端口
8290
默认路由
/hocr/**
组件编码
hzero-ocr
1 简介
1.1 概述
图像文字识别服务
1.2 组件坐标
- OP版本
<dependency>
<groupId>org.hzero</groupId>
<artifactId>hzero-ocr</artifactId>
<version>${hzero.service.version}</version>
</dependency>
1.3 主要功能
- 营业执照识别
- 增值税发票识别
- 火车票识别
- 身份证识别
- 出租车票识别
- 通用文本识别
- 一图多票识别(火车票、出租车票、定额发票)
1.4 服务配置
OCR需要借助接口平台的能力,与外部服务对接
1.在接口平台注册具有OCR识别能力的外部接口服务,并添加相应的识别接口,以百度识别接口为例,配置如下:
接口编码需要固定,否则功能无法使用
- 出租车票识别(TAXI_INVOICE)
- 定额发票识别(QUOTA_INVOICE)
- 通用文字识别(GENERAL_BASIC)
- 增值税发票识别(VAT_INVOICE)
- 身份证识别(ID_CARD)
- 营业执照识别(BUSINESS_LICENSE)
- 火车票识别(TRAIN_TICKET)
- 定额发票识别(QUOTA_INVOICE)
2.在接口平台注册OCR识别组合接口服务,并添加相应的识别接口(OCR页面调用识别的接口),以百度识别接口为例配置如下:
3.然后接口平台-接口配置-应用类型定义添加实例接口(组合接口),以出租车票为例配置如下:
4.最后在实例接口详情页中维护第一步中添加相对应OCR识别的外部接口,以出租车票为例配置如下:
接口平台功能使用可参考接口平台文档
1.5 安装
- 首先初始化groovy表结构脚本
- 其次初始化相关基础数据: 值级、值级视图、菜单、权限集、管理员角色权限等基础数据, 参考
hzero-resource
- 运行
mvn spring-boot:run
展望
- OCR识别统计
- 统计外部接口调用情况
- 对接计费服务,实现OCR识别计费功能
- 一图多票中单个票据识别失败优化
- OCR客户端