OCR识别问题

使用问题 · 32 次浏览
用户_-gTE9WQBAA 创建于 4天3小时前

4工作  -- 这个是百度接口识别的 这个里面的数字4 很正常

6646正则提取匹配实际工作层编号
[in]失败后中止动作【值/表达式】True
[in]提取方式【值/表达式】0
[in]输入【变量 工作层】4工作
[in]正则表达式【值/表达式】([0-9]+)
[in]忽略大小写【值/表达式】False
[in]单行模式【值/表达式】False
[in]多行模式【值/表达式】False
[in]从右向左【值/表达式】False
[out]匹配1=>工作层标号4
耗时:0ms

-------------------------------------------------

4工作---这个是quicker离线接口识别的,这个4 太不正常了。这个4用正则提取 提取数字的时候,竟然匹配不到。

13226正则提取匹配实际工作层编号
[in]失败后中止动作【值/表达式】True
[in]提取方式【值/表达式】0
[in]输入【变量 工作层】4工作
[in]正则表达式【值/表达式】([0-9]+)
[in]忽略大小写【值/表达式】False
[in]单行模式【值/表达式】False
[in]多行模式【值/表达式】False
[in]从右向左【值/表达式】False
步骤(sys:regexExtract)执行失败,原因:正则匹配不成功。
停止动作:正则匹配不成功。
耗时:3ms
检测到了中止标志(OperationFailed),停止后续步骤执行。
 
 
还有3也是。。
用户_-gTE9WQBAA 最后更新于 2025/4/27

回复内容
CL 3天23小时前
#1

看起来可能是全角4,可以先用文本替换处理一下试试。

可以用这个子程序 https://getquicker.net/subprogram?id=5e96d850-1bdf-45b4-2316-08dd84c1d760 

这个算法也是百度开源的,识别成啥受很多因素影响。理论上开源的比不过商用的。 

另外也可以把识别语言类型改成英文,可能效果比较好。

回复主贴