关于屏幕OCR像素点坐标的问题-开发问题-UiBot RPA技术开发交流社区 - RPA机器人流程自动化

有人一不小心 2019-10-4 1211

新手上路，需要对某软件客户端界面的表格元素（价格选项）进行识别。

1 使用（获取元素文本）可以成功识别编程时当前设定的价格，实际应用时，刷新后，同一位置表格中的价格与（目标--编辑器）中的图片中的价格不对应，不能实现功能。

2 目标表格上的价格只能查看，不能复制。也就不可以使用复制---剪贴板--变量斌值方案。

3 于是只能使用（屏幕OCR ）进行识别，使用（查找目标）鼠标拖动框选目标表格，不能精细选择，于是用精灵上自带的抓抓获得目标表格的定位（就是表格的四角坐标）： {"x":506,"y":180,"width":61,"height":18} 不能成功OCR识别。

使用（查找目标）鼠标拖动框选目标表格获得定位 {"x":511,"y":187,"width":76,"height":20} 可以成功识别价格。

第二方案坐标不精确，但是Y坐标的187明显已处于目标价格文字的中心位置了（按精灵抓抓给出的参考数据）。

是两个软件的像素坐标系有什么不一样的地方吗？

请各大神指点，或者有好的解决方案。

最新回复 (4)

梅花在路上 2019-10-4

2楼

问题反馈，假后回复
沈博文 2019-10-6

3楼

如果识别的字体的内容有规范性，或者范围不是很大（比如就是20个数字，0到19）的前提下，建议用查找图片的方式制作（制作对比用的0到19的图片用数组方式，@res"1.png",@res"2.png",@res"3.png"....@res"19.png"），设定好查找区域即可。
目前在运用了几个场景，总结：运用上稳定，准确度比人工智能的OCR高。
有人一不小心 2019-10-6

4楼

这是一个很好的思路！感谢提醒。我学习下，试试看。
有人一不小心 2019-10-14

5楼

后来我试了下，文本>>获取文本，可在类似窗口的同一位置自动识别不可复制的文本，完美识别。完美解决了客户端采集数据的问题。工作量较小，大家可以借鉴。

发新帖

主题数
18

帖子数
43

精华数
0

注册排名
116197