关于屏幕OCR像素点坐标的问题

有人一不小心 2019-10-4 1211

新手上路,需要对某软件客户端界面的表格元素(价格选项)进行识别。

1  使用(获取元素文本)可以成功识别编程时当前设定的价格,实际应用时,刷新后,同一位置表格中的价格与(目标--编辑器)中 的图片中的价格不对应,不能实现功能。

2  目标表格上的价格只能查看,不能复制。也就不可以使用复制---剪贴板--变量斌值方案。

3  于是只能使用(屏幕OCR )进行识别,使用(查找目标)鼠标拖动框选目标表格,不能精细选择,于是用精灵上自带的抓抓获得目标表格的定位(就是表格的四角坐标):  {"x":506,"y":180,"width":61,"height":18}  不能成功OCR识别。

使用(查找目标)鼠标拖动框选目标表格获得定位 {"x":511,"y":187,"width":76,"height":20} 可以成功识别价格。

第二方案坐标不精确,但是Y坐标的187明显已处于目标价格文字的中心位置了(按精灵抓抓给出的参考数据)。

是两个软件的像素坐标系有什么不一样的地方吗?

请各大神指点,或者有好的解决方案。


最新回复 (4)
  • 梅花在路上 2019-10-4
    2
    问题反馈,假后回复
  • 沈博文 2019-10-6
    3
    如果识别的字体的内容有规范性,或者范围不是很大(比如就是20个数字,0到19)的前提下,建议用查找图片的方式制作(制作对比用的0到19的图片用数组方式,@res"1.png",@res"2.png",@res"3.png"....@res"19.png"),设定好查找区域即可。
    目前在运用了几个场景,总结:运用上稳定,准确度比人工智能的OCR高。
  • 有人一不小心 2019-10-6
    4
    这是一个很好的思路!感谢提醒。我学习下,试试看。
  • 有人一不小心 2019-10-14
    5
    后来我试了下,文本>>获取文本,可在类似窗口的同一位置自动识别不可复制的文本,完美识别。完美解决了客户端采集数据的问题。工作量较小,大家可以借鉴。
返回
发新帖