PaddleOCR 是基于百度开源的深度学习框架 PaddlePaddle(飞桨)开发的一个全面、易用、高效的光学字符识别(OCR,Optical Character Recognition)工具库。它支持从图像中提取文字内容,广泛应用于文字识别、文档处理、图像信息提取等场景。

光学字符识别(Optical Character Recognition, OCR)是指对文本资料的图像文件进行分析识别处理,获取文字及版面信息的过程。亦即将图像中的文字进行识别,并以文本的形式返回。

只要是屏幕或者图片上带文字内容的图像,都可以尝试用OCR识别来获取内容做进一步提取与判断【可识别简单的验证码】

在本文章中,AutoHotkey 用于:

  • 截图:通过 AHK 调用 GDI+ 库进行屏幕截图。
  • 调用 OCR:通过 AHK 脚本发送截图到 PaddleOCR 进行识别,提取其中的文字。
  • 自动化处理:通过自动化脚本处理截图和识别任务,减少手动操作。来完成对游戏文字或者特殊图形文字的识别获取。

 

离线OCR识别结果:

 

识别的目标图片:

 

主流OCR模型效率表现【数值越快越优秀】

 

作者的GitHub地址:https://github.com/telppa/PaddleOCR-AutoHotkey

作者提供的文字模糊查找示例:https://www.autohotkey.com/boards/viewtopic.php?p=431017#p431017

 

dbgba的版本优化了对电脑兼容的自动判断,最低可以到兼容Win7系统。JSON与其它读取方式都做了优化与整合,保证了通用性和易用性,并添加了更多中文示例和优化方法

dbgba整合包下载地址:

声明:站内资源为整理优化好的代码上传分享与学习研究,如果是开源代码基本都会标明出处,方便大家扩展学习路径。请不要恶意搬运,破坏站长辛苦整理维护的劳动成果。本站为爱好者分享站点,所有内容不作为商业行为。如若本站上传内容侵犯了原著者的合法权益,请联系我们进行删除下架。