高考考试网
当前位置: 首页 高考资讯

Python 文字识别(用Python写了一个图像文字识别OCR工具)

时间:2023-07-29 作者: 小编 阅读量: 1 栏目名: 高考资讯

人生苦短,快学Python!在之前的文章里,我们多次尝试用python实现文本OCR识别!今天我们要搞一个升级版:直接写一个图像文字识别OCR工具!博主基于PyQtlabelmePaddleOCR写了一个桌面端的OCR工具,用于快速实现图片中文本区域自动检测文本自动识别。ui界面上的控件可以通过self._ui.xxxObjectName访问。这里以按钮响应函数、列表响应函数为例。

人生苦短,快学Python!

在之前的文章里,我们多次尝试用python实现文本OCR识别!

今天我们要搞一个升级版:直接写一个 图像文字识别OCR工具

引言

最近在技术交流群里聊到一个关于图像文字识别的需求,在工作、生活中常常会用到,比如 票据、漫画、扫描件、照片的文本提取

博主基于 PyQtlabelmePaddleOCR 写了一个桌面端的OCR工具,用于快速实现图片中 文本区域自动检测 文本自动识别

识别效果如下图所示:

干货主要有:

① 200 多本 Python 电子书(和经典的书籍)应该有

② Python标准库资料(最全中文版)

③ 项目源码(四五十个有趣且可靠的练手项目及源码)

④ Python基础入门、爬虫、网络开发、大数据分析方面的视频(适合小白学习)

⑤ Python学习路线图(告别不入流的学习)私信小编01即可获取大量Python学习资源

▲OCR工具识别效果

所有框选区域为OCR算法自动检测,右侧列表有每个框对应的文字内容;点击右侧“识别结果”中的文本记录,然后点击“复制到剪贴板”即可复制该文本内容。

功能列表
  • 文本区域检测 文字识别
  • 文本区域可视化
  • 文字内容列表
  • 图像、文件夹加载
  • 图像滚轮缩放查看
  • 绘制区域、编辑区域
  • 复制所选文本识别结果
OCR部分

图像文字检测 文字识别算法,主要借助 paddleocr 实现。

创建或者选择一个虚拟环境,安装需要用到的第三方库。

conda create -n ocrconda activate ocr

安装框架

如果你没有NVIDIA GPU,或GPU不支持CUDA,可以安装CPU版本:

# CPU版本pip install paddlepaddle==2.1.0 -i https://mirror.baidu.com/pypi/simple

如果你的GPU安装过CUDA9或CUDA10,cuDNN 7.6 ,可以选择下面这个GPU版本:

# GPU版本python3 -m pip install paddlepaddle-gpu==2.1.0 -i https://mirror.baidu.com/pypi/simple

安装 PaddleOCR

安装paddleocr:

pip install "paddleocr>=2.0.1" # 推荐使用2.0.1 版本

版面分析,需要安装 Layout-Parser:

pip3 install -U https://paddleocr.bj.bcebos.com/whl/layoutparser-0.0.0-py3-none-any.whl

测试安装是否成功

安装完成后,测试一张图片 --image_dir ./imgs/11.jpg ,采用中英文检测 方向分类器 识别全流程:

paddleocr --image_dir ./imgs/11.jpg --use_angle_cls true --use_gpu false

输出一个list:

在python中调用

from paddleocr import PaddleOCR, draw_ocr# Paddleocr目前支持的多语言语种可以通过修改lang参数进行切换# 例如`ch`, `en`, `fr`, `german`, `korean`, `japan`ocr = PaddleOCR(use_angle_cls=True, lang="ch")# need to run only once to download and load model into memoryimg_path = './imgs/11.jpg'result = ocr.ocr(img_path, cls=True)for line in result:print(line)

输出结果是一个list,每个item包含了文本框,文字和识别置信度:

[[[24.0, 36.0], [304.0, 34.0], [304.0, 72.0], [24.0, 74.0]], ['纯臻营养护发素', 0.964739]] [[[24.0, 80.0], [172.0, 80.0], [172.0, 104.0], [24.0, 104.0]], ['产品信息/参数', 0.98069626]] [[[24.0, 109.0], [333.0, 109.0], [333.0, 136.0], [24.0, 136.0]], ['(45元/每公斤,100公斤起订)', 0.9676722]] ......

界面部分

界面部分基于pyqt5实现,其中pyqt GUI程序开发入门和环境配置,详见一篇博客(具体见文末)。

主要步骤:

界面布局设计

在QtDesigner中拖拽控件,完成程序界面布局,并保存 *.ui 文件。

利用 pyuic 自动生成界面代码

在 pycharm 的项目文件结构中找到 *.ui 文件,右键——External Tools——pyuic,会在ui文件同级目录下自动生成界面 ui 的 Python 代码。

编写界面业务类

业务类 MainWindow 实现程序逻辑和算法功能,与前面第2步生成的ui实现解耦,避免每次修改ui文件会影响业务代码。ui界面上的控件可以通过 self._ui.xxxObjectName 访问。

class MainWindow(QMainWindow): FIT_WINDOW, FIT_WIDTH, MANUAL_ZOOM = 0, 1, 2 def __init__(self):super().__init__()# 调用父类构造函数,创建QWidget窗体self._ui = Ui_MainWindow()# 创建ui对象self._ui.setupUi(self)# 构造uiself.setWindowTitle(__appname__)# 加载默认配置config = get_config()self._config = config# 单选按钮组self.checkBtnGroup = QButtonGroup(self)self.checkBtnGroup.addButton(self._ui.checkBox_ocr)self.checkBtnGroup.addButton(self._ui.checkBox_det)self.checkBtnGroup.addButton(self._ui.checkBox_recog)self.checkBtnGroup.addButton(self._ui.checkBox_layoutparser)self.checkBtnGroup.setExclusive(True)

实现界面业务逻辑

对主界面上的按钮、列表、绘图控件进行 信号槽连接 。自定义的槽函数不用专门声明,如果是自定义的信号,需要在类__init__()前加上 yourSignal= pyqtSignal(args) 。

这里以按钮响应函数、列表响应函数为例。按钮点击的信号是 clicked ,listWidget列表切换选择的信号是 itemSelectionChanged 。

# 按钮响应函数self._ui.btnOpenImg.clicked.connect(self.openFile)self._ui.btnOpenDir.clicked.connect(self.openDirDialog)self._ui.btnNext.clicked.connect(self.openNextImg)self._ui.btnPrev.clicked.connect(self.openPrevImg)self._ui.btnStartProcess.clicked.connect(self.startProcess)self._ui.btncopyAll.clicked.connect(self.copyToClipboard)self._ui.btnSaveAll.clicked.connect(self.saveToFile)self._ui.listWidgetResults.itemSelectionChanged.connect(self.onItemResultClicked)

5. 运行看看效果

运行 python main.py 即可启动GUI程序。

打开图片→选择语言模型ch(中文)→选择文本检测 识别→点击开始,检测完的文本区域会自动画框,并在右侧识别结果——文本Tab页的列表中显示。

所有检测出文本的区域列表,在识别结果——区域Tab页:

软件代码

由于时间有限,软件细节功能还需进一步完善。代码已开源到 gitee 上,欢迎感兴趣的朋友提pull request,共同修改完善。

代码开源地址: https://gitee.com/signal926/ocr-gui-demo

    推荐阅读
  • 什么胶水能粘橡胶(能粘橡胶的浇水)

    我们一起去了解并探讨一下这个问题吧!HY-308胶水用于氯丁橡胶、丁苯橡胶、丁基橡胶、三元乙丙橡胶、氟橡胶、钢铁、有色金属、橡胶、皮革、塑料、陶瓷、玻璃、木材等材料的自粘或者互粘。本品具有柔韧性,优良的抗水性,可填充一定间隙,适用于表面间隙较大及多孔性材料的粘接。广泛应用于用于电器,仪表、机械、电子等行业。该产品具有粘接范围广泛,透明度高,粘接力好,操作方便等特点。

  • 心情好一句话说说(表示心情好的句子有哪些)

    心情好一句话说说晴天里有阳光,阳光总是充满温馨,相信有这么多朋友的厚爱和鼓励,晴天会永远阳光灿烂。天气挺好,阳光淡淡的,心情坏得正是时候。天气晴朗总让人心情好点,其实也只是因为没发生糟心的事。用快乐搅拌香浓的咖啡,用幸福烘烤原麦的面包,用温暖叫醒亲爱的你。不管前方的路有多苦,只要走的方向正确,不管多么崎岖不平,都比站在原地更接近幸福。

  • 变色唇膏与口红谁的危害大(爱美的姑娘要小心)

    一般来说,如果嘴唇周围出现了明显的瘙痒、干裂、表皮脱落、肿胀等等不适症状,可能就是你的唇在对你发出警告了。如果不幸中招了,首先要停止使用有可能过敏的唇膏,最好是能保持局部的湿润和干净,其次,如有死皮等产生,应该任其脱落,而不是强行撕脱。另外,如果症状进一步加重,最好还是去医院寻求专业医生的帮助。专家提醒,进食和睡前仔细清理唇部彩妆;注意彩妆产品的有效期和保存方式。

  • 适合自己腿型的裤子(今年火了一种裤子叫)

    时尚圈的喜好总是不确定了,除了经典的设计,可以尝试一些不同的设计感,像这种“折腰裤”的版型,与之前的裤子完全不一样,显瘦的同时还有点街头的气息感。折腰裤有着宽松的版型和修身的版型设计,不变的就是腰部翻折的点缀,喜欢休闲或者随性的人可以选择宽松版型,想要凸显身材的,那么修身的是必不可少的了。

  • 府吏见丁宁是什么意思(府吏见丁宁的意思)

    以下内容大家不妨参考一二希望能帮到您!府吏见丁宁是什么意思府吏见丁宁是说“官吏再三嘱咐我”。“丁宁”典型的通假字。这句话出自《孔雀东南飞》,上下文是:阿女含泪答:“兰芝初还时,府吏见丁宁,结誓不别离。今日违情义,恐此事非奇。自可断来信,徐徐更谓之。”通假字泛指中国古书的用字现象之一,“通假”就是“通用、借代”的意思,即用读音相同或者相近的字代替本字。通假字所代替的那个字我们把它叫做“本字”。

  • 近现代汉字字形改变(中文的字形演变)

    男人自豪地笑了,指着自己的鼻子:是我。这是瑞典学者林西莉上世纪留学北京时的一个经历。她通过这个生活片段引申出对汉字“自”的理解。林西莉说,因为汉字的“自”这个字的来源是“鼻”,最初的字形是一个鼻子的正面图,有鼻翼和鼻梁。这说明,文字的产生,很自然,本于生活,起自图画。汉字是形音义的结合体,而这个结合体不是固定不变的。“为”字本意就是干活、作为。

  • 青椒酿肉的做法(青椒酿肉做法介绍)

    下面内容希望能帮助到你,我们来一起看看吧!青椒酿肉的做法青椒适量、猪肉适量、鸡蛋少许、马蹄少许、葱、蒜少许、淀粉少许、料酒少许、蚝油适量、生抽少许、老抽少许、糖少许、香醋少许。葱切葱花、姜蒜切末、马蹄切碎。青椒洗净晾干,去掉尾端,挖出青椒籽。将调好的肉馅均匀的酿入青椒里,锅里放入适量油温热,放入酿好的青椒中火煎黄起皱。大火煮开转中火煮10-15分钟,收浓汤汁即可。

  • 什么是葫芦猪笼草 什么是葫芦猪笼草的根

    葫芦猪笼草是一种生长在海拔很高的山地森林中,属于高地猪笼草,它的原产地在菲律宾,葫芦猪笼草往往附生在灌木草丛之中,是一种中等大小的猪笼草,它可以结出很多的捕虫器,这些捕虫器成熟的时候体积非常的巨大,长出来的颜色也是不相同的,通常是绿色、淡红色以及深红色的暗纹,葫芦猪笼草容易栽培,但是非常的难以繁殖,葫芦猪笼草非常的耐低温,因为捕虫时,下部膨大,形似葫芦,所以被称作为葫芦猪笼草,葫芦猪笼草的种植在盛

  • 孙楠最近怎么样了(捋一捋孙楠近况如何)

    ▲2015年3月,《我是歌手》总决赛,孙楠突然在直播中宣布退出,给直播造成重大播出事故,主持人汪涵用及其优秀的专业水平把崩溃的节目挽回,成为当年佳话,孙楠也因此被湖南卫视封杀。爱上潘蔚,甩了买红妹孙楠结果两次婚,第一次是和著名演员买红妹。孙楠开始迷恋国学孙楠和潘蔚在一起后不断的秀恩爱,于此同时,孙楠迷上了国学。

  • 武汉理工成人高考函授本科站点(成人高考函授报名武汉理工大学成人教育)

    武汉理工大学成人高考函授报名专业嘉威:18672359950武汉理工大学是首批列入国家“211工程”重点建设的教育部直属全国重点大学,列入学科建设高校,教育部和交通运输部、国家国防科技工业局共建高校,入选985工程优势学科创新平台度娘:湖北成人高考函授报名中心专升本学制2.5年工程管理、土木工程、船舶与海洋工程、轮机工程、航海技术、工程造价、电气工程及其自动化、工商管理、测绘工程、无机非金属材料工