python识别图片文字

由 dawei 7 月 29, 2020 没有评论 #python识别图片文字

因为学校要求要刷一门叫《包装世界》的网课，而课程里有200多道选择题，而且只能在手机完成，网页版无法做题，。

思路如下：

手机屏幕投影到电脑上；
截图并识别图片文字；
调用百度来进行搜索；
提取html关键字。

环境配置：python3.6、第三方库：pyautogui、PIL、pytesseract、

要识别中文，ocr引擎要下载一个中文包放进Tesseract-OCR\tessdata里面。安装完ocr后还要配置一下调用路径，在Python36\Lib\site-packages\pytesseract找到pytesseract.py（这是我的windows路径），打开在里面添加一下路径：

1 # CHANGE THIS IF TESSERACT IS NOT IN YOUR PATH,OR IS NAMED DIFFERENTLY
2 tesseract_cmd = 'tesseract'
3 tesseract_cmd = 'C:/Program Files (x86)/Tesseract-OCR/tesseract.exe'
4 img_mode = 'RGB'

然后用AirDroid或者Vysor、之类的将手机的屏幕投影到电脑上，用鼠标确定截图坐标，代码如下：

1 import pyautogui as pag
2 x,y = pag.position()
3 posStr = "position:"+str(x).rjust(4)+','+str(y).rjust(4)
4 print(posStr)

要获取两个坐标（截图开始坐标和结束坐标），然后利用获取的坐标运用如下代码截图并调用ocr引擎识别（识别出来的字是每个用空格分开的，所以要去除字符串中的空格），代码如下：

PIL PIL
pos = (0,245,425,327 cut_img = cut_img.save()
(
text=pytesseract.image_to_string(Image.open(),lang=)
text=text.replace( , url = % text
webbrowser.open(url)

最终因为搜出来的全是题库，所以就没有提取html关键字了，。

由 dawei

【声明】：唐山站长网内容转载自互联网，其相关言论仅代表作者个人观点绝非权威，不代表本站立场。如您发现内容存在版权问题，请提交相关链接至邮箱：bqsm@foxmail.com，我们将及时予以处理。

Python

热点

python识别图片文字

环境配置：python3.6、第三方库：pyautogui、PIL、pytesseract、

由 dawei

您错过了

ADODB连接Access数据库实战操作指南

色彩搭配宝典：解锁网站视觉设计超吸睛新技巧

ASP与MySQL数据库整合配置及实战操作指南

站长揭秘：AI实战引领资讯分享，开启智慧新篇章

python识别图片文字

环境配置：python3.6、第三方库：pyautogui、PIL、pytesseract、

由 dawei

相关文章

python – igraph：为什么add_edge函数如此缓慢地对add_edges？

python – 与布尔numpy数组VS PEP8 E712的比较

为什么python库不作为pyc提供？

您错过了

ADODB连接Access数据库实战操作指南

色彩搭配宝典：解锁网站视觉设计超吸睛新技巧

ASP与MySQL数据库整合配置及实战操作指南

站长揭秘：AI实战引领资讯分享，开启智慧新篇章