【paddlehubOCR项目】网课手酸酸，眼花花，救星来啦！

网课手酸酸，眼花花，救星来啦！

大家好这里是三岁，今天给大家带来的是在AiStudio项目平台的一个精选项目，虽然很短，但是效果拔群，使用到了最近特别火的paddleOCR~~~

项目地址:https://aistudio.baidu.com/aistudio/projectdetail/706200

网课看完笔油见底，两手酸酸，
头皮麻麻，本子满满密密麻麻。
你还在为网课抄不完的笔记烦恼嘛？
你还在为网课那弄不完的无底洞头疼嘛?
你们的救星来了！！！！

接下来就带大家一起看看吧！

模块介绍

本次使用的OCR模型是haddlehubOCR chinese_ocr_db_crnn_server的1.1.0版本。
在这里插入图片描述
chinese_ocr_db_crnn_server Module用于识别图片当中的汉字。其基于chinese_text_detection_db_server检测得到的文本框，继续识别文本框中的中文文字。
之后对检测文本框进行角度分类。
最终识别文字算法采用CRNN（Convolutional Recurrent Neural Network）即卷积递归神经网络。
其是DCNN和RNN的组合，专门用于识别图像中的序列式对象。
与CTC loss配合使用，进行文字识别，可以直接从文本词级或行级的标注中学习，不需要详细的字符级的标注。
该Module是一个通用的OCR模型，支持直接预测。

环境配置

该Module依赖于第三方库shapely和pyclipper，使用该Module之前，请先安装shapely和pyclipper

hub install chinese_ocr_db_crnn_mobile==1.1.0
# 安装有关版本的ocr模块
pip install shapely
pip install pyclipper

文件处理

### 判定有无规定文件夹
import os #导入os库
path = './images/';  # 将视频切割为图片存放的路径
if os.path.exists(path):
    print('文件夹已经存在')
else:
    os.mkdir(path)  #不存在即创建
    print('创建成功')

视频分割

对视频进行分割得到图片

## 把视频按照一定的帧进行切割生成照片并存储到指定文件
import cv2

vc = cv2.VideoCapture(r'./ceshs.mp4')  
# 读入视频文件，命名cv
n = 1  # 计数

if vc.isOpened():  # 判断是否正常打开
    rval, frame = vc.read()
else:
    rval = False
 
timeF = 15  # 视频帧计数间隔频率
 
i = 0
while rval:  # 循环读取视频帧
    rval, frame = vc.read()
    try:
        if (n % timeF == 0):  # 每隔timeF帧进行存储操作
            i += 1
            cv2.imwrite(r''+path+'{}.jpg'.format(i),frame)  
            # 存储为图像
        n = n + 1
        cv2.waitKey(1)
    except:
        break
vc.release()

OCR对文件进行处理

### 把有关的文件进行遍历后使用OCR进行生成文字。
import paddlehub as hub
import cv2
import matplotlib.pyplot as plt 
import matplotlib.image as mpimg
import os
data = os.listdir(path) #读取保存图片的文件夹

for photo in data:
    print(photo)
    lena = mpimg.imread(f'./images/{photo}')
    plt.figure(figsize=(10,10))
    # lena.shape
    plt.imshow(lena) 
    plt.axis('off') 
    plt.show()
    ocr = hub.Module(name="chinese_ocr_db_crnn_mobile")
    try:
        result = ocr.recognize_text(images=[cv2.imread(f'./images/{photo}')])
    except:
        pass
    # result = ocr.recognize_text(images=[cv2.imread('/PATH/TO/IMAGE')])
    # result = ocr.recognize_text(paths=['/PATH/TO/IMAGE'])
    for text in result[0]['data']:
        print(text['text'])

9.jpg

在这里插入图片描述

[2020-10-30 17:55:33,430] [ INFO] - Installing chinese_ocr_db_crnn_mobile module [2020-10-30 17:55:33,616] [ INFO] - Module chinese_ocr_db_crnn_mobile already installed in /home/aistudio/.paddlehub/modules/chinese_ocr_db_crnn_mobile [2020-10-30 17:55:33,927] [ INFO] - Installing chinese_text_detection_db_mobile module-1.0.3 [2020-10-30 17:55:33,929] [ INFO] - Module chinese_text_detection_db_mobile-1.0.3 already installed in /home/aistudio/.paddlehub/modules/chinese_text_detection_db_mobile 人工智能无处不在 1/飞浆搜素引擎：网页、图片、视频、新闻、学术、地图信息推荐：新闻、商品、游戏、书籍智能助理图片识别：人像、用品、动物、交通工具用户分析：社交网络、影评、商品评论智能图像理解机器翻译、摘要生成. 逻辑操作符描述机器翻译 and 网络购物如果两个操作数中的任何一个为True则eondition变为True 期智能化推荐 not 用于反转逻（不是False变为True. 11.jpg ![在这里插入图片描述](https://img-blog.csdnimg.cn/20201113170459188.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3dlaXhpbl80NTYyMzA5Mw==,size_16,color_FFFFFF,t_70#pic_center)

[2020-10-30 17:55:38,871] [ INFO] - Installing chinese_ocr_db_crnn_mobile module [2020-10-30 17:55:38,983] [ INFO] - Module chinese_ocr_db_crnn_mobile already installed in /home/aistudio/.paddlehub/modules/chinese_ocr_db_crnn_mobile [2020-10-30 17:55:39,389] [ INFO] - Installing chinese_text_detection_db_mobile module-1.0.3 [2020-10-30 17:55:39,504] [ INFO] - Module chinese_text_detection_db_mobile-1.0.3 already installed in /home/aistudio/.paddlehub/modules/chinese_text_detection_db_mobile 人工智能无处不在 1/飞浆搜素引擎：网页、图片、视频、新闻、学术、地图信息推荐：新闻、商品、游戏、书籍智能助理图片识别：人像、用品、动物、交通工具用户分析：社交网络、影评、商品评论智能图像理解机器翻译、摘要生成. 逻辑操作符描述机器翻译 and 网络购物如果两个操作数中的任何一个为True则eondition变为Trua 期智能化推荐 not 用于反转逻辑（不是False变为True. 以上为部分结果！

好了今天就水到这里了，希望大家多多支持！