【MMOCR】使用 MMOCR 训练自己的文本检测模型 - 代码天地

【MMOCR】使用 MMOCR 训练自己的文本检测模型

企业开发 2023-01-28 20:10:37 阅读次数: 0

文章目录

MMOCR 是基于 PyTorch 和 mmdetection 的开源工具箱，专注于文本检测，文本识别以及相应的下游任务，如关键信息提取。

推荐使用 1.x 版本：https://github.com/open-mmlab/mmocr/tree/1.x

一、安装

conda create -n open-mmlab python=3.8 pytorch=1.10 cudatoolkit=11.3 torchvision -c pytorch -y
conda activate open-mmlab
pip3 install openmim
mim install mmengine
mim install 'mmcv>=2.0.0rc1'
mim install 'mmdet>=3.0.0rc0'
git clone https://github.com/open-mmlab/mmocr.git
cd mmocr
git checkout 1.x
pip3 install -e .

二、数据准备

MMOCR 中提供了一站式数据集准备方式，可以使用一行命令实现让多个数据集准备就绪。

三、支持的方法

3.1 文本检测

DBNet (AAAI’2020) / DBNet++ (TPAMI’2022)
Mask R-CNN (ICCV’2017)
PANet (ICCV’2019)
PSENet (CVPR’2019)
TextSnake (ECCV’2018)
DRRG (CVPR’2020)
FCENet (CVPR’2021)

3.2 文本识别

ABINet (CVPR’2021)
CRNN (TPAMI’2016)
MASTER (PR’2021)
NRTR (ICDAR’2019)
RobustScanner (ECCV’2020)
SAR (AAAI’2019)
SATRN (CVPR’2020 Workshop on Text and Documents in the Deep Learning Era)
SegOCR (Manuscript’2021)

3.3 关键信息提取

SDMG-R (ArXiv’2021)

3.4 命名实体识别

Bert-Softmax (NAACL’2019)

四、训练和测试

1、对单张图进行推理并可视化

python mmocr/utils/ocr.py demo/demo_text_ocr.jpg --print-result --imshow

2、训练

# 用 seg 方法来训练文本识别任务
python tools/train.py configs/textrecog/seg/seg_r31_1by16_fpnocr_toy_dataset.py --work-dir seg

# 训练 icdar2015，需要将数据集和 json 放到 data_root 下
python tools/train.py configs/textdet/dbnet/dbnet_r18_fpnc_1200e_icdar2015.py --work-dir dbnet

3、测试

# 测试 dbnet/latest.pth 的 hmean-iou 指标
python tools/test.py configs/textdet/dbnet/dbnet_r18_fpnc_1200e_icdar2015.py dbnet/latest.pth --eval hmean-iou

猜你喜欢

转载自blog.csdn.net/jiaoyangwm/article/details/128407786

【MMOCR】使用 MMOCR 训练自己的文本检测模型

MMOCR使用指南

使用pytorch训练自己的Faster-RCNN目标检测模型

使用SSD训练文本检测

使用tensorflow object detection API 训练自己的目标检测模型（一）labelImg的安装配置过程

使用tensorflow object detection API 训练自己的目标检测模型（二）

深度学习目标检测---使用yolov5训练自己的数据集模型（Windows系统）

使用OpenCvSharp的DNN模块加载自己训练的TensorFlow模型进行目标检测

【slowfast 训练自己的数据集】自定义动作，制作自己的数据集，使用预训练模型进行训练，并检测其结果

OpenCV3特征提取与目标检测之HOG（三）——使用HOG加SVM训练自己的行人检测模型

深度学习三、使用TensorFlow Object Detection API进行目标检测(使用VOC 2012数据集训练自己的模型)

使用darknet（windows GPU 版本） yolov3 训练自己的第一个检测模型

使用faster-rcnn训练自己的模型

使用object detection训练并识别自己的模型

使用Densenet模型训练自己的数据集

【TensorFlow】使用迁移学习训练自己的模型

nnUNet使用教程（使用自己的数据训练自己的模型）

paddleocr文本检测模型的训练

手把手教你使用YOLOV5训练自己的目标检测模型-口罩检测-视频教程

YOLOv5使用NCNN将模型部署到Android端教程（1）部署自己的训练模型到Android实现静态图片检测

对自己训练的目标检测网络使用TensorRT推理

Transformers预训练模型使用：文本摘要 Summarization

使用 Inception-v3 模型训练自己的图片分类

Matconvnet 训练自己的数据（使用现有模型）

TensorFlow使用object detection训练自己的模型用于物体识别

Caffe:使用lenet5模型训练自己的数据集

Windows下使用Faster RCNN训练自己的模型

PyTorch(三)——使用训练好的模型测试自己图片

[AI] 使用object detection训练自己的模型用于物体识别

ubuntu16.04 使用tensorflow object detection训练自己的模型

今日推荐

周排行

AIZU 2224 Save your cats(并查集)

HTTP响应头状态码详解

Python socket编程（2）

MaxCompute Studio使用心得系列7—作业对比

Supervisor安装使用

LeetCode 164. Maximum Gap

mysql面试题: 一张表里面有ID自增主键，当insert了17条记录之后，删除了第15,16,17条记录，再把mysql重启，再insert一条记录，这条记录的ID是18还是15

nutch1.2 DeleteDuplicates IndexMerger 详解

OC - @property与setter,getter方法

SpringBoot @Transactional的rollbackFor属性

每日归档

更多

2024-09-19(0)

2024-09-18(0)

2024-09-17(0)

2024-09-16(0)

2024-09-15(0)

2024-09-14(0)

2024-09-13(0)

2024-09-12(0)

2024-09-11(0)

2024-09-10(0)