来! 瞎掰掰orc

文字识别,一般都分开(检测+识别)

检测常用算法: CTPN

识别算法:RNN 或 seq2seq

                           

CTPN网络:

conv5 feature map:N \times C\times H\times W 变为N \times9C\times H\times W(提取每个点附近的9点临近点,然后每行都如此处理)

CNN转LSTM:

多个序列共同组成一个输出像素

猜你喜欢

转载自blog.csdn.net/weixin_38740463/article/details/89071979