一、分析提取思路
1、简历模版类别,横版和竖版
横版
竖版
2、简历可以是图片,word文档,pdf文档,大致三种情况
3、先从上面的文件里提取全部文本内容
提取文本比较简单,但是要寻找提取率比较高的技术
4、文本内容大致划分模块
总体上简历都是按模块划分,比如工作经历,教育背景等
可先从整体内容划分成模块内容
5、模块内容整体划分
比如工作经历模块内容,含有时间,公司,项目,岗位等,可根据规律或者词性等来进行提取
目前研究的提取结果,准确率仍需提升
提取文本比较简单,但是要寻找提取率比较高的技术
总体上简历都是按模块划分,比如工作经历,教育背景等
可先从整体内容划分成模块内容
比如工作经历模块内容,含有时间,公司,项目,岗位等,可根据规律或者词性等来进行提取
目前研究的提取结果,准确率仍需提升