在平时的工作学习中,时常要翻看许多PDF文件,复制资料时都会遇到各种坎坷:从PDF复制过来的文字到Word中变成了乱码;所以我们就想到了需要把PDF文档进行转换,那么,如何进行转换呢?是不是所有的PDF文档都适合转换?
所以这篇文章就与大家一起来解决这问题,希望对小伙伴们有帮助。
问题:
PDF文档转换后乱码,究竟是什么原因造成的?
答:在转换过程中,时常会遇到转换出来一堆的乱码,其实原因很简单,要不就是转换软件的原因,要不就是文档的原因。有个办法可以验证原因,那就是把PDF文档的文字复制出来,粘贴试试会不会乱码。如果不是乱码,那么就是软件的原因,果断换软件。如果是乱码,那就是PDF文档在生成过程中丢失了文字的编码导致的。那这种文档该怎么处理呢?
办法一:
可以用带有ocr识别的软件进行识别转换 或者 选择人工转换服务:
例如:ABBYY软件:
这种处理起来比较复杂,因为这种不是纯图片格式的,带有损坏的文字编码会导致转换出来的文档效果不理想。这种情可以考虑人工转换处理。福昕PDF365人工转换就可以处理,效果还是不错的。
办法二:
放弃转换,直接编辑PDF文档
放弃转换,直接编辑PDF文档。这种文档虽然转换出来乱码,但是在PDF文档里面是可以正常显示的(PDF文档的兼容性较高),所以这种文档最容易的处理方式就是直接在PDF文档里面编辑。
对于PDF的编辑,可以用福昕PDF编辑(个人版)试试。