爬虫出现空列表或者长度为0是怎么回事？ - 代码天地

爬虫出现空列表或者长度为0是怎么回事？

其他 2018-08-06 05:16:21 阅读次数: 0

今天来总结一下在爬虫遇到的特殊情况，利用正则或者xpath来匹配提取数据，偶尔会发现可以找到这个对象，却无法提取它的下一阶层的数据，这是怎么一回事？

自己分析结果有以下几种：

（1）自己的匹配写错了，怎么可能，我再三检查，对的不能再对了，排除这种情况，毕竟是本宝宝写的，谁还没有点小自信了。

（2）可能是User-Agent浏览器版本不兼容，遇到这种情况要注意了，先检查一下自己爬取的数据，看看是不是被注释了，这是一种简单反爬技术，哼，这能难倒我？天真！解决办法：1去掉User-Agent2更换IE的User-Agent，可惜我还是没能解决，那么就只能是第三种情况了

第二种情况如下：

<!--要爬取的内容-->

（3）百度个小婊砸，居然把我想要爬取的数据的div隐藏了：

在浏览器检查元素，可以清楚的看到自己想要爬取的数据，就在那就在那，看的见摸不着，再看看自己爬下来的数据，居然变成空的了，哼，今天本宝宝铁了心也要爬下来，我直接复制网页源代码还不行吗？

万万想不到啊，道高一尺魔高一丈，跟百度斗，果然我还是嫩啊，网页源代码下载下来居然还是空的，我的心情真是草泥马了，没办法，滋滋滋，再强大的网站也抵挡不了一下誓死要爬取的心，解决如下：

哎，主要自己太菜了，只能将要爬取的内容复制下来，然后提取，这真是一次失败的爬虫经历！呜呜呜

猜你喜欢

转载自blog.csdn.net/lzz781699880/article/details/81133398

爬虫出现空列表或者长度为0是怎么回事？

cmake:CMAKE_SYSTEM_PROCESSOR为空是怎么回事儿?

https证书出现错误是怎么回事

CRNN训练accurary一直为0是怎么回事

怎么回事

锁是怎么回事?

指针是怎么回事

引力是怎么回事？

HttpOnly是怎么回事？

怎么回事？

java爬虫初试（1）【了解抓取页面是怎么回事】

反爬虫，到底是怎么回事儿？

null 空 || 长度为0

win10系统下载应用出现0x80D02017错误怎么回事

jupyter notebook运行时出现 In[ * ]怎么回事

便秘疾病是怎么回事？

%matplotlib inline是怎么回事

Spark的Shuffle是怎么回事

csdn的排名怎么回事？

比特币是怎么回事？

集合里面是空值，但是获取集合的size大小是1，怎么回事呢？

使用windows10系统过程中出现错误代码0xC00D3E8E怎么回事

Process terminated with status -1073741510 (0 分, 0 秒)变红了是怎么回事？？

电脑蓝屏显示恢复怎么办,电脑蓝屏后出现恢复界面怎么回事

死锁怎么回事，怎么避免

xp系统下word文档中输入数字时出现乱码是怎么回事

串口服务器出现数据乱码怎么回事？

复制地址时出现LRE标识符是怎么回事？

复制地址时出现LRE标识符是怎么回事？

聊一聊 JS 输出为 [object object] 是怎么回事？

今日推荐

周排行

LRU cache算法

windows10, 自带的OpenSSH, key权限问题, 文件权限问题

测试用例书写方法

HIVE-默认分隔符的（linux系统的特殊字符）查看，输入和修改

最贵的AMD 7nm显卡来了！这设计够狂野

java多线程简单demo

[ 转载 ]在Android系统上使用busybox——最简单的方法

QT connect学习

BFSIFT算法分析

Xcode10：library not found for -lstdc++.6.0.9 临时解决

每日归档

更多

2024-08-06(0)

2024-08-05(0)

2024-08-04(0)

2024-08-03(0)

2024-08-02(0)

2024-08-01(0)

2024-07-31(0)

2024-07-30(0)

2024-07-29(0)

2024-07-28(0)