近期使用python的scrapy进行爬虫练习时,使用chrome自带的xpath复制到代码中,匹配的时候总是出现结果为空,查后发现是在html结果中自加tbody 标签。
例如:
#复制出来的xpath
xpath('//*[@id="position"]/div[1]/table/tbody/tr[1]')
#正确的xpth,把tbody去掉,搞定
xpath('//*[@id="position"]/div[1]/table/tr[1]')
近期使用python的scrapy进行爬虫练习时,使用chrome自带的xpath复制到代码中,匹配的时候总是出现结果为空,查后发现是在html结果中自加tbody 标签。
例如:
#复制出来的xpath
xpath('//*[@id="position"]/div[1]/table/tbody/tr[1]')
#正确的xpth,把tbody去掉,搞定
xpath('//*[@id="position"]/div[1]/table/tr[1]')