【Python】Selenium爬虫提取属性值(href为例)

提取属性值

之前使用爬虫解析HTML一直使用的是bs4里面的BeautifulSoup,最近因为模拟登陆要使用Selenium,所以就直接使用Selenium解析HTML。解析HTML很重要的一步就是提取标签元素的属性。
这里展示一下使用提取hrtf的值:

div = driver.find_element_by_css_selector('#CSS_Selector')
href = div.get_attribute('href')

这样使用get_attribute()方法就可以提取元素的属性值了。

另外如果习惯使用BeautifulSoup方法,也可以,只需要使用

soup = BeautifulSoup(driver.page_source)

将其转成BeautifulSoup解析HTML即可。

我们下次再见,如果还有下次的话!!!
欢迎关注微信公众号:516数据工作室
516数据工作室

猜你喜欢

转载自blog.csdn.net/Asher117/article/details/84229868
今日推荐