提取属性值
之前使用爬虫解析HTML一直使用的是bs4里面的BeautifulSoup,最近因为模拟登陆要使用Selenium,所以就直接使用Selenium解析HTML。解析HTML很重要的一步就是提取标签元素的属性。
这里展示一下使用提取hrtf的值:
div = driver.find_element_by_css_selector('#CSS_Selector')
href = div.get_attribute('href')
这样使用get_attribute()方法就可以提取元素的属性值了。
另外如果习惯使用BeautifulSoup方法,也可以,只需要使用
soup = BeautifulSoup(driver.page_source)
将其转成BeautifulSoup解析HTML即可。
我们下次再见,如果还有下次的话!!!
欢迎关注微信公众号:516数据工作室