python3 学习2（分页翻看百度搜索结果） - 代码天地

python3 学习2（分页翻看百度搜索结果）

其他 2018-11-03 09:25:04 阅读次数: 0

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/zhaofuqiangmycomm/article/details/83017269

# -*- coding: utf-8 -*-
from selenium import webdriver
import time
if __name__ == "__main__":
driver = webdriver.Chrome()
driver.maximize_window()
driver.get('http://www.baidu.com')

#通过ID找网页的标签，找到搜索框的标签
seek_input = driver.find_element_by_id("kw")
#设置搜索的内容
seek_input.send_keys("2018财税新政策")
#找到搜索文档按钮
seek_but = driver.find_element_by_id("su")
#并点击搜索按钮
seek_but.click()
#并点击搜索按钮

js = 'document.documentElement.scrollTop=10000'#拖动滚动条到底部
time.sleep(1)
driver.execute_script(js)
time.sleep(1)
total = 0 #页面数
is_next_page = True #存在下一页
page_num = 1 #要点击的页面号
#往后翻页
while is_next_page:
try:
total=total+1
if total == 1 :
result = driver.find_element_by_xpath("//a[@class='n']")
text=result.get_attribute('text')
if text.find('下一页')>=0 :
result.click()
time.sleep(2)
driver.execute_script(js)
#print('第'+total+'页')
else :
#result = driver.find_element_by_xpath("//a[@class='n']")
result = driver.find_element_by_link_text("下一页>")
result.click()
time.sleep(2)
driver.execute_script(js)
print(result)
#for each_result in result:
# text=each_result.get_attribute('text')
# if text.find('下一页')>=0 :
# each_result.click()
# time.sleep(2)
# driver.execute_script(js)
#print('第'+total+'页')


except:
print("到最后一页了")
break
#思路很简单，不断获取下一页标签，触发点击事件，不断翻页，我测的是翻到70页，文章仅作小白学习笔记，想要获取每 #页的链接地址下载内容可以参考我的上一篇博文

猜你喜欢

转载自blog.csdn.net/zhaofuqiangmycomm/article/details/83017269

python3 学习2（分页翻看百度搜索结果）

Python3网络爬虫--爬取百度搜索结果（附源码）

Python3实现批量下载百度搜索图片

python3 关于函数封装简单介绍，以百度搜索为例子

python 模拟百度搜索

Python爬虫百度搜索

Python+selenium+PhantomJS获取百度搜索结果真实链接地址

Python净化百度搜索结果！真正的做到无广告环境！

python采集百度搜索结果带有特定URL的链接

python用selenium爬取百度搜索结果

python爬虫学习京东页面、亚马逊访问|、百度搜索、网上爬取图片 DAY2

python3 selenium自动化测试，函数的二次封装，以百度搜索为例子

python3 selenium自动化 unittest单元测试百度搜索例子详解

python3百度设置高级搜索例子

Python学习笔记16：爬取百度搜索图片的缩略图

python百度搜索url爬取图片

python 抓取百度搜索名称和路径

Python Selenium模拟百度搜索点击

python爬取百度搜索内容链接

百度搜索引擎结果网址参数键盘重复速度(rsv_sug3)

【学习笔记】python3 爬虫-百度图片

手把手教你用Python爬取百度搜索结果并保存

学习python3

python3 学习

Python3学习

python3 selenium 自动化面向对象函数的二次封装，以百度搜索为例子

python3学习(3)

Python自动化：模拟人类在百度搜索页输入关键词进行搜索并打开搜索结果

python3 爬取百度图片

使用python3爬取百度图片

今日推荐

周排行

LRU cache算法

windows10, 自带的OpenSSH, key权限问题, 文件权限问题

测试用例书写方法

HIVE-默认分隔符的（linux系统的特殊字符）查看，输入和修改

最贵的AMD 7nm显卡来了！这设计够狂野

java多线程简单demo

[ 转载 ]在Android系统上使用busybox——最简单的方法

QT connect学习

BFSIFT算法分析

Xcode10：library not found for -lstdc++.6.0.9 临时解决

每日归档

更多

2024-08-06(0)

2024-08-05(0)

2024-08-04(0)

2024-08-03(0)

2024-08-02(0)

2024-08-01(0)

2024-07-31(0)

2024-07-30(0)

2024-07-29(0)

2024-07-28(0)