针对懒加载如何实现selenium 滑动至页面底部page_source一次性包含全部网页内容 - 代码天地

针对懒加载如何实现selenium 滑动至页面底部page_source一次性包含全部网页内容

其他 2018-09-03 14:45:28 阅读次数: 0

有时网站使用了懒加载技术：只有在浏览器中纵向滚动条滚动到指定的位置时，页面的元素才会被动态加载。注意，在加载之前，selenium的page_source是不会包含该页面的内容,page_source只包含加载出来的页面内容。那么如何实现加载全部内容了,就需要模拟人滚动滚动条的行为,实现页面的加载

from selenium.webdriver.chrome.options import Options
from selenium import webdriver
from selenium.common.exceptions import TimeoutException
from selenium.webdriver.support.wait import WebDriverWait
from selenium.webdriver.common.by import By
from selenium.webdriver.support import expected_conditions as EC

    def scroll_until_loaded(self):
        check_height = self.browser.execute_script("return document.body.scrollHeight;")
        while True:
            self.browser.execute_script("window.scrollTo(0, document.body.scrollHeight);")
            try:
                self.wait.until(lambda driver: self.browser.execute_script("return document.body.scrollHeight;") > check_height)
                check_height = self.browser.execute_script("return document.body.scrollHeight;")
            except TimeoutException:
                break

这里懒加载并不是一直有效,当网速不好时,加载超过self.wait()时间,页面还没加载出来时,会认为全部加载完成, page_source里面的代码就会是以前加载出来的,所以执行翻页操作后,要执行time.sleep(3),等待网页加载,更新html再获取网页源代码

猜你喜欢

转载自blog.csdn.net/supramolecular/article/details/82143984

针对懒加载如何实现selenium 滑动至页面底部page_source一次性包含全部网页内容

EXCEL如何批量一次性修改内容

记一次懒加载实现

函数解决页面懒加载问题（即selenium拖动滚动条到懒加载网页的最底部）

如何将目录下的脚本一次性全部执行

爬虫实战---Selenium爬取懒加载页面

排序不能一次性加载带内存处理的大文内容

Selenium2+python自动化37-爬页面源码（page_source）

优化之页面一次性加载数据过多

原生js实现网页图片懒加载

Word中如何一次性把相同的内容标注颜色

学习 | canvas实现图片懒加载 && 下滑底部加载

vue开发时，后端一次性返还过多数据时，利用slice方法对数据进行懒加载，使table滚动条滚动到底部时加载数据。

JS简单实现滚动自动加载新内容（懒加载）

如何一次性获取多个动态权限

如何一次性add library to classpath

如何一次性修改好element样式？

如何一次性解压多个文件

如何批量下载网站中的超链接（一次性下载网页中所有可能的PDF文件）

实现一次性验证码的校验

一次性登陆密码的实现

如何实现图片懒加载

如何实现图片懒加载？

懒加载的实现原理及一些实现方法

图片懒加载是怎么实现的?如何实现图片懒加载?

原生JS实现移动端判断滑动到底部还是顶部并实现懒加载功能

页面性能优化-原生JS实现图片懒加载

页面性能优化之原生JS实现图片懒加载

如何设置页面加载超时时间，robotframework+selenium实现

16种数据分解方法任意挑选，MATLAB代码，实现数据分解自由，一次性全部带走，速看！...

今日推荐

【学术精选】遥感领域高水平期刊：J-STARS 期刊介绍

探索二次元新境界：Han1meViewer——您的专属动漫神器

Java毕业设计：基于Java福建省地方特产销售商城系统毕业设计源代码作品和开题报告

【机器学习】自动驾驶——智能交通与无人驾驶技术的未来

智谱清影的魅力：使用CogVideoX-2b生成6秒视频的真实体验！

苹果可能将于 2025 年推出首款智能显示器和配套操作系统 homeOS

源码解析：从零解读SAM(Segment Anything Model)大模型！

《王者荣耀》鸿蒙原生版开启限量删档测试

fl studio v20.8中文破解版(附Crack文件+图文安装教程)

AI驱动TDSQL-C Serverless 数据库技术实战营-电商可视分析

828华为云征文 | 将Vue项目部署到Flexus云服务器X实例并实现公网访问

Java毕业设计：Java江西南昌城市文化展示网站系统毕业设计源代码作品和开题报告

周排行

单向链表的运用---一元多项式的加减详解

WEEK13 GITHUB

C语言左移和右移

四个概念详细分析servlet、filter、listener、interceptor的区别与联系

C语言如何使用print语句 %d%c%s

11.代码测试、维护

LAMMPS安装-给新手的建议

Android在页面上写字,居中写文字

OracleSID在本机上已经存在,请指定一个不同的SID的解决办法

开复老师的回信

每日归档

更多

2024-10-07(64)

2024-10-06(2)

2024-10-05(62)

2024-10-04(63)

2024-10-03(2)

2024-10-02(60)

2024-10-01(0)

2024-09-30(0)

2024-09-29(0)

2024-09-28(4)