爬虫入门-4 - 代码天地

爬虫入门-4

其他 2020-10-14 16:37:18 阅读次数: 0

爬取腾讯新闻

这是本次活动的最后一个任务，完结撒花

import time
from  selenium import webdriver
from bs4 import BeautifulSoup

driver=webdriver.Chrome(executable_path="F:/NewDesktop/spider/task3/chromedriver.exe")
driver.get("https://news.qq.com")
#了解ajax加载
for i in range(1,100):
    time.sleep(2)
    driver.execute_script("window.scrollTo(window.scrollX, %d);"%(i*200))

html=driver.page_source
bsObj=BeautifulSoup(html,"lxml")

jxtits=bsObj.find_all("div",{
    
    "class":"jx-tit"})[0].find_next_sibling().find_all("li")

print("index",",","title",",","url")

for i,jxtit in enumerate(jxtits):    
    try:
        text=jxtit.find_all("img")[0]["alt"]
    except:
        text=jxtit.find_all("div",{
    
    "class":"lazyload-placeholder"})[0].text
    try:
        url=jxtit.find_all("a")[0]["href"]
    except:
        print(jxtit)
    print(i+1,",",text,",",url)

在这里插入图片描述

猜你喜欢

转载自blog.csdn.net/DZZ18803835618/article/details/105800964

【爬虫入门4】BeautifulSoup

爬虫入门-4

爬虫入门-4

bs4爬虫入门

python爬虫入门（4）----- selenium

Python爬虫入门——4 淘宝秒杀

爬虫入门—BeautifulSoup4的使用

入门Python爬虫Day4

requests和bs4的python爬虫入门

Python爬虫从入门到进阶(4)之xpath的使用

爬虫入门-4-2.爬取豆瓣读书图片

Day 4【Datawhale】爬虫入门学习——学习BeautifulSoup

爬虫4

爬虫（一）爬虫入门

爬虫入门

入门爬虫

如何入门爬虫而系统学习？python爬虫实战基础学习(使用BeautifulSoup4等)

Python 网络爬虫从0到1 （4）：Beautiful Soup 4库入门详解

爬虫入门：urllib爬虫实例

小白学爬虫——爬虫入门

python爬虫-入门-了解爬虫

爬虫快速入门——爬虫工具

爬虫快速入门——爬虫介绍

Python网络爬虫与信息提取（三）bs4入门

Python爬虫入门 | 4 爬取豆瓣TOP250图书信息

手把手教你写网络爬虫（4）：Scrapy入门

爬虫入门之爬取策略 XPath与bs4实现(五)

Python爬虫（入门+进阶）学习笔记 2-4 Scrapy的项目管道

Python爬虫（入门+进阶）学习笔记 1-4 使用Xpath解析豆瓣短评

Python学习笔记--Python 爬虫入门 -17-4 SSL (12306 的故事)

今日推荐

AI小程序有哪些？AI小程序哪个好用？微信小程序AI写作叫什么？免费的ai小程序推荐 ai写作小程序推荐

灵办AI工具(科研学术,代码编程,学习辅导,图书报告)功能介绍

Linux内核源码分析（非常详细）零基础入门到精通，收藏这一篇就够了

【C++篇】启航——初识C++（上篇）

数据飞轮崛起：数据中台真的过时了吗？

828华为云征文——使用Flexus云服务器X实例CentOS镜像下创建MySQL服务器教程

阿里巴巴出品的6款AI神器，你用过几个？

【机器学习】多模态AI——融合多种数据源的智能系统

HashiCorp 创始人向 Zig 软件基金会捐赠 30 万美元

1-8 月我国软件业务收入 85492 亿元，同比增长 11.2%

零基础入门鸿蒙开发 HarmonyOS NEXT星河版开发学习

豆包MarsCode帮我2小时完成Go语言系统从开发、测试到部署全流程最佳实践，云IDE迁移PHP企业级项目最佳实践

周排行

Ubuntu+apache2+php5+mysql+phpmyadmin的php环境搭建

基于YOLOv3+Kalman-Filter实现Multi-target tracking

解释C++实例化类的指针类型中的new

苹果手机页面不兼容问题——mui

Python基础语法

javascript学习笔记一【预解释】

python内置函数 map

【Git】使用webstorm操作git

this与super关键字（一）

python list 使用技巧

每日归档

更多

2024-10-04(63)

2024-10-03(2)

2024-10-02(60)

2024-10-01(0)

2024-09-30(0)

2024-09-29(0)

2024-09-28(4)

2024-09-27(60)

2024-09-26(0)

2024-09-25(0)