python爬虫怎么可以只取div中的值不取后面的标签

其他 2020-02-17 14:40:31 阅读次数: 0

问题：通过python爬虫，结果如图：

想要去掉红圈里的，只保留日期。

代码：

 pattern = re.compile('在线出版日期.*?<div class="info_right author">(.*?)</div>', re.S)
    online_date = pattern.findall(html)
    if online_date:
        online_date = online_date[0].strip()

网页：

解决方法：用xpath中的text（）方法：

lx=etree.HTML(html)
online_date = lx.xpath('//ul[@class="info"]/li/div[@class="info_right author"]')[-2].text

LIuxin.....

发布了233 篇原创文章 · 获赞 20 · 访问量 3万+

私信关注

猜你喜欢

转载自blog.csdn.net/weixin_42565135/article/details/104271920

python爬虫怎么可以只取div中的值不取后面的标签

根据div的id,取div标签里面的value

在controller中通过ModelAndView返回到页面的值，在jsp页面怎么取不到值呢？

爬虫一:爬取基本静态界面的标签内容_

Oracle只取日期不取时间

爬虫爬取一个div下多个标签

爬虫5：如何取Table中的值

白条取现怎么取不了呀

js jQuery 取标签值

静态页面取地址？后面的参数值

python 取随机值

python爬虫爬取异步加载网页信息（python抓取网页中无法通过网页标签属性抓取的内容）

Python爬取网址中多个页面的信息

php取xml文件里面的值

Action取不到页面的值

Python 爬虫爬取网页

python爬虫－爬取图片

python 爬虫爬取csdn

python爬虫爬取图片

Python爬虫：爬取图片

python爬虫（爬取视频）

python爬虫（爬取段子）

python爬虫爬取视频

python爬虫 - 爬取图片

Python爬虫——爬取小说

python爬虫登录爬取

【python爬虫】—图片爬取

python爬虫如何实现对大文件的爬取，以及在爬取过程中对暂停爬取，继续爬取，取消爬取等系列功能的实现！

MySQL之表中重复字段只取第一个值

SQLserver中获取时间类型字段的值，只取年月日

今日推荐

周排行

8种防盗链的方法

php的序列化和反序列化

Java 8：CompletableFuture

Android版本差异适配方案(5.0-9.0)

makedownpad使用

Spring Boot 使用AOP切面实现后台日志管理模块

实战SSM_O2O商铺_44【DES加密】关键配置信息进行DES加密

ACM排行榜说明

【转】SQL重复记录查询

板球和秃子威力那个大

每日归档

2024-09-15(0)

2024-09-14(0)

2024-09-13(0)

2024-09-12(0)

2024-09-11(0)

2024-09-10(0)

2024-09-09(0)

2024-09-08(0)

2024-09-07(0)

2024-09-06(0)