Python解析某页面获取日期+时间

其他 2020-07-23 10:24:26 阅读次数: 0

文章目录

问题描述
解决方案
参考文献

问题描述

对某个页面中的日期+时间进行解析
在这里插入图片描述

解决方案

requests爬取+正则表达式解析

import re
import requests


def match_datetime(text):
    '''正则表达式提取文本所有日期+时间

    :param text: 待检索文本

    >>> match_datetime('日期是2020-05-20 13:14:15.477062.')
    ['2020-05-20 13:14:15']
    '''
    pattern = r'(\d{4}-\d{1,2}-\d{1,2}\s\d{1,2}:\d{1,2}:\d{1,2})'
    pattern = re.compile(pattern)
    result = pattern.findall(text)
    return result


def extract_datetime(url, headers=None):
    '''提取某页面中的日期+时间

    :param url: 页面地址
    :param headers: 请求头
    :return:
    >>> extract_datetime('https://xercis.blog.csdn.net/article/details/104752851')
    ['2020-03-20 15:55:17', '2020-03-20 15:55:17', '2020-03-20 15:55:17']
    '''
    r = requests.get(url, headers=headers)
    html = r.text
    return match_datetime(html)


if __name__ == '__main__':
    url = 'https://xercis.blog.csdn.net/article/details/104752851'
    headers = {
        'cookie': '',  # 若失败则填上
        'user-agent': 'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/78.0.3904.108 Safari/537.36'
    }
    print(extract_datetime(url))
    print(extract_datetime(url, headers))

参考文献

猜你喜欢

转载自blog.csdn.net/lly1122334/article/details/107400581

Python解析某页面获取日期+时间

python 日期时间的获取

java获取某段时间内的所有日期

解析android中系统日期时间的获取

java根据日期获取周几和获取某段时间内周几的日期

Python获取并输出当前日期时间

python:如何获取当前的日期和时间

python获取当前的日期和时间

python获取当前时间戳和日期

python获取当前日期时间

Python 获取并输出当前日期、时间

python3 获取日期时间

python 获取日期以及时间

python获取时间日期列表集合

Python获取并输出当前日期时间 Python获取并输出当前日期时间

PHP 日期时间获取服务器当前时间、日期全解析

JAVA 获取某段时间内的所有日期集合

运用Python解析HTML页面获取资料

android日期时间获取

获取日期、时间

js获取日期时间

获取各国的日期时间

获取系统日期与时间

获取时间戳或日期

boost 获取日期时间

linux获取日期时间

获取时间和日期

【JS时间操作】 js获取n天之后的日期、n月之后的日期、某月最后一天的日期、某周周一和周日的日期

时间戳获取日期时间

mysql统计某段日期中某段时间的数据

今日推荐

周排行

Access的四舍五入取整

8.23 前端学习过程

入门学习过程方向与漏洞复现总结：

操作分布式文件之八：如何批量并行读写远程文件和事务补偿处理

应邀出个教程（搭建tensorflow跑网络环境）

Kubernetes之Pod控制器应用进阶

14-[mysql内置功能]--

HDU6212 区间dp 好题

VS2015生成代码图

验证手机号的工具类

每日归档

更多

2024-10-21(0)

2024-10-20(0)

2024-10-19(0)

2024-10-18(0)

2024-10-17(0)

2024-10-16(0)

2024-10-15(0)

2024-10-14(0)

2024-10-13(0)

2024-10-12(0)