从css和html中分析出图片路径 - 代码天地

从css和html中分析出图片路径

其他 2021-02-01 04:44:14 阅读次数: 0

文本分析图片

假设是分析出html中的图片路径，使用爬虫技术beautifulsoup4之后的获取img标签即可。但是从css中获取即没有标签可言。所以使用原始的文本解析+正则表达式。

正则：

html

(?<=\(|\'|\")[^\(\)|\'|\"]+?(\.jpg|\.png|\.jpeg|\.gif|\.ico)[^\(\)|\'|\"]*?(?=\)|\'|\"|\\)

css:

(?<=\(|\'|\")[^\(\)|\'|\"]+?(\.jpg|\.png|\.jpeg|\.gif|\.ico)[^\(\)|\'|\"]*?(?=\)|\'|\")

编写程序时候把以上正则复制放入字符串中时，会把反斜杠也转义了例如：\(。会变成\\(。也是正确的

其中图片后缀可自行增加比如主要加.bmp后缀的只要在(\.jpg|\.png|\.jpeg|\.gif|\.ico)加上即可添加规则为: |\.bmp。结果显示为：(\.jpg|\.png|\.jpeg|\.gif|\.ico|.bmp)

这个正则匹配了大部分的情况，不过目前还是有一些漏洞。如果大家使用遇到匹配了非图片路径，或者有些图片路径不能匹配，请私信我大家学习学习。

如果大家对解析出来的图片路径不理解比如以//开头、以/开头，或者../或者./等知识的可以看我另一篇文章，里面有详细说明。

这里附上一个测试正则表达式的网站需要的可以进去里面测试。正则测试链接

猜你喜欢

转载自blog.csdn.net/weixin_43118891/article/details/87909531

从css和html中分析出图片路径

Bugku-CTF分析篇-日志审计（请从流量当中分析出flag）

从6730个微信用户中分析出大家的手机使用习惯

html和css文件路径问题

css和js引用图片的路径问题

图片与文本基础（html和css）

html/css图片和网址兼容

gulp 压缩打包css、html和图片

html css 图片位置

html/css 添加图片

HTML基本标签和图片音频链接和css

html分组匹配css文件和img图片和js的：

获取文件路径在web和winform中分别怎么获取

HTML+CSS：圆形和圆角图片格式

（jq）和（html+css）实现图片展开

使用HTML和CSS将文字环绕在图片上

网站页面导入css,图片等文件的相对路径和绝对路径问题

css中插入图片时的相对路径和绝对路径

从java、windows、linux中分析\r和\n

TCPflow：在Linux中分析和调试网络流量的利器

HTML直接插入图片和css使用背景图片区别

html css類和css（）

html图片和html实体

常用的css和html

HTML基础和css

html和css区别

html和css总结

HTML和CSS概述

HTML 和CSS进阶

HTML 和 CSS 简述

今日推荐

周排行

成为C++高手之宏与枚举

在CAD二次开发中使用进度条

Js插件ECharts，HighCharts学习网址整理

Celery提交任务出错(on windows.)

cephfs内核客户端性能追踪

thinkphp中PHPExcel用法

EntityFramework动态组合多排序字段

汇编语言（八）实验9 根据材料编程

安装ubuntu后必须做的事情（对我而言）

JS函数式编程

每日归档

更多

2024-10-22(0)

2024-10-21(0)

2024-10-20(0)

2024-10-19(0)

2024-10-18(0)

2024-10-17(0)

2024-10-16(0)

2024-10-15(0)

2024-10-14(0)

2024-10-13(0)