python去除html所有标签的方法 - 代码天地

python去除html所有标签的方法

企业开发 2023-09-13 19:42:22 阅读次数: 0

import re
from bs4 import BeautifulSoup
from lxml import etree
     html = '''
    <div id="info">
    <span ><span class='pl'>导演</span>: <span class='attrs'><a>郭帆</a></span></span><br/>
    <span ><span class='pl'>编剧</span>: <span class='attrs'><a >郭帆</a></span></span><br/>
    <span class="pl">制片国家/地区:</span> 中国大陆<br/>
    <span class="pl">语言:</span> 汉语普通话 / 俄语 / 英语 / 印地语 / 法语<br/>
    <span class="pl">上映日期:</span> <span >2023-01-22(中国大陆)</span><br/>
    <span class="pl">片长:</span> <span>173分钟</span><br/>
    <span class="pl">又名:</span> The Wandering Earth Ⅱ / The Wandering Earth 2 / 《流浪地球》前传<br/>
    <span class="pl">IMDb:</span> tt13539646<br>
    </div>
    '''

    # 方法一
    pattern = re.compile(r'<[^>]+>', re.S)
    result = pattern.sub('', html)
    print(f"正则去除：{
      
      result}")

    # 方法二
    soup = BeautifulSoup(html, 'html.parser')
    print(f"BeautifulSoup去除：{
      
      soup.get_text()}")

    # 方法三
    response = etree.HTML(text=html)
    # print(dir(response))
    print(f"etree去除：{
      
      response.xpath('string(.)')}")

猜你喜欢

转载自blog.csdn.net/weixin_43824520/article/details/129349325

python去除html所有标签的方法

去除所有的 html标签

ASP去除所有html标签

Java利用正则去除所有HTML标签

去除html标签方法

python去除html标签

利用正则表达式去除所有html标签，只保留文字

php 去除所有空格和html标签（包括换行空格  ）正则

js中去除字符串中所有的html标签

php 字符串去除Html所有标签、空格以及空白

使用正则表达式去除所有html标签只保留文字

js去除字符串中所有html标签及&nbsp符号去空格符

php去除所有空格&nbsp、换行和html标签

正则表达式去除html标签的所有属性

python处理html去掉所有标签和tag

js 正则表达式去除html字符中所有的标签（img标签除外）

工具类：内容有大量的html标签，去除html标签

java正则表达式去除html中所有的标签和特殊HTML字符

java正则表达式去除html中所有的标签和特殊HTML字符（以&开头的）

C#去除HTML标签方法

字符串去除html标签的方法

python使用bs4模块去除html标签字符串方法

HTML的所有标签和作用

过滤到所有HTML 标签

HTML所有标签及其属性汇总

iOS 移除所有Html 标签的参考

文本去除html标签

去除html标签 php

去除html标签

jsoup去除HTML标签

今日推荐

周排行

成为C++高手之宏与枚举

在CAD二次开发中使用进度条

Js插件ECharts，HighCharts学习网址整理

Celery提交任务出错(on windows.)

cephfs内核客户端性能追踪

thinkphp中PHPExcel用法

EntityFramework动态组合多排序字段

汇编语言（八）实验9 根据材料编程

安装ubuntu后必须做的事情（对我而言）

JS函数式编程

每日归档

更多

2024-10-22(0)

2024-10-21(0)

2024-10-20(0)

2024-10-19(0)

2024-10-18(0)

2024-10-17(0)

2024-10-16(0)

2024-10-15(0)

2024-10-14(0)

2024-10-13(0)