在p之外的另一个p内获取文本

我在div中有这样的价值:

<p>
Example text I would like to scrap
<p>Example text I do not want to scrap</p>
</p>

如何仅返回“我要剪贴的示例文本”?

评论
oalias
oalias

您可以将re模块用于正则表达式, 以防您的剪贴文本包含特定模式。 这是一个非常简单的模式示例,仅包含纯文本:

import re

pattern = re.compile(r"Example text I no not want to scrap")

html_elements = """<p>
Example text I would like to scrap
<p>Example text I do not want to scrap</p>
</p>
"""
print(re.sub(pattern, "", html_elements))
点赞
评论