节点测试

节点测试的对象通常包括特定节点名或者一般的表达式。

comment()：寻找HTML注释节点。

from lxml import etree

html = """
<p>这是没有注释的内容</p>
<!--这是被注释的内容-->
"""

xp = etree.HTML(html)
print(xp.xpath('//comment()'))

[<!--这是被注释的内容-->]

text()：寻找某点的文字型别，例如在<p>Hello</p>节点中寻找Hello。

from lxml import etree

html = """
<p>这是没有注释的内容</p>
<!--这是被注释的内容-->
"""

xp = etree.HTML(html)
print(xp.xpath('//p/text()'))

['这是没有注释的内容']

node()：寻找所有节点。

from lxml import etree

html = """
<div><p id='content'>这是没有注释的内容</p>
<!--这是被注释的内容--></div>
"""

xp = etree.HTML(html)
print(xp.xpath('//div/node()'))

[<Element p at 0x2691d7d6300>, '\n', <!--这是被注释的内容-->]

版权所有

许可证：署名 4.0 国际 (CC-BY-4.0)