外观
节点测试
节点测试的对象通常包括特定节点名或者一般的表达式。
- comment():寻找HTML注释节点。
from lxml import etree
html = """
<p>这是没有注释的内容</p>
<!--这是被注释的内容-->
"""
xp = etree.HTML(html)
print(xp.xpath('//comment()'))[<!--这是被注释的内容-->]- text():寻找某点的文字型别,例如在
<p>Hello</p>节点中寻找Hello。
from lxml import etree
html = """
<p>这是没有注释的内容</p>
<!--这是被注释的内容-->
"""
xp = etree.HTML(html)
print(xp.xpath('//p/text()'))['这是没有注释的内容']- node():寻找所有节点。
from lxml import etree
html = """
<div><p id='content'>这是没有注释的内容</p>
<!--这是被注释的内容--></div>
"""
xp = etree.HTML(html)
print(xp.xpath('//div/node()'))[<Element p at 0x2691d7d6300>, '\n', <!--这是被注释的内容-->]