如何使用xml.etree.ElementTree在蟒蛇一个标签的成交后提取嵌套的XML文本(How

2019-11-02 03:42发布

我想提取XML文档中的所有文本,和我有以下情况的问题:

...
<a>
hello
<B>
there
</B>
How was your day.

.....
</a>

在这个片段中,我可以得到文本“Hello”和“有”,因为我可以使用下面的标签让他们:

a.text
b.text

但我不知道如何访问“你的一天”。 部分。

Answer 1:

您正在寻找.tail属性的元素:

>>> from xml.etree import ElementTree
>>> example = ElementTree.fromstring('''\
... <a>
... hello
... <B>
... there
... </B>
... How was your day.
... </a>
... '''
... )
>>> example
<Element 'a' at 0x10715d150>
>>> example.text
'\nhello\n'
>>> example.find('B')
<Element 'B' at 0x10715d7d0>
>>> example.find('B').text
'\nthere\n'
>>> example.find('B').tail
'\nHow was your day.\n'


文章来源: How to extract text in nested xml after closing of one tag in python using xml.etree.ElementTree