Python的lxml.objectify怎么处理重复标签

lxml.objectify将重复标签自动转为列表,单个标签为单个对象,访问前需用isinstance或getattr检查存在性与类型,推荐统一转为列表处理以避免AttributeError。

python的lxml.objectify怎么处理重复标签

lxml.objectify 对重复标签的默认处理是把它们转成 Python 列表(list),而不是单个对象 —— 这是它和 etree 的关键区别之一,也是你“能直接用点号取值”的前提。

重复标签自动转为列表

比如 XML 中有多个同名子元素:

<root>
  <item>A</item>
  <item>B</item>
  <item>C</item>
</root>

用 objectify 解析后:
root = objectify.fromstring(xml)
root.item 就是一个包含 3 个 StringElementlist,你可以用索引访问:root.item[0]root.item[1] 等。

判断是否为重复标签(即是否是列表)

不能靠名字猜,得实际检查类型:

立即学习“Python免费学习笔记(深入)”;

YXPHP企业网站管理系统4.0 YXPHP企业网站管理系统4.0

支持静态模板,支持动态模板标签,支持图片.SWF.FLV系列广告标签.支持百万级海量数据,绑定内置URL伪装策略(URL后缀名随你怎么写),绑定内置系统升级策略(暂不开放升级),绑定内置模板付费升级策略(暂不开放更新)。支持标签容错处理,绑定内置攻击防御策略,绑定内置服务器优化策略(系统内存释放的干干净净)。支持离线运行,支持次目录,兼容U主机。支持会员功能,支持文章版块权限阅读,支持会员自主注册

YXPHP企业网站管理系统4.0 0 查看详情 YXPHP企业网站管理系统4.0
  • isinstance(root.item, list) 判断是不是多个
  • 如果只有一个 <item></item>root.item 是单个 StringElement(不是 list)
  • 所以安全写法是统一转成列表再处理:items = list(root.item) if isinstance(root.item, list) else [root.item]

避免 AttributeError:访问不存在的重复标签

如果 XML 里根本没有 <item></item>root.item 会触发 AttributeError(不像 etree.find() 返回 None)。

  • 推荐用 getattr(root, 'item', []) 安全获取,默认返回空列表
  • 再统一转成 list:items = list(getattr(root, 'item', []))
  • 这样无论 0 个、1 个还是多个,items 都是可遍历的 list

手动强制转为列表(统一处理习惯)

如果你希望所有字段都按“可能重复”来处理,可以封装一个辅助函数:

def aslist(obj, attr):
    val = getattr(obj, attr, [])
    return list(val) if isinstance(val, list) else [val] if val is not None else []
<h1>用法</h1><p>for item in aslist(root, 'item'):
print(item.text)

这样就不用每次手动判断类型,逻辑更清晰。

基本上就这些。核心就三点:objectify 自动聚合重复标签为 list;单个标签不包 list;访问前务必做存在性或类型检查 —— 不复杂但容易忽略。

以上就是Python的lxml.objectify怎么处理重复标签的详细内容,更多请关注其它相关文章!

本文转自网络,如有侵权请联系客服删除。