Python 读取比较大的 XML 文件

我用 minidom 写了个读取 XML 的函数,读取一个几KB的小文件没问题;
当读取一个近 10M 的文件时(两个文件内容格式一样)报错:

File "C:Python27libxmlsaxhandler.py", line 38, in fatalError
raise exception
xml.sax._exceptions.SAXParseException: <unknown>:762:4: mismatched tag

目测是因为文件太大的缘故。
问:
1. 是因为文件太大吗?该如何解决?
2. 有没有读取大 XML 文件(>10M)的方案?(限 Python 语言)

有教程教你如何使用 Python 的 lxml 库处理上 G 的 XML 文件。

发表评论

电子邮件地址不会被公开。 必填项已用*标注